RU2523035C2 - Audio encoder and bandwidth extension decoder - Google Patents

Audio encoder and bandwidth extension decoder Download PDF

Info

Publication number
RU2523035C2
RU2523035C2 RU2011126331/08A RU2011126331A RU2523035C2 RU 2523035 C2 RU2523035 C2 RU 2523035C2 RU 2011126331/08 A RU2011126331/08 A RU 2011126331/08A RU 2011126331 A RU2011126331 A RU 2011126331A RU 2523035 C2 RU2523035 C2 RU 2523035C2
Authority
RU
Russia
Prior art keywords
signal
frequency band
audio signal
input audio
high frequency
Prior art date
Application number
RU2011126331/08A
Other languages
Russian (ru)
Other versions
RU2011126331A (en
Inventor
Фредерик НАГЕЛ
Саша ДИШ
Гильом ФУХС
Юрген ХЕРРЕ
Кристиан ГРИЕБЕЛ
Original Assignee
Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. filed Critical Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф.
Priority claimed from PCT/EP2009/066980 external-priority patent/WO2010069885A1/en
Publication of RU2011126331A publication Critical patent/RU2011126331A/en
Application granted granted Critical
Publication of RU2523035C2 publication Critical patent/RU2523035C2/en

Links

Images

Classifications

    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41FPRINTING MACHINES OR PRESSES
    • B41F33/00Indicating, counting, warning, control or safety devices
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B41PRINTING; LINING MACHINES; TYPEWRITERS; STAMPS
    • B41FPRINTING MACHINES OR PRESSES
    • B41F33/00Indicating, counting, warning, control or safety devices
    • B41F33/0036Devices for scanning or checking the printed matter for quality control

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Investigating Materials By The Use Of Optical Means Adapted For Particular Applications (AREA)

Abstract

FIELD: physics, acoustics.
SUBSTANCE: invention relates to means of generating an equalised multichannel audio signal. An audio encoder for obtaining an output signal using an input audio signal comprises a patch generator, a comparator and an output interface. The patch generator generates at least one bandwidth extension signal, having a high-frequency band. The high-frequency band of the bandwidth extension signal is based on a low frequency band of the input audio signal. A comparator calculates a plurality of comparison parameters. A comparison parameter is calculated based on a comparison of the input audio signal and a generated bandwidth extension signal. Each comparison parameter of the plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal and a generated high bandwidth signal. Further, the comparator determines a comparison parameter from the plurality of comparison parameters, wherein the determined comparison parameter satisfies a predefined criterion.
EFFECT: improved signal encoding quality at high bit rate.
17 cl, 22 dwg

Description

Варианты осуществления изобретения связаны с обработкой аудио сигнала, а именно, с аудио кодером, способом получения выходного сигнала, декодером, который обеспечивает расширение диапазона частот, и способом получения аудио сигнала с увеличенным диапазоном частот.Embodiments of the invention relate to processing an audio signal, namely, an audio encoder, a method for producing an output signal, a decoder that provides an extension of the frequency range, and a method for producing an audio signal with an increased frequency range.

Кодирование аудио сигналов с учетом их последующего восприятия для того, чтобы уменьшить объем данных для эффективного хранения и передачи информации нашло применение во многих сферах. Известными алгоритмами кодирования являются, например, MPEG 1/2 LAYER 3 "МР3" или MPEG 4 ААС. Применение данных алгоритмов кодирования, особенно при самых низких битрейтах, приводит к снижению качества звука. Это часто вызвано тем, что кодер имеет ограниченный диапазон передаваемых частот. Сигнал, пропущенный через фильтр нижних частот, кодируется при помощи так называемого центрального кодера, а области с более высокими частотами представляются в виде параметров и затем восстанавливаются из области, пропущенной через фильтр нижних частот.The encoding of audio signals taking into account their subsequent perception in order to reduce the amount of data for efficient storage and transmission of information has found application in many fields. Known encoding algorithms are, for example, MPEG 1/2 LAYER 3 "MP3" or MPEG 4 AAC. The use of these coding algorithms, especially at the lowest bitrates, leads to a decrease in sound quality. This is often because the encoder has a limited range of transmitted frequencies. The signal passed through the low-pass filter is encoded using the so-called central encoder, and the regions with higher frequencies are presented as parameters and then restored from the region passed through the low-pass filter.

Согласно WO 9857436 аудио сигнал подвергается процедуре уменьшения диапазона частот на стороне кодера, при этом кодируется только область низких частот аудио сигнала с помощью кодера высокого качества. Область высоких частот характеризуется очень примерно с помощью набора параметров, которые позволяют восстановить исходный спектр области высоких частот. Затем, на стороне декодера синтезируется полоса высоких частот. Для этой цели предлагается гармоническая транспозиция, когда полоса низких частот декодированного аудио сигнала направляется в банк фильтров. Каналы банка фильтров полосы низких частот соединяются с каналами банка фильтров полосы высоких частот, или «приводятся в соответствие», и каждый такой сигнал, пропущенный через полосно-пропускающий фильтр, подвергается корректировке. Синтезирующий банк фильтров, принадлежащий особому анализирующему банку фильтров, получает фильтрованный сигнал в диапазоне низких частот и скорректированный фильтрованный сигнал диапазона низких частот, который соответствует области высоких частот. Сигнал на выходе синтезирующего банка фильтров представляет собой сигнал, расширенный в соответствии с диапазоном частот аудио сигнала, переданного из кодера в декодер при низкой скорости передачи данных, т.к. вычисления банка фильтров и процесс определения соответствий между диапазонами высоких и низких частот представляет значительные трудности.According to WO 9857436, the audio signal undergoes a frequency range reduction procedure on the encoder side, and only the low frequency region of the audio signal is encoded using a high quality encoder. The high-frequency region is characterized very approximately using a set of parameters that allow you to restore the original spectrum of the high-frequency region. Then, on the decoder side, the high frequency band is synthesized. For this purpose, harmonic transposition is proposed when the low frequency band of the decoded audio signal is sent to the filter bank. The channels of the low-pass filter bank are connected to the channels of the high-pass filter bank, or “matched,” and each such signal passed through the pass-band filter is corrected. A synthesizing filter bank belonging to a special analyzing filter bank receives a filtered signal in the low frequency range and a corrected filtered signal in the low frequency range, which corresponds to the high frequency region. The signal at the output of the synthesizing filter bank is a signal expanded in accordance with the frequency range of the audio signal transmitted from the encoder to the decoder at a low data rate, because calculating the filter bank and the process of determining the correspondence between the high and low frequency ranges presents significant difficulties.

Менее затратные с точки зрения вычислений способы расширения диапазона частот аудио сигнала с ограниченным диапазоном частот применяют копирование низкочастотных областей сигнала (LF) в область высоких частот (HF) для того, чтобы приблизительно заполнить недостающую информацию, которая отсутствует из-за ограничения диапазона. Подобные способы описаны в следующих работах: М.Dietz, L.Liljeryd, K.Kjörling and 0.Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002; S.Meltzer, R. Böhm and F.Henn, "SBR enhanced audio codecs for digital broadcasting such as "Digital Radio Mondiale" (DRM)," 112th AES Convention, Munich, May 2002; Т.Ziegler, A.Ehret, P.Ekstrand and М.Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3 PRO Algorithm," in 112th AES Convention, Munich, May 2002; International Standard ISO/IEC 14496-3:2001/FPDAM 1, "Bandwidth Extension," ISO/IEC, 2002, or "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. US Patent Nr. 5,455,888.Less computationally expensive methods of expanding the frequency range of an audio signal with a limited frequency range use copying the low-frequency areas of the signal (LF) to the high-frequency areas (HF) in order to approximately fill in the missing information that is missing due to the range limitation. Similar methods are described in the following works: M. Dietz, L. Liljeryd, K. Kjörling and 0. Kunz, "Spectral Band Replication, a novel approach in audio coding," in 112th AES Convention, Munich, May 2002; S. Meltzer, R. Böhm and F. Henn, "SBR enhanced audio codecs for digital broadcasting such as" Digital Radio Mondiale "(DRM)," 112th AES Convention, Munich, May 2002; T. Ziegler, A. Ehret, P. Ekstrand and M. Lutzky, "Enhancing mp3 with SBR: Features and Capabilities of the new mp3 PRO Algorithm," in 112th AES Convention, Munich, May 2002; International Standard ISO / IEC 14496-3: 2001 / FPDAM 1, "Bandwidth Extension," ISO / IEC, 2002, or "Speech bandwidth extension method and apparatus", Vasu Iyengar et al. US Patent Nr. 5,455,888.

Данные способы не применяют гармоническую транспозицию. Согласно этим способам полосовой сигнал низкой частоты искусственно копируется в смежную область полосового сигнала высоких частот. Это приводит к неточному представлению диапазона высоких частот. Грубое приближение полученного сигнала к исходному сигналу затем корректируется на следующем этапе путем определения контрольных параметров на основе исходного сигнала. Например, стандарт MPEG-4 использует масштабные коэффициенты для корректировки спектральной огибающей, сочетание обратной фильтрации и добавления порога шума для корректировки тональности, а также вставку синусоидальныхных частей сигнала для добавления тональных компонентов.These methods do not use harmonic transposition. According to these methods, the low-frequency bandpass signal is artificially copied to an adjacent region of the high-frequency bandpass signal. This results in an inaccurate representation of the high frequency range. The rough approximation of the received signal to the original signal is then corrected in the next step by determining control parameters based on the original signal. For example, the MPEG-4 standard uses scale factors to adjust the spectral envelope, a combination of inverse filtering and the addition of a noise threshold to adjust tonality, and the insertion of sinusoidal parts of the signal to add tonal components.

Кроме этого существует так называемое «слепое расширение диапазона частот», описанное в работах Е.Larsen, R.M.Aarts, and М.Danessis, "Efficient high-frequency bandwidth extension of music and speech". Однако об этом способе не упоминалось на 112-й конференции AES в Мюнхене, Германия, май 2002 г. Также существует так называемый способ «искусственного расширения диапазона частот», который рассматривается в работе K.Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.In addition, there is the so-called "blind extension of the frequency range" described in the works of E. Larsen, R.M. Aarts, and M. Danessis, "Efficient high-frequency bandwidth extension of music and speech". However, this method was not mentioned at the 112th AES conference in Munich, Germany, May 2002. There is also the so-called “artificial bandwidth extension” method, which is discussed in K. Käyhkö, A Robust Wideband Enhancement for Narrowband Speech Signal; Research Report, Helsinki University of Technology, Laboratory of Acoustics and Audio signal Processing, 2001.

В работе J.Makinen et al.: AMR-WB+: a new audio coding standard for 3rd generation mobile audio services Broadcasts, IEEE, ICASSP ′05 описывается способ расширения диапазона частот, при котором операция копирования компонентов низких частот в диапазон высоких частот производится с помощью зеркального отражения, получаемого при увеличении частоты дискретизации низкочастотного фильтрованного сигнала.J. Makinen et al .: AMR-WB +: a new audio coding standard for 3 rd generation mobile audio services Broadcasts, IEEE, ICASSP ′05 describes a method for expanding the frequency range in which the operation of copying low-frequency components to the high-frequency range is performed using specular reflection obtained by increasing the sampling frequency of the low-pass filtered signal.

В качестве альтернативы может применяться одностороння модуляция диапазона, которая в целом эквивалентна операции копирования в области фильтра. Способы, которые применяют гармоническое расширение диапазона? обычно используют этап определения тона (pitch tracking), этап нелинейного искажения (см. "U.Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, in: Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp.215-218") или применяют фазовые голосовые кодеры, что указано в заявке на патент F.Nagel, S.Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" with the application number US 61/025129.Alternatively, one-way range modulation can be applied, which is generally equivalent to the copy operation in the filter area. Ways that apply harmonic range extension? typically use the pitch tracking step, the nonlinear distortion step (see "U. Kornagel, Spectral widening of the excitation signal for telephone-band speech enhancement, in: Proceedings of the IWAENC, Darmstadt, Germany, September 2001, pp. 215-218 ") or phase voice encoders are used, as described in the patent application F.Nagel, S. Disch:" Apparatus and method of harmonic bandwidth extension in audio signals "" with the application number US 61/025129.

Стандарт WO 02/41302 A1, например, описывает способ повышения эффективности кодирующих систем, которые применяют реконструкцию высоких частот. Он показывает, как повысить общую эффективность таких систем при помощи постепенной адаптации частоты перехода между полосой низких частот, кодированной основным кодером, и полосой высоких частот, кодированной системой, которая применяет реконструкцию диапазона высоких частот. Согласно этому способу, основной кодер должен работать с различными частотами перехода как на стороне кодера, так и на стороне декодера. Таким образом, структура основного кодера усложняется.WO 02/41302 A1, for example, describes a method for improving the efficiency of coding systems that employ high frequency reconstruction. It shows how to increase the overall efficiency of such systems by gradually adapting the transition frequency between the low-frequency band encoded by the main encoder and the high-frequency band encoded by a system that applies high-frequency band reconstruction. According to this method, the main encoder must work with different transition frequencies on both the encoder side and the decoder side. Thus, the structure of the main encoder is complicated.

Способы расширения диапазона частот описываются также в следующих работах: R.М.Aarts, E.Larsen, and О.Ouweltjes, A unified approach to low- and high-frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003", E.Larsen and R.М.Aarts: Audio Bandwidth Extension - Application to psychoacoustics. Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004", E.Larsen, R.М.Aarts, and М.Danessis: Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002", "J.Makhoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21(3), June 1973", "United States Patent Application 08/951,029, Ohmori et al.: Audio band width extending system and method" and "United States Patent 6895375, Malah, D & Cox, R. VS.: System for bandwidth extension of Narrow-band speech.Ways to extend the frequency range are also described in the following works: R. M. Aarts, E. Larsen, and O. Oweltjes, A unified approach to low- and high-frequency bandwidth extension. In AES 115th Convention, New York, USA, October 2003 ", E. Larsen and R. M. Arts: Audio Bandwidth Extension - Application to psychoacoustics. Signal Processing and Loudspeaker Design. John Wiley & Sons, Ltd, 2004", E. Larsen, R. M. Arts, and M. Danessis: Efficient high-frequency bandwidth extension of music and speech. In AES 112th Convention, Munich, Germany, May 2002 "," J. Mahoul: Spectral Analysis of Speech by Linear Prediction. IEEE Transactions on Audio and Electroacoustics, AU-21 (3), June 1973 "," United States Patent Application 08 / 951.029, Ohmori et al .: Audio band width extending system and method "and" United States Patent 6895375, Malah, D & Cox, R. VS .: System for bandwidth extension of Narrow-band speech.

Способы гармонического расширения диапазона частот обычно являются очень сложными, а при упрощении способов расширения диапазона частот ухудшается качество. В конкретном случае, когда низкий битрейт сочетается с небольшой полосой низких частот, могут появиться такие помехи, как резкие переходы и искажения тембра.Methods of harmoniously expanding the frequency range are usually very complex, and when simplifying the methods of expanding the frequency range, quality deteriorates. In a particular case, when a low bitrate is combined with a small low-frequency band, interference may occur such as sudden transitions and timbre distortions.

Причиной этому является то, что порция высоких частот часто получена приблизительно на основе операции копирования, которая не определяет гармонические соотношения между частями тонального сигнала. Это относится как к гармоническому соотношению между диапазонами низкой и высокой частот, так и к гармоническому соотношению между последующими патчами в пределах диапазона высоких частот. Например, в SBR соседнее расположение кодированных компонентов и копируемых компонентов, которое случается на границе полос высоких и низких частот, может стать причиной тому, что звук воспринимается как неравномерный. Это показано на фиг.18, где тональные порции, скопированные из диапазона низких частот в диапазон высоких частот, спектрально близко примыкают к тональным порциям диапазона низких частот.The reason for this is that a portion of the high frequencies is often obtained approximately based on the copy operation, which does not determine the harmonic relationships between the parts of the tone signal. This applies both to the harmonic relationship between the low and high frequency ranges, and to the harmonic relationship between subsequent patches within the high frequency range. For example, in SBR, the adjacent arrangement of encoded components and copied components, which occurs at the boundary of the high and low frequency bands, may cause the sound to be perceived as uneven. This is shown in Fig. 18, where the tonal portions copied from the low frequency range to the high frequency range are spectrally close to the tonal portions of the low frequency range.

Фиг.18A иллюстрирует исходную спектрограмму 1800A сигнала, состоящего из трех тонов. Фиг.18B показывает диаграмму 1800B сигнала с увеличенным диапазоном, который соответствует исходному сигналу на фиг.18A. Абсцисса указывает время, ордината - частоту. В частности, что касается последнего тона, то здесь можно наблюдать потенциальные проблемы 1810 (размытые линии 1810).Figa illustrates the original spectrogram 1800A signal, consisting of three tones. Fig. 18B shows a diagram 1800B of a signal with an increased range that corresponds to the original signal in Fig. 18A. The abscissa indicates time, the ordinate indicates frequency. In particular, with regard to the last tone, here you can observe the potential problems 1810 (blurry lines 1810).

Если известные способы рассматривают гармоническое отношение, то это происходит всегда на основе F0-оценки. В этом случае успех этих способов в значительной мере зависит от надежности этой оценки.If the known methods consider the harmonic relationship, then this always happens on the basis of the F 0 estimate. In this case, the success of these methods largely depends on the reliability of this assessment.

В целом, известные способы увеличения диапазона частот позволяют получить аудио сигналы при низком битрейте, при высоком битрейте качество аудио сигнала не всегда может быть высоким.In general, well-known methods of increasing the frequency range allow you to get audio signals at low bitrate, with high bitrate the quality of the audio signal may not always be high.

Задачей настоящего изобретения является улучшение схемы кодирования аудио сигналов.An object of the present invention is to improve an audio signal coding scheme.

Эта задача решается при помощи аудио кодера согласно п.1, декодера, увеличивающего диапазон частот, согласно п.3 и п.8 и способу согласно п.12, 13 и 14.This problem is solved using an audio encoder according to claim 1, a decoder that increases the frequency range, according to claim 3 and claim 8 and the method according to claim 12, 13 and 14.

При осуществлении настоящего изобретения применяется аудио кодер, который генерирует выходной сигнал на основе входного аудио сигнала. Аудио кодер включает генератор патчей, компаратор и выходной интерфейс.In an embodiment of the present invention, an audio encoder is used that generates an output signal based on an input audio signal. The audio encoder includes a patch generator, a comparator, and an output interface.

Генератор патчей генерирует, как минимум, один сигнал с увеличенным диапазоном высоких частот. Сигнал с увеличенным диапазоном высоких частот включает полосу высоких частот, которая основана на низких частотах входного аудио сигнала.The patch generator generates at least one signal with an increased high-frequency range. A signal with an increased high-frequency range includes a high-frequency band, which is based on the low frequencies of the input audio signal.

Если создавались разные сигналы с увеличенным диапазоном высоких частот, то различные сигналы будут включать различные частоты.If you created different signals with an increased range of high frequencies, then different signals will include different frequencies.

Компаратор вычисляет множество сравнительных параметров. Сравнительный параметр вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с увеличенным диапазоном высоких частот. Каждый параметр из множества параметров сравнения вычисляется на основе отдельной частоты смещения между входным аудио сигналом и созданным сигналом с увеличенным диапазоном высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения таким образом, что выделенный параметр соответствовал заранее заданному критерию.The comparator calculates many comparative parameters. The comparative parameter is calculated based on a comparison of the input audio signal and the generated signal with an increased high-frequency range. Each parameter from a plurality of comparison parameters is calculated based on a separate offset frequency between the input audio signal and the generated signal with an increased high-frequency range. Next, the comparator selects the comparison parameter from the set of comparison parameters so that the selected parameter corresponds to a predetermined criterion.

Иначе говоря, компаратор может быть сконфигурирован таким образом, что он будет определять тот параметр сравнения среди множества параметров сравнения, который наилучшим образом соответствует заданному критерию.In other words, the comparator can be configured in such a way that it will determine the comparison parameter among the set of comparison parameters that best suits the given criterion.

Выходной интерфейс обеспечивает выходной сигнал для его передачи или хранения. Выходной сигнал включает индикацию сигнала на основе частоты смещения, соответствующей определенному параметру сравнения.The output interface provides an output signal for transmission or storage. The output signal includes an indication of the signal based on a bias frequency corresponding to a specific comparison parameter.

Иначе говоря, выходной сигнал включает выбранный параметр сравнения, который указывает оптимальную частоту смещения.In other words, the output signal includes the selected comparison parameter, which indicates the optimal bias frequency.

Следующий вариант изобретения включает декодер, который увеличивает диапазон частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала. Параметрический сигнал содержит указание на частоту смещения и параметр плотности мощности. Декодер, увеличивающий диапазон частот, включает генератор патчей, блок объединения и выходной интерфейс.A further embodiment of the invention includes a decoder that increases the frequency range to obtain an audio signal with an increased frequency range based on the input audio signal and the parametric signal. The parametric signal contains an indication of the bias frequency and the power density parameter. A decoder that increases the frequency range includes a patch generator, a combiner, and an output interface.

Генератор патчей создает сигнал с увеличенным диапазоном высоких частот, который включает полосу высоких частот. Полоса высоких частот данного сигнала генерируется на основе одного или более сдвига полосы частот входного аудио сигнала. Сдвиги частот основаны на частоте смещения.The patch generator creates a signal with an increased high-frequency range, which includes the high-frequency band. The high frequency band of a given signal is generated based on one or more frequency band offsets of the input audio signal. Frequency offsets are based on the offset frequency.

Генератор патчей может расширять или уменьшать полосу высоких частот сигнала с увеличенным диапазоном высоких частот с помощью коэффициента, равного значению параметра плотности мощности или обратной величине параметра плотности мощности соответственно.The patch generator can expand or decrease the high-frequency band of a signal with an increased high-frequency range by using a coefficient equal to the value of the power density parameter or the reciprocal of the power density parameter, respectively.

Блок объединения соединяет сигнал с полосой высоких частот и входной аудио сигнал для того, чтобы получить сигнал с увеличенным диапазоном высоких частот.The combining unit connects the signal with the high frequency band and the input audio signal in order to obtain a signal with an increased high frequency range.

Выходной интерфейс обеспечивает выход сигнала с увеличенным диапазоном.The output interface provides an output signal with an increased range.

Следующий вариант реализации настоящего изобретения имеет декодер, увеличивающий полосу частот, для получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала. Декодер, увеличивающий полосу частот, включает генератор патчей, компаратор, блок объединения и выходной интерфейс.A further embodiment of the present invention has a bandwidth increasing decoder for receiving an audio signal with an increased frequency range based on an input audio signal. The bandwidth increasing decoder includes a patch generator, a comparator, a combining unit, and an output interface.

Генератор патчей создает, как минимум, один сигнал с полосой высоких частот, включающий полосу высоких частот, полученную на основе входного аудио сигнала. При этом нижняя предельная частота полосы высоких частот созданного сигнала оказывается ниже, чем верхняя предельная частота входного аудио сигнала. Если генерируются разные сигналы с полосой высоких частот, то полученные сигналы с полосой высоких частот имеют различные частоты в рамках своих высокочастотных полос.The patch generator creates at least one signal with a high-frequency band, including a high-frequency band, obtained on the basis of the input audio signal. In this case, the lower limit frequency of the high frequency band of the generated signal is lower than the upper limit frequency of the input audio signal. If different signals with a high-frequency band are generated, then the received signals with a high-frequency band have different frequencies within their high-frequency bands.

Компаратор вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе разных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот. Далее компаратор выделяет параметр сравнения из множества параметров сравнения так, чтобы определенный параметр соответствовал заранее заданному критерию.The comparator calculates many comparison parameters. The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of comparison parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band. Next, the comparator selects the comparison parameter from the set of comparison parameters so that a certain parameter matches a predetermined criterion.

Иначе говоря, компаратор определяет тот параметр сравнения среди множества параметров, который максимально соответствует заданному критерию.In other words, the comparator determines the comparison parameter among the set of parameters that meets the specified criterion as much as possible.

Блок объединения объединяет входной аудио сигнал и сигнал с полосой высоких частот для получения аудио сигнала с увеличенным диапазоном частот. При этом сигнал с полосой высоких частот, используемый для получения сигнала с увеличенным диапазоном частот, основывается на частоте смещения, соответствующей выделенному параметру сравнения.The combining unit combines the input audio signal and a signal with a high frequency band to obtain an audio signal with an increased frequency range. In this case, a signal with a high frequency band used to obtain a signal with an increased frequency range is based on the bias frequency corresponding to the selected comparison parameter.

Выходной интерфейс обеспечивает выход аудио сигнала с увеличенным диапазоном частот.The output interface provides an output of an audio signal with an increased frequency range.

Варианты реализации настоящего изобретения основываются на основной идее о том, что можно создавать сигнал с полосой высоких частот, который также называется патч, на базе исходного входного сигнала, а также их сравнивать. При помощи различных частот смещения сигнала с полосой высоких частот или нескольких сигналов с полосой высоких частот с различными частотами смещения может быть вычислено множество параметров сравнения, соответствующих этим частотам смещения. Параметры сравнения могут быть соотнесены с числом, которое ассоциируется с качеством аудио сигнала. Таким образом, при определении параметра сравнения гарантируется соответствие сигнала с полосой высоких частот и входного аудио сигнала, вследствие чего повышается качество звука.Embodiments of the present invention are based on the basic idea that it is possible to create a signal with a high frequency band, also called a patch, based on the original input signal, as well as compare them. Using various bias frequencies of a signal with a high frequency band or several signals with a high frequency band with different bias frequencies, a plurality of comparison parameters corresponding to these bias frequencies can be calculated. The comparison parameters can be correlated with a number that is associated with the quality of the audio signal. Thus, when determining the comparison parameter, the correspondence of the signal with the high-frequency band and the input audio signal is guaranteed, thereby improving the sound quality.

Битрейт для передачи и хранения кодированного аудио сигнала может быть уменьшен при помощи указания параметра на основе частоты смещения, соответствующего определенному параметру сравнения для реконструкции полосы высоких частот исходного входного аудио сигнала. В этом случае для хранения и передачи необходимы только порция низких частот входного аудио сигнала и индикация параметра.The bitrate for transmitting and storing the encoded audio signal can be reduced by specifying a parameter based on an offset frequency corresponding to a specific comparison parameter for reconstructing the high frequency band of the original input audio signal. In this case, only a portion of the low frequencies of the input audio signal and an indication of the parameter are required for storage and transmission.

Термины ′параметр сравнения′, ′частота перехода′ и ′индикация параметра′ будут определены позже.The terms “comparison parameter”, “transition frequency” and “parameter indication” will be defined later.

Некоторые варианты реализации настоящего изобретения включают компаратор, который использует взаимную корреляцию при сравнении входного аудио сигнала и созданного сигнала с полосой высоких частот для вычисления параметра сравнения.Some embodiments of the present invention include a comparator that uses cross-correlation when comparing the input audio signal and the generated signal with the high frequency band to calculate the comparison parameter.

Некоторые варианты реализации настоящего изобретения включают генератор патчей, который создает сигнал с полосой высоких частот во временной области на основе односторонней модуляции полосы частот.Some embodiments of the present invention include a patch generator that generates a signal with a high frequency band in the time domain based on one-way modulation of the frequency band.

Преимуществом предпочтительных форм реализации настоящего изобретения является улучшенная схема кодирования аудио сигналов, которая позволяет увеличить качество звука и/или уменьшить битрейт для передачи или хранения сигнала.An advantage of the preferred forms of implementation of the present invention is an improved coding scheme for audio signals, which allows to increase the sound quality and / or reduce the bitrate for transmitting or storing the signal.

Варианты реализации настоящего изобретения будут далее детально рассмотрены в соответствии со следующими фигурами, которые даны в приложении:Embodiments of the present invention will be further described in detail in accordance with the following figures, which are given in the appendix:

Фиг.1 - блок-схема аудио кодера;Figure 1 is a block diagram of an audio encoder;

Фиг.2 - схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;Figure 2 is a schematic illustration of the process of creating a signal with a high frequency band, comparing the input audio signal and the generated signal with a high frequency band, as well as the process of adapting the signal power with a high frequency band;

Фиг.3- схематическая иллюстрация процесса создания сигнала с полосой высоких частот, сравнения входного аудио сигнала и сигнала с полосой высоких частот, а также процесса адаптации мощности сигнала с полосой высоких частот;Figure 3 is a schematic illustration of the process of creating a signal with a high frequency band, comparing the input audio signal and the signal with the high frequency band, as well as the process of adapting the signal power with the high frequency band;

Фиг.4 - блок-схема кодера, увеличивающего полосу частот;4 is a block diagram of an encoder increasing the frequency band;

Фиг.5 - блок-схема декодера, увеличивающего полосу частот;5 is a block diagram of a decoder increasing the frequency band;

Фиг.6 - блок-схема декодера, увеличивающего полосу частот;6 is a block diagram of a decoder increasing the frequency band;

Фиг.7- схема способа получения выходного сигнала на основе входного аудио сигнала;7 is a diagram of a method of obtaining an output signal based on an input audio signal;

Фиг.8 - схема способа получения сигнала с увеличенным диапазоном частот;8 is a diagram of a method of obtaining a signal with an increased frequency range;

Фиг.9- схема способа получения выходного сигнала на основе входного аудио сигнала;Fig.9 is a diagram of a method of obtaining an output signal based on an input audio signal;

Фиг.10 - схема способа вычисления параметра сравнения;10 is a diagram of a method for calculating a comparison parameter;

Фиг.11 - схематическая иллюстрация интерполяции частоты смещения;11 is a schematic illustration of an offset frequency interpolation;

Фиг.12 - блок-схема декодера, увеличивающего полосу частот;12 is a block diagram of a decoder increasing a frequency band;

Фиг.13 - схема способа получения сигнала с увеличенным диапазоном частот;Fig. 13 is a diagram of a method for obtaining a signal with an increased frequency range;

Фиг.14 - блок-схема способа получения сигнала с увеличенным диапазоном частот;Fig - block diagram of a method of obtaining a signal with an increased frequency range;

Фиг.15 - блок-схема кодера, увеличивающего полосу частот;Fig - block diagram of an encoder that increases the frequency band;

Фиг.16A - спектрограмма трех тонов при использовании переменной переходной частоты;Figa - spectrogram of three tones using a variable transition frequency;

Фиг.16B - спектрограмма исходного аудио сигнала, состоящего из трех тонов;Figv - spectrogram of the original audio signal, consisting of three tones;

Фиг.17 - диаграмма спектра мощности исходного аудио сигнала и сигнала с увеличенным диапазоном частот, которые используют постоянную частоту перехода, и сигнала с увеличенным диапазоном частот, который использует переменную частоту перехода;17 is a power spectrum diagram of an original audio signal and an increased frequency range signal that use a constant transition frequency, and an increased frequency range signal, which uses a variable transition frequency;

Фиг.18A - спектрограмма трех тонов при использовании известного способа увеличения диапазона частот;Figa - spectrogram of three tones using a known method of increasing the frequency range;

Фиг.18B - спектрограмма исходного аудио сигнала, состоящего из трех тонов. Figv - spectrogram of the original audio signal, consisting of three tones.

В последующем описании объекты и функциональные модули, имеющие одинаковые или схожие функциональные свойства, будут указываться одними и теми же порядковыми номерами на схемах. Описания, касающиеся какой-либо схемы, будут относиться и к другим схемам во избежание повторов в описании вариантов изобретения.In the following description, objects and functional modules having the same or similar functional properties will be indicated by the same serial numbers on the diagrams. Descriptions relating to any scheme will apply to other schemes in order to avoid repetitions in the description of variants of the invention.

Фиг.1 показывает блок-схему аудио кодера 100 для получения выходного сигнала 132 в соответствии с настоящим изобретением, используя входной аудио сигнал 102. Выходной сигнал может применяться для расширения полосы частот на стороне декодера. Таким образом, аудио кодер также называется кодер увеличения полосы частот. Кодер увеличения полосы частот 100 включает генератор патчей 110, компаратор 120 и выходной интерфейс 130. Генератор патчей 110 соединяется с компаратором 120, а компаратор 120 соединяется с выходным интерфейсом 130.Figure 1 shows a block diagram of an audio encoder 100 for receiving an output signal 132 in accordance with the present invention using an audio input signal 102. The output signal can be used to expand the frequency band on the decoder side. Thus, an audio encoder is also called an up-band encoder. The bandwidth increasing encoder 100 includes a patch generator 110, a comparator 120, and an output interface 130. A patch generator 110 is connected to a comparator 120, and a comparator 120 is connected to an output interface 130.

Генератор патчей 110 генерирует, как минимум, один сигнал с полосой высоких частот 112. Сигнал 112 имеет полосу высоких частот, которая создана на основе полосы низких частот входного аудио сигнала 102. В том случае, если генерируются различные сигналы с полосами высоких частот 112, то сигналы 112 имеют различные частоты в диапазоне высоких частот.The patch generator 110 generates at least one signal with a high frequency band 112. The signal 112 has a high frequency band, which is created on the basis of the low frequency band of the input audio signal 102. In the event that various signals with high frequency bands 112 are generated, then signals 112 have different frequencies in the high frequency range.

Компаратор 120 вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112. Каждый параметр сравнения из множества параметров сравнения на основе разных частот смещения между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112. Далее компаратор определяет параметр сравнения из множества параметров сравнения так, чтобы он соответствовал заранее заданному критерию.Comparator 120 calculates a plurality of comparison parameters. The comparison parameter is calculated based on the comparison of the input audio signal 102 and the generated signal with the high frequency band 112. Each comparison parameter from a plurality of comparison parameters based on different offset frequencies between the input audio signal 102 and the created signal with the high frequency band 112. Next, the comparator determines the comparison parameter from the set of comparison parameters so that it meets a predetermined criterion.

Выходной интерфейс 130 обеспечивает выходной сигнал 132 для последующей передачи или хранения. Выходной сигнал 132 имеет индикацию параметра на основе частоты смещения в соответствии с определенным параметром сравнения.The output interface 130 provides an output signal 132 for subsequent transmission or storage. The output signal 132 has a parameter indication based on the bias frequency in accordance with the determined comparison parameter.

При помощи вычисления множества параметров сравнения для различных частот смещения может быть найден сигнал с полосой высоких частот 122, который максимально соответствует исходному входному сигналу 102. Это достигается путем генерации множества сигналов с полосой высоких частот 112, каждый из которых имеет различную частоту смещения, или путем создания одного сигнала с полосой высоких частот 112 и дальнейшим сдвигом полосы высоких частот сигнала 112 при помощи различных частот смещения. Также возможна комбинация создания множества сигналов с полосой высоких частот 112 с различными частотами смещения и дальнейшего сдвига полос высоких частот этих сигналов при помощи других частот смещения. Например, генерируются пять различных сигналов с полосой высоких частот 112, и каждый их них сдвигается пять раз на определенную частоту смещения.By calculating a plurality of comparison parameters for different bias frequencies, a signal with a high-frequency band 122 that can best match the original input signal 102 can be found. This is achieved by generating a number of signals with a high-frequency band 112, each of which has a different bias frequency, or by create a single signal with a high-frequency band 112 and a further shift of the high-frequency band of the signal 112 using various offset frequencies. It is also possible to combine multiple signals with a high frequency band 112 with different bias frequencies and further shift the high frequency bands of these signals using other bias frequencies. For example, five different signals are generated with a high-frequency band 112, and each of them is shifted five times by a specific offset frequency.

На фиг.2 представлена схематическая иллюстрация 200 процесса создания сигнала с полосой высоких частот, сравнения сигнала с полосой высоких частот с входным сигналом и опциональную адаптацию мощности сигнала с полосой высоких частот в случае, если генерируется только один сигнал с полосой высоких частот, который сдвигается на величину различных частот смещения.FIG. 2 is a schematic illustration 200 of the process of creating a signal with a high frequency band, comparing a signal with a high frequency band with an input signal, and optionally adapting the signal power with a high frequency band if only one signal with a high frequency band is generated, which is shifted by the magnitude of the various offset frequencies.

Первая диаграмма «мощность vs. частота» 210 схематично показывает входной аудио сигнал 102. На основе этого входного сигнала 102 генератор патчей 110 может создавать сигнал с полосой высоких частот 112, например, при помощи сдвига 222 полосы низких частот входного аудио сигнала 102 в сторону более высоких частот (как указано порядковым номером на схеме). Например, полоса низкой частоты сдвигается на частоту, равную частоте перехода основного кодера, не показанного на фиг.1, который может быть частью кодера 100, увеличивающего полосу частот, или на другую заранее заданную частоту.The first diagram is “power vs. frequency "210 schematically shows the input audio signal 102. Based on this input signal 102, the patch generator 110 can create a signal with a high frequency band 112, for example, by shifting 222 the low frequency band of the input audio signal 102 towards higher frequencies (as indicated by ordinal number on the diagram). For example, the low frequency band is shifted by a frequency equal to the transition frequency of the main encoder, not shown in figure 1, which may be part of the encoder 100, increasing the frequency band, or to another predetermined frequency.

Созданный сигнал с полосой высоких частот 112 затем может сдвигаться на различные частоты смещения 232, для каждой частоты смещения 232 (на схеме обозначено номером 230) компаратором 120 может быть вычислен параметр сравнения. Частота смещения 232 может быть определена, например, по отношению к частоте перехода основного кодера, по отношению к другой заданной частоте или как абсолютное частотное значение.The generated signal with a high-frequency band 112 can then be shifted by different bias frequencies 232, for each bias frequency 232 (indicated by 230 in the diagram), a comparison parameter can be calculated by comparator 120. The offset frequency 232 may be determined, for example, with respect to the transition frequency of the main encoder, with respect to another predetermined frequency, or as an absolute frequency value.

Далее компаратор 120 определяет параметр сравнения, соответствующий заранее заданному критерию. Таким образом может быть определен сигнал с полосой высоких частот 112 с частотой смещения 242, соответствующей определенному параметру сравнения (на схеме указано номером 240).Next, the comparator 120 determines a comparison parameter corresponding to a predetermined criterion. Thus, a signal with a high-frequency band 112 with a bias frequency of 242 corresponding to a specific comparison parameter (indicated by 240 in the diagram) can be determined.

Дополнительно может быть определен параметр плотности мощности 252 (на схеме указан номером 250). Параметр плотности мощности 252 показывает отношение полосы высоких частот созданного сигнала с частотой смещения согласно определенному параметру сравнения к соответствующей полосе частот входного аудио сигнала. Например, это отношение может быть представлено коэффициентом плотности мощности, коэффициентом мощности или другим коэффициентом, который относится к плотности мощности частотного диапазона.Additionally, the power density parameter 252 can be determined (indicated on the diagram by number 250). The power density parameter 252 shows the ratio of the high frequency band of the generated signal to the bias frequency according to the determined comparison parameter to the corresponding frequency band of the input audio signal. For example, this ratio may be represented by a power density coefficient, a power factor, or another coefficient that relates to a power density of a frequency range.

В отличие от предыдущих схем, фиг.3 представляет собой схематическую иллюстрацию 300 процесса создания сигнала с полосой высоких частот, сравнения созданных сигналов с входным аудио сигналом и возможной адаптации мощности созданного сигнала с полосой высоких, если создается множество сигналов с полосами высоких частот, которые имеют различные частоты смещения.In contrast to the previous schemes, FIG. 3 is a schematic illustration 300 of a process for creating a signal with a high frequency band, comparing the generated signals with an input audio signal and possibly adapting the power of the created signal with a high band if a plurality of signals with high frequency bands that have different offset frequencies.

В отличие от последовательности, показанной на фиг.2, генератор патчей 110 создает множество сигналов с полосами высоких частот 112 с различными частотами смещения (показано номером 320). Это происходит, как и в предыдущем случае, с помощью частотного сдвига 222 полосы низких частот входного аудио сигнала 102 в диапазон высоких частот. Полоса низких частот входного аудио сигнала 102 может сдвигаться на постоянную частоту плюс индивидуальная частота смещения 232 каждого сигнала с полосой высоких частот 112. Постоянная частота может быть равной частоте перехода основного кодера или другой определенной частоте.In contrast to the sequence shown in FIG. 2, patch generator 110 generates a plurality of signals with high frequency bands 112 with different offset frequencies (indicated by 320). This occurs, as in the previous case, using the frequency shift 222 of the low frequency band of the input audio signal 102 in the high frequency range. The low frequency band of the input audio signal 102 may be shifted by a constant frequency plus an individual offset frequency 232 of each signal with a high frequency band 112. The constant frequency may be equal to the transition frequency of the main encoder or another specific frequency.

Затем компаратором 120 вычисляется параметр сравнения для каждого созданного сигнала с полосой высоких частот 112, а также параметр сравнения 240, соответствующий заранее заданному критерию.Then, the comparator 120 calculates a comparison parameter for each generated signal with a high frequency band 112, as well as a comparison parameter 240 corresponding to a predetermined criterion.

Параметр плотности мощности 250 определяется так, как это указано выше.The power density parameter 250 is determined as described above.

Схемы, показанные на фиг.2 и 3, могут быть также скомбинированы.The circuits shown in FIGS. 2 and 3 can also be combined.

Сравнение входного аудио сигнала 102 и созданного сигнала с полосой высоких частот 112 может проводиться на основе взаимной корреляции обоих сигналов. В этом случае параметр сравнения может быть, например, результатом взаимной корреляции между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот 112 для определенной частоты смещения.Comparison of the input audio signal 102 and the generated signal with the high frequency band 112 may be based on the cross-correlation of both signals. In this case, the comparison parameter may be, for example, the result of cross-correlation between the input audio signal 102 and the generated signal with a high frequency band 112 for a certain offset frequency.

Индикация параметра выходного сигнала 132 может быть представлена самой частотой смещения, квантованной частотой смещения или другой величиной, основанной на частоте смещения.An indication of the parameter of the output signal 132 may be represented by the bias frequency itself, a quantized bias frequency, or another value based on the bias frequency.

При передаче или хранении только индикации параметра вместо полосы высоких частот входного аудио 102 битрейт для передачи или хранения может быть понижен. Выбор параметра, основанного на частоте смещения согласно параметру сравнения, соответствующего заданному критерию, приводит к улучшению качества звука по сравнению с декодированием аудио сигнала с ограниченной полосой частот.When transmitting or storing only an indication of a parameter instead of the high frequency band of the input audio, the 102 bit rate for transmission or storage may be lowered. Choosing a parameter based on a bias frequency according to a comparison parameter corresponding to a given criterion leads to an improvement in sound quality compared to decoding an audio signal with a limited frequency band.

Согласно заранее заданному критерию определяется параметр сравнения из множества параметров сравнения, который указывает, например, на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который соответствует входному аудио сигналу 102 лучше, чем остальные 70% сигналов с полосами высоких частот с другими частотами смещения. Параметр сравнения может также указывать на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который является одним из трех лучших соответствий входному аудио сигналу 102, или на сигнал с полосой высоких частот 112 с необходимой частотой смещения, который максимально соответствует входному сигналу. Это относится к той ситуации, когда генерируется множество сигналов с полосой высоких частот 112 с различными частотами смещения или к ситуации, когда генерируется один сигнал с полосой высоких часто 112, который сдвигается при помощи разных частот смещения, или к комбинации этих схем.According to a predetermined criterion, a comparison parameter is determined from the set of comparison parameters, which indicates, for example, a signal with a high frequency band 112 with a necessary bias frequency, which corresponds to an input audio signal 102 better than the remaining 70% of signals with high frequency bands with other bias frequencies . The comparison parameter may also indicate a signal with a high-frequency band 112 with a desired bias frequency, which is one of the three best matches to an input audio signal 102, or a signal with a high-frequency band 112 with a desired bias frequency, which is most suitable for an input signal. This refers to the situation when a plurality of signals with a high frequency band 112 is generated with different bias frequencies, or the situation when a single signal with a high frequency band 112 is often generated that is shifted using different bias frequencies, or a combination of these circuits.

Параметр сравнения может быть результатом взаимной корреляции или другой величиной, которая указывает, как максимально сигнал с полосой высоких частот 112 с определенной частотой смещения соответствует входному аудио сигналу 102.The comparison parameter may be the result of cross-correlation or another value that indicates how the maximum signal with a high-frequency band 112 with a certain offset frequency corresponds to the input audio signal 102.

Кодер, увеличивающий диапазон частот, 100 может включать основной кодер для кодирования полосы низких частот входного аудио сигнала 102. Основной кодер может работать с частотой перехода, которая соответствует верхней предельной частоте кодируемой полосы низких частот входного аудио сигнала 102. Переходная частота основного кодера может быть постоянной или переменной. Применение переменной частоты перехода усложняет функционирование основного кодера, но может также увеличить гибкость процесса кодирования.The frequency range increasing encoder 100 may include a main encoder for encoding a low frequency band of an input audio signal 102. The main encoder can operate with a transition frequency that corresponds to an upper limit frequency of a coded low frequency band of an input audio signal 102. The transition frequency of the main encoder can be constant or variable. The use of a variable transition frequency complicates the operation of the main encoder, but can also increase the flexibility of the encoding process.

Процесс, показанный на фиг.2 и/или фиг.3 может повторяться для полос с более высокими частотами или патчей. Например, полоса низких частот входного аудио сигнала 102 имеет верхнюю предельную частоту 4 кГц. Таким образом, если полоса нижних частот входного аудио сигнала 102 сдвигается на величину, равную верхней предельной частоте полосы нижних частот, для того, чтобы получить сигнал с полосой высоких часто 112, то сигнал 112 имеет полосу высоких частот с нижней предельной частотой 4 кГц и верхней предельной частотой 8 кГц. Процесс можно повторить, если сдвинуть полосу нижних частот входного аудио сигнала 102 на величину, равную верхней предельной частоте полосы нижних частот, увеличенную в два раза. Так, созданный сигнал с полосой высоких частот 112 будет иметь полосу высоких частот с нижней предельной частотой 8 кГц и верхней предельной частотой 12 кГц. Этот процесс может повторяться до тех пор, пока не будет достигнута необходимая высокая частота.The process shown in FIG. 2 and / or FIG. 3 may be repeated for bands with higher frequencies or patches. For example, the low frequency band of the input audio signal 102 has an upper limit frequency of 4 kHz. Thus, if the lower frequency band of the input audio signal 102 is shifted by an amount equal to the upper limit frequency of the low frequency band, in order to obtain a signal with a high frequency band often 112, then the signal 112 has a high frequency band with a low limit frequency of 4 kHz and upper limiting frequency of 8 kHz. The process can be repeated if you shift the low frequency band of the input audio signal 102 by an amount equal to the upper limit frequency of the low frequency band, doubled. So, the created signal with a high-frequency band 112 will have a high-frequency band with a lower limit frequency of 8 kHz and an upper limit frequency of 12 kHz. This process can be repeated until the required high frequency is reached.

В качестве альтернативы эту процедуру можно осуществить путем создания одного сигнала со множеством полос высоких частот.Alternatively, this procedure can be accomplished by creating a single signal with multiple high frequency bands.

Как показано на примере, ширина полосы низких частот входного аудио сигнала и ширина полосы высоких частот созданного сигнала одинаковы. В качестве альтернативы полоса низких частот входного аудио сигнала может быть растянута или сдвинута для того, чтобы получить сигнал с полосой высоких частот.As shown in the example, the low-frequency bandwidth of the input audio signal and the high-frequency bandwidth of the generated signal are the same. Alternatively, the low frequency band of the input audio signal may be stretched or shifted in order to obtain a signal with a high frequency band.

При определении сигнала с полосой высоких частот 112 с частотой смещения 232, соответствующей определенному параметру сравнения, может остаться пробел между полосой низких частот входного аудио сигнала 102 и полосой высоких частот созданного сигнала 112 в зависимости от частоты смещения 242. Этот пробел можно заполнить путем создания частотных порций, соответствующих пробелу и содержащих, например, шум, ограниченный по полосе. Пробел можно также оставить незаполненным, т.к. качество звука существенно не пострадает.When determining a signal with a high-frequency band 112 with an offset frequency 232 corresponding to a specific comparison parameter, a gap may remain between the low-frequency band of the input audio signal 102 and the high-frequency band of the generated signal 112 depending on the offset frequency 242. This gap can be filled by creating frequency portions corresponding to a space and containing, for example, noise limited in a strip. The space can also be left blank because sound quality will not suffer significantly.

На фиг.4 показана блок-схема кодера, увеличивающего диапазон частот, 400, который создает выходной сигнал 132 в процессе обработки входного аудио сигнала 102 в соответствии с одним из вариантов реализации настоящего изобретения. Кодер, увеличивающий диапазон частот, 400 включает генератор патчей 110, компаратор 120, выходной интерфейс 130, основной кодер 410, полосовой фильтр 420 и блок выделения параметров 430. Основной кодер 410 соединен с выходным интерфейсом 130 и генератором патчей 110, генератор патчей 110 соединен с компаратором 120, компаратор 120 соединен с блоком выделения параметров 430, блок выделения параметров 430 соединен с выходным интерфейсом 130 и полосовой фильтр 420 соединен с компаратором 120.Figure 4 shows a block diagram of an encoder that increases the frequency range, 400, which creates an output signal 132 in the process of processing the input audio signal 102 in accordance with one embodiment of the present invention. The frequency range increasing encoder 400 includes a patch generator 110, a comparator 120, an output interface 130, a main encoder 410, a bandpass filter 420 and a parameter allocation unit 430. A main encoder 410 is connected to an output interface 130 and a patch generator 110, a patch generator 110 is connected to a comparator 120, a comparator 120 is connected to a parameter extraction unit 430, a parameter extraction unit 430 is connected to an output interface 130, and a bandpass filter 420 is connected to a comparator 120.

Генератор патчей 110 может быть реализован как модулятор для создания сигнала с полосой высоких частот 112 на основе входного сигнала 102. Компаратор 120 выполняет сравнение входного аудио сигнала 102, отфильтрованного с помощью полосового фильтра 420, и созданного сигнала с полосой высоких частот 112 на основе их взаимной корреляции. Определение параметра сравнения, соответствующего заранее заданному критерию, может быть также названо вычислением отставания.The patch generator 110 can be implemented as a modulator to create a signal with a high frequency band 112 based on the input signal 102. The comparator 120 compares the input audio signal 102 filtered by the band pass filter 420 and the generated signal with the high frequency band 112 based on their mutual correlations. The determination of a comparison parameter corresponding to a predetermined criterion may also be called lag calculation.

Выходной интерфейс может также иметь функцию блока формирования битового потока и включать блок объединения для соединения низкочастотного сигнала, который обеспечивается основным кодером 410, и параметрического сигнала, включающего параметр, определенный на основе частоты смещения, который обеспечивается блоком выделения параметров 430. Далее выходной интерфейс 130 может включать энтропийный кодер или дифференциальный кодер для уменьшения битрейта выходного сигнала 132. Блок объединения и энтропийный или дифференциальный кодер могут быть частью выходного интерфейса 130, как показано в этом примере, или представлять собой отдельные блоки.The output interface may also have the function of a bitstream generating unit and include a combining unit for connecting the low-frequency signal provided by the main encoder 410 and a parametric signal including a parameter determined based on the offset frequency provided by the parameter allocation unit 430. Further, the output interface 130 may include an entropy encoder or differential encoder to reduce the bitrate of the output signal 132. The combining unit and the entropy or differential encoder may be part of the output interface 130, as shown in this example, or be separate units.

Аудио сигнал 102 может быть разделен на две части: с низкими частотами и высокими частотами. Разделение проводится с помощью фильтра нижних частот основного кодера 410 или полосового фильтра 420. Фильтр нижних частот может быть частью основного кодера 410 или быть независимым фильтром, соединенным с основным кодером 410.The audio signal 102 can be divided into two parts: low frequencies and high frequencies. Separation is carried out using a low-pass filter of the main encoder 410 or a band-pass filter 420. The low-pass filter can be part of the main encoder 410 or be an independent filter connected to the main encoder 410.

Низкочастотная часть обрабатывается основным кодером 410, подобным MPEG 1/2 Layer 3 "МР3" или MPEG 4 AAC standard или голосовым кодером.The low-frequency part is processed by the main encoder 410, similar to MPEG 1/2 Layer 3 "MP3" or MPEG 4 AAC standard or voice encoder.

Полоса низких частот сдвигается на фиксированную величину посредством преобразования полосы боковых частот или быстрого преобразования Фурье (FFT) в частотной области. Таким образом, она располагается выше исходной области низких частот в соответствующем патче. Кроме этого полоса низких частот может быть получена непосредственно из входного сигнала 102 с помощью независимого фильтра нижних частот, соединенного с генератором патчей 110.The low frequency band is shifted by a fixed amount by converting the sideband or fast Fourier transform (FFT) in the frequency domain. Thus, it is located above the original low-frequency region in the corresponding patch. In addition, the low frequency band can be obtained directly from the input signal 102 using an independent low-pass filter connected to the patch generator 110.

В случае постоянных временных интервалов может быть вычислена взаимная корреляция между амплитудно-частотными характеристиками окон исходной высокочастотной полосы (исходного аудио сигнала) и полученной высокочастотной полосы (созданного сигнала с полосой высоких частот). Таким образом может быть определена задержка (частота смещения) для максимальной корреляции. Эта задержка означает корректирующий коэффициент в терминах исходного одностороннего преобразования частотного диапазона, т.е. одностороннее преобразование частотного диапазона может быть дополнительно скорректировано с помощью задержки для того, чтобы довести взаимную корреляцию до максимума. Иными словами, определяется частота смещения, также называемая задержкой, соответствующая параметру сравнения, который, в свою очередь, отвечает заранее заданному критерию. Таким образом, параметр сравнения соответствует взаимной корреляции, а задачей заранее заданного критерия является нахождение максимальной корреляции.In the case of constant time intervals, a cross-correlation between the amplitude-frequency characteristics of the windows of the original high-frequency band (the original audio signal) and the resulting high-frequency band (the generated signal with the high-frequency band) can be calculated. In this way, a delay (offset frequency) can be determined for maximum correlation. This delay means a correction factor in terms of the original one-way frequency range conversion, i.e. one-way frequency range conversion can be further adjusted by delay in order to maximize cross-correlation. In other words, a bias frequency, also called a delay, is determined, corresponding to the comparison parameter, which, in turn, meets a predetermined criterion. Thus, the comparison parameter corresponds to cross-correlation, and the task of a predetermined criterion is to find the maximum correlation.

Дополнительно определяется отношение между абсолютными значениями амплитудно-частотных характеристик. Так вычисляется коэффициент, на который уменьшается или увеличивается полученный высокочастотный сигнал. Иными словами, может быть определен параметр плотности мощности, который обозначает коэффициент мощности, плотностей мощности, абсолютных значений амплитудно-частотных характеристик или других величин, соотносимых с соотношением плотности мощности между полосой высоких частот созданного сигнала 112 и соответствующей полосы частот исходного входного аудио сигнала 102. Процедура проводится компаратором плотности мощности, который может быть частью блока извлечения параметров 430, как показано в данном примере, или независимым блоком. Для определения параметра плотности мощности может быть использован сигнал с полосой высоких частот 112, который был создан путем сдвига полосы низких частот входного аудио сигнала 102 на постоянную частоту или сигнал с полосой высоких частот 112, соответствующий определенному параметру сравнения, или другой созданный сигнал с полосой высоких частот 112. Соответствующая полоса частот в этом случае обозначает полосу частот с одинаковым частотным диапазоном. Например, если полоса высоких частот созданного сигнал включает частоты от 4 кГц до 8 кГц, то соответствующая полоса частот входного аудио сигнала также имеет диапазон от 4 кГц до 8 кГц.Additionally, the relationship between the absolute values of the amplitude-frequency characteristics is determined. This calculates the coefficient by which the received high-frequency signal decreases or increases. In other words, a power density parameter can be determined, which denotes a power factor, power densities, absolute values of amplitude-frequency characteristics or other values correlated with the ratio of the power density between the high frequency band of the generated signal 112 and the corresponding frequency band of the original audio input signal 102. The procedure is carried out by a power density comparator, which can be part of a parameter extraction unit 430, as shown in this example, or an independent unit. To determine the power density parameter, a signal with a high-frequency band 112, which was created by shifting the low-frequency band of the input audio signal 102 by a constant frequency or a signal with a high-frequency band 112 corresponding to a specific comparison parameter, or another created signal with a high-frequency band, can be used 112. The corresponding frequency band in this case denotes a frequency band with the same frequency range. For example, if the high frequency band of the generated signal includes frequencies from 4 kHz to 8 kHz, then the corresponding frequency band of the input audio signal also has a range from 4 kHz to 8 kHz.

Полученные коэффициенты корректировки (частота смещения, параметр плотности мощности), соответствующие задержке и абсолютному значению амплитуды, могут быть интерполированы во времени. Иными словами, возможна интерполяция параметра, полученного для одного окна сигнала (для временного фрейма), на каждый временной период сигнала.The obtained correction factors (bias frequency, power density parameter) corresponding to the delay and the absolute value of the amplitude can be interpolated in time. In other words, it is possible to interpolate the parameter obtained for one window of the signal (for the time frame) for each time period of the signal.

Эта модуляция (контроль) сигнала (параметрического сигнала) или его параметрическая репрезентация может быть сохранена или передана в декодер. Иными словами, параметрический сигнал 432 может быть объединен с полосой низких частот входного аудио сигнала 102, обработанного основным кодером 410, для того, чтобы получить выходной сигнал 132, который может быть сохранен или передан в декодер.This modulation (control) of the signal (parametric signal) or its parametric representation can be stored or transmitted to the decoder. In other words, the parametric signal 432 can be combined with the low frequency band of the input audio signal 102 processed by the main encoder 410 in order to obtain an output signal 132, which can be stored or transmitted to the decoder.

В дополнение могут быть определены параметры для адаптации, например, уровня шума и/или тональности. Вычисления проводятся блоком извлечения параметров 430. Дополнительные параметры добавляются к параметрическому сигналу 432.In addition, parameters for adaptation, for example, noise level and / or tonality, can be defined. The calculations are performed by the parameter extraction unit 430. Additional parameters are added to the parametric signal 432.

Пример, показанный на фиг.4, иллюстрирует вычисления переменных во времени модуляций на стороне кодера. Переменные во времени модуляции в этом случае относятся к сигналам с полосой высоких частот 112 с различными частотами смещения. Частота смещения, соответствующая определенному параметру сравнения, который отвечает заранее заданному критерию, может изменяться во времени.The example shown in FIG. 4 illustrates the computation of time-varying modulations on the encoder side. Variables in modulation time in this case refer to signals with a high-frequency band 112 with different bias frequencies. The bias frequency corresponding to a specific comparison parameter that meets a predetermined criterion may vary over time.

На фиг.5 показана блок-схема декодера, увеличивающего полосу частот, 500, для получения сигнала с увеличенным частотным диапазоном 532 на основе входного аудио сигнала 502 и параметрического сигнала 504 в соответствии с одним из вариантов реализации настоящего изобретения. Параметрический сигнал 504 включает показатель частоты смещения и параметр плотности мощности. Декодер, увеличивающий полосу частот, 500 включает генератор патчей 510, блок объединения 520 и выходной интерфейс 530. Генератор патчей 510 соединен с блоком объединения 520, а блок объединения 520 соединен с выходным интерфейсом 530.FIG. 5 shows a block diagram of a bandwidth increasing decoder 500 for obtaining a signal with an increased frequency range 532 based on an input audio signal 502 and a parametric signal 504 in accordance with one embodiment of the present invention. The parametric signal 504 includes a bias frequency metric and a power density parameter. The bandwidth increasing decoder 500 includes a patch generator 510, a combining unit 520 and an output interface 530. A patch generator 510 is connected to a combining unit 520, and a combining unit 520 is connected to an output interface 530.

Генератор патчей 510 генерирует сигнал с полосой высоких частот 512, который имеет полосу высоких частот, созданную на основе входного аудио сигнала 502. Полоса высоких частот созданного сигнала 512 генерируется на основе частотного сдвига полосы частот входного аудио сигнала 502, при этом частотный сдвиг производится на основе частоты смещения.The patch generator 510 generates a signal with a high frequency band 512, which has a high frequency band created on the basis of the input audio signal 502. The high frequency band of the generated signal 512 is generated based on the frequency shift of the frequency band of the input audio signal 502, while the frequency shift is based on offset frequencies.

Далее генератор патчей 510 увеличивает или уменьшает полосу высоких частот созданного сигнала 512 на коэффициент, равный значению параметра плотности мощности или обратный значению параметра плотности мощности.Next, the patch generator 510 increases or decreases the high frequency band of the generated signal 512 by a factor equal to the value of the power density parameter or inverse to the value of the power density parameter.

Блок объединения 520 соединяет сигнал с полосой высоких частот 512 и входной аудио сигнал 502 для того, чтобы получить аудио сигнал с увеличенным диапазоном частот 532, а выходной интерфейс 530 выводит сигнал с увеличенным диапазоном частот 532.The combiner 520 connects the signal to the high frequency band 512 and the input audio signal 502 in order to receive an audio signal with an increased frequency range 532, and the output interface 530 outputs a signal with an increased frequency range 532.

Создание сигнала с полосой высоких частот 112 на основе частоты смещения позволяет расширить диапазон высоких частот входного аудио сигнала, если, например, частота смещения определяется так, как было указано ранее. Это позволяет улучшить качество звука сигнала с увеличенным диапазоном частот 532.Creating a signal with a high-frequency band 112 based on the bias frequency allows you to expand the high frequency range of the input audio signal, if, for example, the bias frequency is determined as previously indicated. This improves the sound quality of the signal with an increased frequency range of 532.

Кроме этого плотность мощности при расширении полосы высоких частот входного аудио сигнала 502 устанавливается эффективным способом - путем увеличения или уменьшения полосы высоких частот созданного сигнала 112 на коэффициент плотности мощности. В этом случае нет необходимости в корректировке.In addition, the power density when expanding the high-frequency band of the input audio signal 502 is set in an effective way - by increasing or decreasing the high-frequency band of the generated signal 112 by the power density coefficient. In this case, no adjustment is necessary.

Генератор патчей 510 генерирует сигнал с полосой высоких частот 512 при помощи сдвига полосы частот входного аудио сигнала 512 на постоянную частоту, а также на частоту смещения. Если частота смещения указывает на частотный сдвиг к более низким частотам, то блок объединения может проигнорировать часть полосы высоких частот созданного сигнала 512, которая включает частоты ниже верхней предельной частоты входного аудио сигнала 502.The patch generator 510 generates a signal with a high frequency band 512 by shifting the frequency band of the input audio signal 512 by a constant frequency, as well as by an offset frequency. If the bias frequency indicates a frequency shift to lower frequencies, then the combining unit may ignore part of the high frequency band of the generated signal 512, which includes frequencies below the upper frequency limit of the input audio signal 502.

Генератор патчей 510 создает сигнал с полосой высоких частот 512 во временной или частотной области. Во временной области генератор патчей 510 может создавать сигнал с полосой высоких частот 512 на основе одностороннего преобразования диапазона частот.The patch generator 510 generates a signal with a high frequency band 512 in the time or frequency domain. In the time domain, patch generator 510 can generate a signal with a high frequency band 512 based on one-way frequency range conversion.

Кроме этого выходной интерфейс может усиливать выходной сигнал.In addition, the output interface can amplify the output signal.

На фиг.6 показана блок-схема декодера, увеличивающего полосу частот, 600 для получения сигнала с увеличенным диапазоном частот 532 на основе входного аудио сигнала 502 и параметрического сигнала 504 согласно одному из вариантов реализации настоящего изобретения. Декодер, увеличивающий полосу частот, включает генератор патчей 510, блок объединения 520, выходной интерфейс 530, основной декодер 610 и блок извлечения параметров 620. Основной декодер 610 соединен с генератором патчей 510 и блоком объединения 520, блок извлечения параметров 620 соединен с генератором патчей 510 и выходным интерфейсом 530, генератор патчей 510 соединен с блоком объединения 520, а блок объединения 520 соединен с выходным интерфейсом 530.Figure 6 shows a block diagram of a decoder that increases the frequency band, 600 to obtain a signal with an increased frequency range 532 based on the input audio signal 502 and the parametric signal 504 according to one embodiment of the present invention. The bandwidth increasing decoder includes a patch generator 510, a combiner 520, an output interface 530, a main decoder 610 and a parameter extractor 620. A main decoder 610 is connected to a patch generator 510 and a combiner 520, a parameter extractor 620 is connected to a patch generator 510 and an output interface 530, a patch generator 510 is connected to a combining unit 520, and a combining unit 520 is connected to an output interface 530.

Основной декодер 610 декодирует полученный битовый поток 602 и направляет входной аудио сигнал 502 в генератор патчей 510 и блок объединения 520. Входной аудио сигнал 502 может иметь верхнюю предельную частоту, равную частоте перехода основного декодера 610. Частота перехода может быть постоянной или переменной во времени. Переменная во времени обозначает, что она меняется для различных временных интервалов или временных фреймов, но остается постоянной для одного временного интервала или временного фрейма.The main decoder 610 decodes the received bitstream 602 and directs the input audio signal 502 to the patch generator 510 and combining unit 520. The input audio signal 502 may have an upper limit frequency equal to the transition frequency of the main decoder 610. The transition frequency may be constant or variable over time. A time variable means that it changes for different time intervals or time frames, but remains constant for one time interval or time frame.

Блок извлечения параметров 620 может отделять параметрический сигнал 504 от полученного битового потока 602 и направлять его в генератор патчей 510. Кроме этого параметрический сигнал 504 или выделенный параметр шума и/или тональности может быть направлен на выходной интерфейс 530.Parameter extraction unit 620 can separate the parametric signal 504 from the received bitstream 602 and send it to the patch generator 510. In addition, the parametric signal 504 or the selected noise and / or tonality parameter can be directed to the output interface 530.

Генератор патчей 510 может преобразовывать входной аудио сигнал 502 на основе частоты смещения для того, чтобы получить сигнал с полосой высоких частот 512, а также увеличивать или уменьшать сигнал с полосой высоких частот 512 на основе параметра плотности мощности, который находится в параметрическом сигнале 504. Сигнал с полосой высоких частот 512 направляется в блок объединения 530. Иными словами, генератор патчей 510 преобразовывает входной аудио сигнал 502 с помощью частоты смещения и параметра плотности мощности для того, чтобы получить высокочастотный сигнал. Процесс может происходить, например, во временной области с помощью одностороннего преобразования полосы частот 634 совместно с интерполяцией и/или фильтрованием 632 для каждого временного интервала.The patch generator 510 can convert the input audio signal 502 based on the offset frequency in order to obtain a signal with a high-frequency band 512, as well as increase or decrease the signal with a high-frequency band 512 based on the parameter of the power density, which is in the parametric signal 504. The signal with a high frequency band 512 is sent to the combining unit 530. In other words, the patch generator 510 converts the input audio signal 502 using the offset frequency and the power density parameter in order to obtain a high A signal. The process can occur, for example, in the time domain using one-way conversion of the frequency band 634 together with interpolation and / or filtering 632 for each time interval.

Блок объединения 520 соединяет входной аудио сигнал 502 и созданный сигнал с полосой высоких частот 512 для того, чтобы получить сигнал с расширенным диапазоном частот 532.The combining unit 520 connects the input audio signal 502 and the generated signal to the high frequency band 512 in order to obtain a signal with an extended frequency range 532.

Выходной интерфейс 530 выводит сигнал с расширенным диапазоном частот 532 и может дополнительно включать корректирующий блок. Корректирующий блок выполняет коррекцию тональности и/или шума на основе параметров, которые обеспечиваются блоком извлечения параметров 620. Корректирующий блок может быть частью выходного интерфейса 530, как показано на фиг.6, или отдельным блоком. Корректирующий блок может также располагаться между генератором патчей 510 и блоком объединения 520. В этом случае корректирующий блок корректирует тональность и/или шум только созданного сигнала с полосой высоких частот 512. Корректировка тональности и шума входного аудио сигнала 502 может не приниматься во внимание, т.к. входной аудио сигнал 502 соответствует исходному аудио сигналу.The output interface 530 outputs a signal with an extended frequency range 532 and may further include a correction unit. The correction block performs tonality and / or noise correction based on the parameters provided by the parameter extraction unit 620. The correction block may be part of the output interface 530, as shown in FIG. 6, or a separate block. A correction block may also be located between the patch generator 510 and combining block 520. In this case, the correction block corrects the tonality and / or noise of the created signal with a high frequency band 512 only. The correction of the tonality and noise of the input audio signal 502 may not be taken into account, i.e. to. the input audio signal 502 corresponds to the original audio signal.

Обобщая, можно сказать, что декодер, увеличивающий полосу частот, 600 может синтезировать и формировать спектр сигнала с высокой частотой на основе выходного сигнала аудио декодера или основного декодера (входного аудио сигнала при помощи переданной функции преобразования. Переданная функция преобразования обозначает функцию преобразования на основе частоты смещения или параметра плотности мощности. Затем возможно соединение сигналов с высокой частотой и низкой частотой, далее возможно применение параметров для адаптации шума и тональности.Summarizing, it can be said that a band-increasing decoder 600 can synthesize and shape a high-frequency signal spectrum based on the output signal of an audio decoder or a main decoder (input audio signal using a transmitted conversion function. A transmitted conversion function denotes a frequency-based conversion function displacement or power density parameter. Then it is possible to connect signals with high frequency and low frequency, then it is possible to use parameters to adapt noise and tonal nnosti.

На фиг.7 показана схема способа 700 для получения выходного сигнала на основе входного аудио сигнала в соответствии с реализацией настоящего изобретения. Способ включает создание 710, как минимум, одного сигнала с полосой высоких частот, вычисление 720 множества параметров сравнения, выделение 730 параметра сравнения из множества параметров сравнения и обеспечение 740 выходного сигнала для последующей передачи или хранения.7 shows a diagram of a method 700 for obtaining an output signal based on an audio input signal in accordance with an embodiment of the present invention. The method includes creating 710 at least one signal with a high frequency band, computing 720 a plurality of comparison parameters, extracting a 730 comparison parameter from the plurality of comparison parameters and providing 740 an output signal for subsequent transmission or storage.

Созданный сигнал с расширенной полосой частот имеет полосу высоких частот. Полоса высоких частот созданного сигнала основана на полосе низких частот входного аудио сигнала. Различные сигналы с расширенными полосами частот имеют различные частоты в рамках полосы высоких частот.The created signal with an extended frequency band has a high frequency band. The high frequency band of the generated signal is based on the low frequency band of the input audio signal. Different signals with extended frequency bands have different frequencies within the high frequency band.

Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров вычисляется на основе различных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот.The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band.

Выделенный параметр сравнения соответствует заранее заданному критерию.The highlighted comparison parameter matches a predefined criterion.

Выходной сигнал включает индикацию параметра, основанного на частоте смещения, которая соответствует определенному параметру сравнения.The output signal includes an indication of a parameter based on a bias frequency that corresponds to a specific comparison parameter.

На фиг.8 показана схема способа 800 получения аудио сигнала с увеличенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала согласно одному из вариантов реализации настоящего изобретения. В параметрическом сигнале имеется указание на частоту смещения и параметр плотности мощности. Способ включает создание 810 сигнала с полосой высоких частот, увеличение 820 или уменьшение полосы высоких частот сигнала с расширенной полосой частот, объединение 830 сигнала с полосой высоких частот и входного аудио сигнала для получения сигнала с расширенным диапазоном частот и вывод 840 сигнала с расширенным диапазоном частот.On Fig shows a diagram of a method 800 for receiving an audio signal with an increased frequency range based on the input audio signal and a parametric signal according to one embodiment of the present invention. The parametric signal indicates the offset frequency and the power density parameter. The method includes creating an 810 signal with a high frequency band, increasing 820 or decreasing the high frequency band of a signal with an extended frequency band, combining 830 a signal with a high frequency band and an input audio signal to obtain an extended frequency band signal, and outputting an 840 wide band signal.

Сигнал с расширенной полосой частот имеет полосу высоких частот. Полоса высоких частот сигнала с расширенной полосой частот создается 810 на основе сдвига полосы частот входного аудио сигнала. Частотный сдвиг происходит при помощи частоты смещения.An extended band signal has a high frequency band. The high frequency band of the extended band signal is created 810 based on the band shift of the input audio signal. The frequency shift occurs using the offset frequency.

Полоса высоких частот сигнала с расширенной полосой частот увеличивается 820 или уменьшается на коэффициент, равный значению параметра плотности мощности или обратный значению параметра плотности мощности.The high frequency band of a signal with an extended frequency band increases 820 or decreases by a factor equal to the value of the power density parameter or inverse to the value of the power density parameter.

На фиг.9 показана схема способа 900 получения и вывода сигнала на основе входного аудио сигнала согласно одному из вариантов реализации настоящего изобретения. Схема иллюстрирует возможность применения алгоритма на стороне кодера. Последовательность можно описать математически следующим образом. Сигналы реального времени обозначаются прописными латинскими буквами, сигналы, прошедшие этап трансформации Гилберта, обозначаются соответствующими буквами греческого алфавита, сигналы, прошедшие этап трансформации Фурье, - заглавными буквами латинского или греческого алфавита.FIG. 9 shows a diagram of a method 900 for receiving and outputting a signal based on an input audio signal according to one embodiment of the present invention. The diagram illustrates the possibility of applying the algorithm on the encoder side. The sequence can be described mathematically as follows. Real-time signals are indicated in uppercase Latin letters, signals that have passed the Hilbert transformation stage are denoted by the corresponding letters of the Greek alphabet, signals that have passed the Fourier transformation stage are indicated in capital letters of the Latin or Greek alphabet.

Входной сигнал обозначен как f(n), выходной сигнал - о(n).

Figure 00000001
указывает на трансформацию Фурье, j обозначает воображаемое число, трансформация Гилберта Н(.) определяется обычным образом:The input signal is denoted as f (n), the output signal is o (n).
Figure 00000001
indicates the Fourier transform, j denotes an imaginary number, the Hilbert transform H (.) is defined in the usual way:

φ(m):=H(f(n))=F-1(-j·sgn(ω)·F(jω)),φ (m): = H (f (n)) = F -1 (-j sgn (ω) F (jω)),

гдеWhere

F(jω):=F(f(n))F (jω): = F (f (n))

xOver обозначает предельную частоту основного кодера, n∈N обозначает время. kmax>k∈N обозначает k-e расширение или патч. αk обозначает границу полосы воспринимаемых полос, относящихся к xOver в соответствии, например, со шкалой Барка или ERB. В качестве альтернативы αk может увеличиваться линейно, т.е. αk+1k≡константа. Трансформация Гилберта может быть эффективно вычислена при помощи фильтрации сигнала модулированным фильтром нижних частот.xOver denotes the limiting frequency of the main encoder, n∈N denotes time. k max > k∈N denotes ke extension or patch. α k denotes the border of the band of perceived bands related to xOver in accordance, for example, with the Bark scale or ERB. Alternatively, α k may increase linearly, i.e. α k + 1k is a constant. Hilbert transform can be effectively calculated by filtering the signal with a modulated low-pass filter.

Во-первых, может быть создана аналитическая функция модулятора 902 с частотами модуляции αk и результирующими фазовыми инкрементами

Figure 00000002
при временном инкременте
Figure 00000003
(Fs указывает частоту выборки). Математически это можно описать с помощью следующих формул:First, an analytic function of modulator 902 can be created with modulation frequencies α k and resulting phase increments
Figure 00000002
with time increment
Figure 00000003
(Fs indicates the sampling rate). Mathematically, this can be described using the following formulas:

Figure 00000004
Figure 00000004

Figure 00000005
Figure 00000005

Сумму можно заменить только на n, если γk не зависит от n.The sum can be replaced only by n if γ k is independent of n.

Входной аудио сигнал 102 или реальный аудио сигнал f подвергается процессу фильтрации с помощью полосового фильтра до полосы αk+1k, что можно выразить следующим образом:The input audio signal 102 or the real audio signal f is subjected to a filtering process using a band-pass filter to the band α k + 1k , which can be expressed as follows:

fLF=f*filtLF f LF = f * filt LF

В этом случае каждый патч будет иметь одинаковую ширину полосы.In this case, each patch will have the same bandwidth.

В качестве альтернативы входной сигнал f 102 может быть отфильтрован с помощью полосового фильтра до полос αk с различной шириной, что выражается формулой:Alternatively, the input signal f 102 can be filtered using a band-pass filter to the bands α k with different widths, which is expressed by the formula:

Figure 00000006
Figure 00000006

Затем определяются области исходного сигнала, которые должны быть реконструированы с помощью рассматриваемого способа. Области с ограниченными полосами обозначаются как:Then, the areas of the original signal that should be reconstructed using the method under consideration are determined. Bounded areas are designated as:

Figure 00000007
Figure 00000007

и располагаются в интервалах (αk, αk+1).and are located in the intervals (α k , α k + 1 ).

Преобразование входных сигналов, отфильтрованных с помощью фильтра нижних частот, 904 может происходить в частотной или временной области.The conversion of input signals filtered by a low-pass filter, 904 may occur in the frequency or time domain.

В частотной области входные сигналы сначала разбиваются на окна, что выражается следующим образом:In the frequency domain, the input signals are first divided into windows, which is expressed as follows:

Figure 00000008
Figure 00000008

где NFFT - число быстрых преобразований Фурье (например, с частотой дискретизации 512), ξ - количество окон, a win(.) - оконная функция. Окна или временные фреймы могут частично совмещаться в плане времени. Например, формула, приведенная выше, представляет наложение по времени, равное половине окна. N∈N временные интервалы исходного сигнала и связанные с ним множество амплитудно-спектральных характеристик Fξ(ω) при ξ≤N как абсолютные значения преобразования Фурьеwhere NFFT is the number of fast Fourier transforms (for example, with a sampling frequency of 512), ξ is the number of windows, and win (.) is the window function. Windows or time frames can be partially aligned in terms of time. For example, the formula above represents a time overlay equal to half the window. N∈N are the time intervals of the original signal and the associated set of amplitude spectral characteristics F ξ (ω) for ξ≤N as the absolute values of the Fourier transform

Figure 00000009
Figure 00000009

представляют показатель границы полосы k в процессе преобразования Фурье.represent the measure of the boundary of the strip k in the Fourier transform.

Затем сигнал преобразовывается в частотной области при помощи сдвига цифровых результатов FFT-преобразований (быстрых преобразований Фурье). В имплицитном преобразовании Гилберта здесь нет необходимости, но оно позволяет равноценно описать последующие шаги:Then, the signal is converted in the frequency domain by shifting the digital results of the FFT transforms (fast Fourier transforms). There is no need for an implicit Hilbert transform here, but it allows us to describe the next steps in an equivalent way:

Figure 00000010
Figure 00000010

для ω≥0 иfor ω≥0 and

Фξ(ω):=Ψξ(ω):≡0∀ω<0Φ ξ (ω): = Ψ ξ (ω): ≡0∀ω <0

Во временной области трансформация Гилберта 906 входного аудио сигнала f 102 для создания аналитического сигнала 908 производится в первую очередь.In the time domain, the transformation of Hilbert 906 of the input audio signal f 102 to create an analytical signal 908 is performed primarily.

φ:=f+jH(f)φ: = f + jH (f)

иand

Figure 00000011
Figure 00000011

Затем аналитический сигнал

Figure 00000012
подвергается преобразованию при помощи односторонней модуляции полосы частот 710 посредством модулятора µ(n) 902:Then analytical signal
Figure 00000012
undergoes conversion using one-way modulation of the frequency band 710 by means of a modulator µ (n) 902:

Figure 00000013
Figure 00000013

илиor

ψ(n):=φLF(n)·µ(n)ψ (n): = φ LF (n)

В этом случае создается сигнал с расширенной полосой частот, который также называется модулированный сигнал 910.In this case, an extended bandwidth signal is created, which is also called modulated signal 910.

Далее проводится разделение на окна (с возможным наложением) входного сигнала 912 и сигнала с расширенным диапазоном частот 914, а также преобразование Фурье:Next, the window is divided (with possible overlap) of the input signal 912 and the signal with an extended frequency range 914, as well as the Fourier transform:

Figure 00000014
Figure 00000014

иand

Figure 00000015
Figure 00000015

где NFFT - число цифровых результатов (bins) быстрого преобразования Фурье (например, 256, 512, 1024 или другое число в пределах от 24 до 232), ξ - количество окон, win(.) - оконная функция. Временные интервалы N∈N создаются на основе исходного сигнала и связанные с ним множество амплитудно-спектральных характеристик Фξ(ω), Ψξ(ω) при ξ≤N как абсолютные значения преобразования Фурье 916where NFFT is the number of digital results (bins) of the fast Fourier transform (for example, 256, 512, 1024 or another number ranging from 2 4 to 2 32 ), ξ is the number of windows, win (.) is the window function. The time intervals N∈N are created on the basis of the initial signal and the set of amplitude-spectral characteristics Ф ξ (ω), Ψ ξ (ω) associated with it at ξ≤N as absolute values of the Fourier transform 916

Figure 00000016
Figure 00000016

представляют показатель границы полосы k в процессе преобразования Фурье.represent the measure of the boundary of the strip k in the Fourier transform.

Процесс во временной области показан на фиг.9.The process in the time domain is shown in Fig.9.

Следующий этап - это вычисление 720 взаимной корреляции Rξ,k (параметр сравнения может быть равен результату взаимной корреляции) части амплитудно-спектральных характеристик исходного сигнала и сигнала с расширенным диапазоном частот, что математически выражается следующим образом:The next step is the calculation of 720 cross-correlation R ξ, k (the comparison parameter may be equal to the result of cross-correlation) of the amplitude-spectral characteristics of the original signal and the signal with an extended frequency range, which is mathematically expressed as follows:

Figure 00000017
Figure 00000017

приat

Фξ(ω):≡Ψξ(ω):≡0∀ω<0; v≤ΛΦ ξ (ω): ≡Ψ ξ (ω): ≡0∀ω <0; v≤Λ

δ обозначает максимальную задержку (максимальную частоту смещения), для которой рассчитывается взаимная корреляция. Если взаимная корреляция должна быть рассчитана со смещением, т.е. предпочтение отдается небольшим задержкам и, соответственно, большим наложениям, необходимо выбрать β=0. Наоборот, если необходимо компенсировать то, что меньшее число цифровых результатов быстрых преобразований Фурье (FFt-bins) накладываются друг на друга при больших задержках, то необходимо выбрать β=1. В целом, можно произвольно выбирать 0≤β∈P. Дополнительно или в качестве альтернативы можно принять 2<δ∈N; mod(δ,2)=0 для того, чтобы выбрать область взаимной корреляции несколько большую, чем созданная полоса частот (патч). При этом область, которая рассматривается при взаимной корреляции, может быть расширена с помощью

Figure 00000018
с обоих сторон спектра определенной полосы (патча).δ denotes the maximum delay (maximum offset frequency) for which cross-correlation is calculated. If cross-correlation should be calculated with an offset, i.e. preference is given to small delays and, accordingly, large overlays, it is necessary to choose β = 0. On the contrary, if it is necessary to compensate for the fact that a smaller number of digital results of fast Fourier transforms (FFt-bins) overlap each other with large delays, then it is necessary to choose β = 1. In general, 0≤β∈P can be arbitrarily chosen. Additionally or alternatively, 2 <δ∈N; mod (δ, 2) = 0 in order to select the cross-correlation region slightly larger than the created frequency band (patch). Moreover, the region that is considered in cross-correlation can be expanded with
Figure 00000018
on both sides of the spectrum of a certain band (patch).

На основе результатов взаимной корреляции определяется максимум взаимной корреляции 730Based on the results of cross-correlation, the maximum cross-correlation is determined 730

Figure 00000019
Figure 00000019

и lag dξ,k взаимной корреляцииand lag d ξ, k cross-correlation

Rξ,k(dξ,k)=mξ,k R ξ, k (d ξ, k ) = m ξ, k

Дополнительно определяются коэффициенты энергии или мощности в патче при помощи спектров плотности мощности:Additionally, energy or power factors in the patch are determined using power density spectra:

Figure 00000020
Figure 00000020

Если невозможно определить четкого максимума 924, задержка устанавливается обратно как 0 (на схеме показано под номером 922). В противном случае предполагаемая задержка 918 может оказаться задержкой, соответствующей максимальной взаимной корреляции. Для этого определяется подходящий пороговый критерий dξ,k>τ, где необходимо выбрать τ. Кроме этого может наблюдаться изгиб или ровная часть спектра (SFN) взаимной корреляции, например:If it is impossible to determine a clear maximum of 924, the delay is set back to 0 (the diagram shows number 922). Otherwise, the estimated delay 918 may be a delay corresponding to the maximum cross-correlation. For this, a suitable threshold criterion d ξ, k > τ is determined, where it is necessary to choose τ. In addition, a bend or even part of the cross-correlation spectrum (SFN) may be observed, for example:

Figure 00000021
Figure 00000021

илиor

Figure 00000022
Figure 00000022

приat

Figure 00000023
Figure 00000023

Задержки dξ,k и параметры плотности мощности ζξ,k можно интерполировать 926 для того, чтобы получить значение для каждого временного интервала:Delays d ξ, k and power density parameters ζ ξ, k can be interpolated 926 in order to obtain a value for each time interval:

ζk(n)=interp(cξ,k); λk(n)=interp(dξ,k).ζ k (n) = interp (c ξ, k ); λ k (n) = interp (d ξ, k ).

Далее после модификаций, амплитудных преобразований и частотного сдвига определяется общая функция модуляции:Further, after modifications, amplitude transformations and frequency shift, the general modulation function is determined:

Figure 00000024
Figure 00000024

Figure 00000025
Figure 00000025

Общая функция модуляции или параметры общей функции модуляции обеспечиваются 740 вместе с выходным сигналом для дальнейшего хранения или передачи.A common modulation function or parameters of a common modulation function are provided 740 along with an output signal for further storage or transmission.

Дополнительно могут определяться параметры для корректировки шума и/или тональности.Additionally, parameters can be determined to adjust noise and / or tonality.

Модуляция на стороне декодера проводится согласно формуле:Modulation on the side of the decoder is carried out according to the formula:

Figure 00000026
Figure 00000026

а также дополнительно количество k частичных модуляций (если присутствует более чем один патч). Для этого общая функция модуляции µk(n) или µ(n) или параметры ζk(n) и λk(n) или cξ,k и dξ,k общей функции модуляции кодируются подходящим способом, например квантованием. Если есть необходимость, частота выборки может быть уменьшена и введен гистерезис.and also an additional number of k partial modulations (if more than one patch is present). For this, the common modulation function µ k (n) or µ (n) or the parameters ζ k (n) and λ k (n) or c ξ, k and d ξ, k of the general modulation function are encoded in a suitable way, for example, by quantization. If necessary, the sampling rate can be reduced and hysteresis introduced.

Вычисление задержки можно опустить, если отсутствует тональный сигнал, например период молчания, переходного момента, шума. В этих случаях задержка может быть установлена на значении 0.The delay calculation can be omitted if there is no tone, such as a period of silence, a transition moment, noise. In these cases, the delay can be set to 0.

На фиг.10 детально рассматривается пример 1000, где определяется задержка.10, an example 1000 is examined in detail where a delay is determined.

Для временного фрейма или окна ξ=i 1010 задержка v устанавливается на минус λ в качестве первоначального значения. Затем вычисляется взаимная корреляция Rξ,k(v) 720. Если v меньше, чем Λ 1030, v увеличивается 1032 и вычисляется 720 следующий параметр сравнения в рамках взаимной корреляции. Если v равен или больше, чем Λ 1030, может быть определена 730 задержка, соответствующая максимальной вычисленной взаимной корреляции. Если максимум четко определяется 924, то определенная задержка используется как параметр dξ,k 918. В противном случае задержка устанавливается на значении 0 и используется как параметр dξ,k=0922.For a time frame or window ξ = i 1010, the delay v is set to minus λ as the initial value. Then the cross-correlation R ξ, k (v) 720 is calculated. If v is less than Λ 1030, v increases 1032 and 720 the next comparison parameter is calculated within the cross-correlation. If v is equal to or greater than Λ 1030, a delay 730 corresponding to the maximum calculated cross-correlation can be determined. If the maximum is clearly defined 924, then a certain delay is used as the parameter d ξ, k 918. Otherwise, the delay is set to 0 and used as the parameter d ξ, k = 0922.

Далее весь процесс повторяется 1040 для следующего временного фрейма ξ=ξ+1 1050. Определенные задержки подвергаются интерполяции 926 для того, чтобы получить параметр для каждого временного интервала N.Next, the whole process is repeated 1040 for the next time frame ξ = ξ + 1 1050. Certain delays are interpolated 926 in order to obtain a parameter for each time interval N.

Вычисление множества параметров сравнения, например результатов взаимной корреляции, может проводиться параллельно, если используется необходимое количество компараторов. Обработка различных временных фреймов может проводиться также параллельно, если необходимое аппаратное обеспечение используется несколько раз. Цикл вычислений взаимной корреляции начинается при +Λ и может быть уменьшен при каждом цикле до v≤Λ.The calculation of many comparison parameters, for example, cross-correlation results, can be carried out in parallel if the required number of comparators is used. Processing of various time frames can also be carried out in parallel if the necessary hardware is used several times. The cross-correlation calculation cycle starts at + Λ and can be reduced at each cycle to v≤Λ.

На фиг.11 показана схематическая иллюстрация интерполяции 926 частот смещения разных временных фреймов, временных интервалов или окон. На фиг.11а показана интерполяция 1100, если временные фреймы не пересекаются. Задержка dξ,k определяется для всего временного фрейма 1110. Самым простым способом интерполяции параметра для каждого временного интервала 1120 является установка параметров временного фрейма 1110, равных соответствующей задержке dξ,k для всех временных интервалов 1120. На границах временного фрейма может быть выбрана задержка предыдущего или последующего временного фрейма. Например, параметры от λk(n) до λk(n+3) равны dξ,k, а параметры от λk(n+4) до λk(n+7) равны dξ+1,k.11 shows a schematic illustration of interpolation 926 of the offset frequencies of different time frames, time intervals, or windows. 11 a shows interpolation 1100 if time frames do not intersect. The delay d ξ, k is determined for the entire time frame 1110. The easiest way to interpolate the parameter for each time interval 1120 is to set the parameters of the time frame 1110 equal to the corresponding delay d ξ, k for all time intervals 1120. A delay can be selected at the borders of the time frame previous or next time frame. For example, the parameters from λ k (n) to λ k (n + 3) are equal to d ξ, k , and the parameters from λ k (n + 4) to λ k (n + 7) are equal to d ξ + 1, k .

Как альтернатива задержки временных фреймов 1110 могут интерполироваться линейно между временными фреймами, например:Alternatively, the delays of time frames 1110 can be interpolated linearly between time frames, for example:

Figure 00000027
Figure 00000027

Figure 00000028
Figure 00000028

λk(n+2)=dξ,k λ k (n + 2) = d ξ, k

Figure 00000029
Figure 00000029

Figure 00000030
Figure 00000030

На фиг.11В показан пример 1150 для пересекающихся временных фреймов 1110. В этом случае один временной интервал 1120 относится к более чем одному временному фрейму 1110. Таким образом, более чем одна определенная задержка относится к одному временному интервалу 1120. Так, определенные задержки могут интерполироваться 926 для того, чтобы получить один параметр для каждого временного интервала 1120. Определенные задержки, соответствующие одному временному интервалу 1120, могут интерполироваться линейно. Например, возможна следующая интерполяция:11B shows an example 1150 for intersecting time frames 1110. In this case, one time interval 1120 refers to more than one time frame 1110. Thus, more than one specific delay refers to one time interval 1120. Thus, certain delays can be interpolated 926 in order to obtain one parameter for each time interval 1120. Certain delays corresponding to one time interval 1120 can be interpolated linearly. For example, the following interpolation is possible:

λk(n)=dξ-1,k λ k (n) = d ξ-1, k

Figure 00000031
Figure 00000031

λk(n+2)= dξ,k λ k (n + 2) = d ξ, k

Figure 00000032
Figure 00000032

В качестве альтернативы интерполяция может проводиться, например, с помощью медиального фильтрования.Alternatively, the interpolation can be carried out, for example, using medial filtering.

Интерполяция может проводиться с помощью особых средств, предназначенных для интерполяции. Эти средства могут быть частью блока извлечения параметров или выходного интерфейса, а также отдельным блоком.Interpolation can be carried out using special tools designed for interpolation. These tools can be part of a parameter retrieval unit or output interface, as well as a separate unit.

На стороне декодера расширение диапазона частот проводится согласно формуле:On the side of the decoder, the extension of the frequency range is carried out according to the formula:

Figure 00000033
Figure 00000033

После декодирования

Figure 00000034
и φLF(N) как выходного сигнала основного кодера. Дополнительно
Figure 00000035
может быть адаптирован с помощью параметров, полученных заранее от исходного сигнала, по уровню тональности и/или шума.After decoding
Figure 00000034
and φ LF (N) as the output of the main encoder. Additionally
Figure 00000035
can be adapted using parameters obtained in advance from the original signal, according to the level of tonality and / or noise.

Вычисление общей функции модуляции на стороне декодера производится согласно одной из двух формул, указанных ниже:The calculation of the total modulation function on the decoder side is performed according to one of the two formulas indicated below:

Figure 00000036
Figure 00000036

иand

ψ(n)=φLF(n)·µ(n)+noise(n)ψ (n) = φ LF (n) μ (n) + noise (n)

Воображаемая часть сигнала может быть опущена:The imaginary part of the signal can be omitted:

o(n)=Re(ψ(n))o (n) = Re (ψ (n))

Далее, как указывалось выше, может следовать корректировка тональности с помощью, например, обратного фильтрования.Further, as indicated above, a tonality adjustment may be followed by, for example, reverse filtering.

На фиг.12 показана блок-схема декодера, увеличивающего полосу частот, 1200 для получения аудио сигнала с расширенным диапазоном частот 532 на основе входного аудио сигнала 502 согласно одному из вариантов реализации настоящего изобретения. Декодер, увеличивающий полосу частот, 1200 включает генератор патчей 1210, компаратор 1220, блок объединения 1230 и выходной интерфейс 1240. Генератор патчей 1210 соединен с компаратором 1220, компаратор 1220 соединен с блоком объединения 1230, блок объединения 1230 соединен с выходным интерфейсом 1240.12 is a block diagram of a bandwidth increasing decoder 1200 for receiving an extended band audio signal 532 based on an input audio signal 502 according to an embodiment of the present invention. The bandwidth increasing decoder 1200 includes a patch generator 1210, a comparator 1220, a combining unit 1230 and an output interface 1240. A patch generator 1210 is connected to a comparator 1220, a comparator 1220 is connected to a combining unit 1230, a combining unit 1230 is connected to an output interface 1240.

Генератор патчей 1210 создает, как минимум, один сигнал с полосой высоких частот 1212, который имеет полосу высоких частот на основе входного сигнала 502, при этом нижняя предельная частота полосы высоких частот созданного сигнала 1212 ниже, чем верхняя предельная частота входного аудио сигнала 502. Различные сигналы с полосами высоких частот 1212 имеют различные частоты в пределах полосы высоких частот.The patch generator 1210 generates at least one signal with a high-frequency band 1212, which has a high-frequency band based on the input signal 502, while the lower limit frequency of the high frequency band of the generated signal 1212 is lower than the upper limit frequency of the input audio signal 502. Various signals with high-frequency bands 1212 have different frequencies within the high-frequency band.

Компаратор 1220 вычисляет множество параметров сравнения. Параметр сравнения вычисляется на основе сравнения входного аудио сигнала 502 и созданного сигнала с полосой высоких частот 1212. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе различных частот смещения между входным аудио сигналом 502 и созданным сигналом с полосой высоких частот 1212. Далее компаратор выделяет параметр сравнения из множества параметров сравнения так, чтобы он соответствовал заранее заданному критерию.Comparator 1220 computes a plurality of comparison parameters. The comparison parameter is calculated based on the comparison of the input audio signal 502 and the generated signal with the high frequency band 1212. Each comparison parameter from the set of comparison parameters is calculated based on different offset frequencies between the audio input signal 502 and the created signal with the high frequency band 1212. Next, the comparator selects the parameter comparisons from the set of comparison parameters so that it matches a predetermined criterion.

Блок объединения 1230 соединяет входной аудио сигнал 502 и созданный сигнал с полосой высоких частот 1212 для того, чтобы получить сигнал с расширенным диапазоном частот 532, при этом созданный сигнал с полосой высоких частот основывается на частоте смещения, соответствующей выделенному параметру сравнения.The combining unit 1230 connects the input audio signal 502 and the generated signal to the high frequency band 1212 in order to obtain a signal with an extended frequency range 532, while the created signal with the high frequency band is based on the offset frequency corresponding to the selected comparison parameter.

Выходной интерфейс 1240 обеспечивает вывод сигнала с расширенным диапазоном частот 532.The output interface 1240 provides an output signal with an extended frequency range 532.

По сравнению с декодером, показанным на фиг.5, рассматриваемый декодер 1200 сам определяет частоту смещения. Таким образом, отсутствует необходимость в получении этого параметра с входным аудио сигналом 502. В этом случае битрейт для передачи или хранения аудио сигналов может быть уменьшен.Compared to the decoder shown in FIG. 5, the decoder 1200 in question itself determines the offset frequency. Thus, there is no need to obtain this parameter with the input audio signal 502. In this case, the bit rate for transmitting or storing audio signals can be reduced.

Как указывалось при рассмотрении фиг.1, генератор патчей 1210 может создавать множество сигналов с полосой высоких частот с различными частотами смещения или один сигнал с полосой высоких частот, который сдвигается при помощи различных частот смещения. Возможно также использование комбинации двух этих возможностей.As indicated by referring to FIG. 1, patch generator 1210 can generate multiple signals with a high frequency band with different bias frequencies, or a single signal with a high frequency band that is biased using different bias frequencies. It is also possible to use a combination of these two possibilities.

На фиг.13 показана схема способа 1300 получения сигнала с расширенным диапазоном частот согласно одному из вариантов реализации настоящего изобретения. Способ 1300 включает создание 1310, как минимум, одного сигнала с полосой высоких частот, вычисление 1320 мнжества параметров сравнения, выделение 1330 одного параметра из множества параметров сравнения, объединение 1340 входного аудио сигнала и созданного сигнала с полосой высоких частот, а также вывод 1350 сигнала с расширенным диапазоном частот.On Fig shows a diagram of a method 1300 for receiving a signal with an extended frequency range according to one embodiment of the present invention. Method 1300 includes creating 1310 at least one signal with a high frequency band, calculating 1320 the set of comparison parameters, extracting 1330 one parameter from the set of comparison parameters, combining 1340 input audio signal and the created signal with high frequency band, and outputting 1350 signal with extended frequency range.

Сигнал с расширенным диапазоном частот имеет полосу высоких частот, созданную на основе входного аудио сигнала. Нижняя предельная частота полосы высоких частот сигнала с расширенным диапазоном частот ниже, чем верхняя предельная частота входного аудио сигнала. Если генерируются различные сигналы, то сигналы с полосами высоких частот имеют различные частоты в пределах полосы высоких частот.A signal with an extended frequency range has a high frequency band created based on the input audio signal. The lower limit frequency of the high frequency band of the signal with the extended frequency range is lower than the upper limit frequency of the input audio signal. If different signals are generated, then signals with high frequency bands have different frequencies within the high frequency band.

Параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот. Каждый параметр сравнения из множества параметров сравнения вычисляется на основе различных частот смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот.The comparison parameter is calculated based on a comparison of the input audio signal and the generated signal with the high frequency band. Each comparison parameter from a plurality of comparison parameters is calculated based on different bias frequencies between the input audio signal and the generated signal with a high frequency band.

Выделенный параметр сравнения соответствует заранее заданному критерию.The highlighted comparison parameter matches a predefined criterion.

Созданный сигнал с полосой высоких частот, который соединяется с входным аудио сигналом для того, чтобы получить сигнал с расширенным диапазоном частот, основывается на частоте смещения, соответствующей выделенному параметру сравнения.The generated signal with a high frequency band, which is connected to the input audio signal in order to obtain a signal with an extended frequency range, is based on the offset frequency corresponding to the selected comparison parameter.

На фиг.14 показана схема способа 1400 для получения аудио сигнала с расширенным диапазоном частот согласно одному из вариантов реализации настоящего изобретения.On Fig shows a diagram of a method 1400 for receiving an audio signal with an extended frequency range according to one embodiment of the present invention.

После получения 1402 битового потока, содержащего входной аудио сигнал, основной декодер декодирует 1410 входной аудио сигнал. На основе входного аудио сигнала генерируется 1310 сигнал с полосой высоких частот и вычисляется 1320 множество параметров сравнения в плане взаимной корреляции между входным аудио сигналом и созданным сигналом с полосой высоких частот. Затем определяется 1330 параметр сравнения, соответствующий заранее заданному критерию; параметр сравнения также называется предполагаемой задержкой.After receiving 1402 bit stream containing the input audio signal, the main decoder decodes 1410 the input audio signal. Based on the input audio signal, a 1310 signal with a high frequency band is generated and 1320 a plurality of comparison parameters are calculated in terms of mutual correlation between the input audio signal and the generated signal with a high frequency band. Then, a comparison parameter corresponding to a predetermined criterion is determined 1330; The comparison parameter is also called the estimated delay.

На основе частоты смещения, которая соответствует определенному параметру сравнения, модулятор модулирует 1420 входной аудио сигнал. Дополнительно может быть извлечен 1430 параметр из полученного битового потока 1402 для адаптации, например, плотности мощности модулированного сигнала. Модулированный сигнал затем соединяется 1340 с входным аудио сигналом. Кроме этого могут корректироваться 1440 тональность и шум сигнала с расширенным диапазоном частот. Этот этап может проводиться до объединения с входным сигналом. Затем аудио данные, а именно аудио сигнал с расширенным диапазоном частот, направляются 1350, например, для аудио воспроизведения.Based on a bias frequency that corresponds to a specific comparison parameter, the modulator modulates 1420 the input audio signal. Additionally, a parameter 1430 may be extracted from the received bitstream 1402 to adapt, for example, the power density of the modulated signal. The modulated signal is then connected 1340 to the input audio signal. In addition, the 1440 tone and noise of a signal with an extended frequency range can be adjusted. This step may be carried out before combining with the input signal. Then, audio data, namely an audio signal with an extended frequency range, is sent 1350, for example, for audio playback.

В данном случае вычисление модуляции, которая является непостоянной во времени, проводится на стороне декодера.In this case, the calculation of the modulation, which is variable over time, is carried out on the side of the decoder.

В отличие от модулятора, который модулирует 1420 входной аудио сигнал и создает патч, может использоваться, например, ранее созданный сигнал с полосой высоких частот, либо генератор патчей может создавать сигнал с полосой высоких частот (патч) на основе частоты смещения, которая соответствует определенному параметру сравнения.Unlike a modulator that modulates the input audio signal 1420 and creates a patch, for example, a previously created signal with a high frequency band can be used, or a patch generator can create a signal with a high frequency band (patch) based on an offset frequency that corresponds to a certain parameter comparisons.

Иными словами, если низкая скорость передачи данных более приоритетна, чем сложная структура декодера, то определение частотной модуляции, которую выполняют модуляторы, может также проводиться на стороне декодера. Для этого на стороне декодера с некоторыми изменениями выполняется алгоритм, показанный на фиг.9. Так как на стороне декодера исходный сигнал не доступен для вычисления взаимной корреляции, корреляция вычисляется между исходным сигналом (входным аудио сигналом) и исходным сигналом (входным аудио сигналом), который подвергся сдвигу в области пересечения. Например, сигнал сдвигается между нулем и αk, например, αk делится на 2, αk делится на 3 или αk делится на 4. αk обозначает границу полосы k, например, α1 обозначает частоту перехода основного кодера.In other words, if a low data rate is more important than the complex structure of the decoder, then the determination of the frequency modulation that the modulators perform can also be done on the side of the decoder. To this end, on the decoder side, with some changes, the algorithm shown in Fig. 9 is executed. Since on the decoder side the original signal is not available for calculating cross-correlation, the correlation is calculated between the original signal (audio input signal) and the original signal (audio input signal), which has undergone a shift in the intersection area. For example, the signal shifts between zero and α k , for example, α k is divided by 2, α k is divided by 3 or α k is divided by 4. α k denotes the boundary of the strip k, for example, α 1 denotes the transition frequency of the main encoder.

Вычисления могут происходить аналогичным образом как на стороне кодера, так и на стороне декодера. На стороне декодера извлекаются параметры для формирования спектра, корректировки шума и/или тональности, которые затем передаются в декодер.Calculations can occur in the same way on the encoder side as well as on the decoder side. On the decoder side, parameters are extracted to form the spectrum, adjust noise and / or tonality, which are then transmitted to the decoder.

На фиг.15 показана блок-схема кодера, увеличивающего полосу частот, 1500 для получения выходного сигнала на основе входного сигнала согласно одному из вариантов реализации настоящего изобретения. Кодер 1500 соответствует кодеру, показанному на фиг.4. Однако кодер 1500 сам не обеспечивает выходной сигнал 132 с индикацией параметра на основе частоты смещения. Он может только определять параметр плотности мощности и факультативные параметры для коррекции тональности и шума и включать индикацию этих параметров в выходной сигнал 132. Параметр плотности мощности (как и другие параметры в случае их вычисления) определяются на основе частоты смещения, соответствующей выделенному параметру сравнения.On Fig shows a block diagram of an encoder that increases the frequency band, 1500 to obtain an output signal based on the input signal according to one embodiment of the present invention. Encoder 1500 corresponds to the encoder shown in FIG. However, the encoder 1500 itself does not provide an output signal 132 with an indication of the parameter based on the offset frequency. It can only determine the power density parameter and optional parameters for correcting tonality and noise and include the indication of these parameters in the output signal 132. The power density parameter (like other parameters in the case of their calculation) are determined based on the offset frequency corresponding to the selected comparison parameter.

Например, параметр плотности мощности может указывать соотношение между входным аудио сигналом 102 и созданным сигналом с полосой высоких частот с частотой смещения, соответствующей определенному параметру сравнения. Таким образом, индикация параметра, которая соотносится с параметром плотности мощности и факультативно - с параметрами корректировки тональности и/или шума, основана на частоте смещения, соответствующей определенному параметру сравнения.For example, the power density parameter may indicate the relationship between the input audio signal 102 and the generated signal with a high frequency band with an offset frequency corresponding to a specific comparison parameter. Thus, the indication of the parameter, which correlates with the parameter of the power density and optionally with the parameters for adjusting the tonality and / or noise, is based on the offset frequency corresponding to a certain comparison parameter.

Следующее различие между кодером 1500 и кодером, показанным на фиг.4, заключается в том, что генератор патчей 110 создает сигнал с полосой высоких частот таким же образом, что и генератор патчей декодера 1400. В этом случае кодер 1500 и декодер могут получать одинаковые частоты смещения, поэтому параметры, извлеченные кодером 1500, действительны и для патчей, созданных декодером.The next difference between the encoder 1500 and the encoder shown in FIG. 4 is that the patch generator 110 generates a signal with a high frequency band in the same way as the patch generator of the decoder 1400. In this case, the encoder 1500 and the decoder can receive the same frequencies offsets, so the parameters extracted by encoder 1500 are also valid for patches created by the decoder.

Некоторые варианты настоящего изобретения реализуются посредством устройств и способа расширения полосы частот аудио сигналов во временной области с помощью модуляторов, изменяющихся во времени. Иными словами, патч генерируется с меняющейся предельной частотой, например, для каждого временного интервала, каждого временного фрейма, части временного фрейма или групп временных фреймов.Some variants of the present invention are implemented by means of devices and a method of expanding the frequency band of audio signals in the time domain using modulators that vary in time. In other words, a patch is generated with a changing limit frequency, for example, for each time interval, each time frame, part of a time frame, or groups of time frames.

Описанный способ расширения полосы частот аудио сигнала может применяться на стороне кодера и на стороне декодера, а также только на стороне декодера. В отличие от других известных способов, описанный новый способ может выполнять так называемое гармоническое расширение полосы частот, не требуя точной информации о фундаментальной частоте аудио сигнала. В отличие от так называемых гармонических расширений полосы частот, рассматриваемых, например, в заявке на патент на территории США "F.Nagel, S.Disch: "Apparatus and method of harmonic bandwidth extension in audio signals"" под номером US 61/025129, которые производятся при помощи фазовых голосовых кодеров, в данном случае спектр не подвергается расширению, поэтому плотность остается неизменной. Для обеспечения гармонии используется корреляция между расширенной и базовой полосами частот. Эта корреляция вычисляется как на стороне кодера, так и на стороне декодера в зависимости от возможности проведения вычислений, объемов памяти и скорости передачи данных.The described method of expanding the frequency band of an audio signal can be applied on the encoder side and on the decoder side, and also only on the decoder side. Unlike other known methods, the described new method can perform the so-called harmonic extension of the frequency band without requiring accurate information about the fundamental frequency of the audio signal. In contrast to the so-called harmonic bandwidth extensions, considered, for example, in the patent application in the United States "F.Nagel, S. Disch:" Apparatus and method of harmonic bandwidth extension in audio signals "" under the number US 61/025129, which are produced using phase voice encoders, in this case, the spectrum is not subject to expansion, so the density remains unchanged. To ensure harmony, a correlation is used between the extended and base frequency bands. This correlation is calculated both on the side of the encoder and on the side of the decoder, depending on the possibility of the calculations, the amount of memory and the data rate.

Например, расширение полосы частот может выполняться при помощи амплитудной модуляции (AM) или частотного сдвига посредством односторонней модуляции полосы частот (SSB). В ходе последующей обработки в соответствии с дополнительными параметрами предпринимается попытка приблизить огибающую спектра, уровень шума и другие параметры к исходным сигналам.For example, bandwidth expansion can be performed using amplitude modulation (AM) or frequency shift through one-way bandwidth modulation (SSB). In the course of the subsequent processing, in accordance with additional parameters, an attempt is made to bring the spectral envelope, noise level and other parameters to the original signals.

Новый способ преобразования сигналов позволяет избежать проблем, которые появляются при простом копировании или при операции зеркального отображения, т.к. в данном случае создается гармоническое корректное продолжение спектра при помощи меняющейся во времени предельной переходной частоты между диапазоном низких частот (LF) и диапазоном высоких частот (HF), а также между последующими полосами высоких частот, так называемыми патчами. Предельные частоты выбираются таким образом, что созданные патчи максимально соответствуют реальному гармоническому растру.The new signal conversion method avoids the problems that arise during simple copying or during the mirroring operation, as in this case, a harmonious correct continuation of the spectrum is created with the help of a time-varying transition frequency limit between the low frequency range (LF) and the high frequency range (HF), as well as between subsequent high frequency bands, the so-called patches. Limit frequencies are selected in such a way that the created patches match the actual harmonic raster as much as possible.

На фиг.16 показан модулятор с тремя меняющимися во времени амплитудами и предельными частотами, с помощью которых могут быть созданы три патча посредством односторонней модуляции базовых полос. На фиг.16А показана диаграмма 1600А спектра сигнала с расширенным диапазоном частот при использовании меняющихся во времени предельных частот 1610. На фиг.16В показана диаграмма 1600В спектра аудио сигнала, состоящего из трех тонов. В отличие от спектрограммы, показанной на фиг.18В, линии 1620 значительно менее размыты.On Fig shows a modulator with three time-varying amplitudes and limit frequencies, with which three patches can be created by one-way modulation of the base bands. On figa shows a diagram 1600A of the spectrum of the signal with an extended frequency range when using time-varying limit frequencies 1610. On figv shows a diagram 1600B of the spectrum of the audio signal, consisting of three tones. In contrast to the spectrogram shown in FIG. 18B, lines 1620 are significantly less blurred.

На фиг.17 показана диаграмма 1700. Спектр плотности мощности трех тонов исходного аудио сигнала показан под номером 1710, сигнала с постоянной предельной частотой - под номером 1720, сигнала с переменной предельной частотой - под номером 1730. В отличие от использования постоянной предельной частоты, гармоническая структура сохраняется при использовании переменной предельной частоты 1730.17 shows a diagram 1700. The power density spectrum of the three tones of the original audio signal is shown at 1710, the signal with a constant limit frequency at 1720, the signal with a constant limit frequency at 1730. In contrast to using a constant limit frequency, harmonic the structure is preserved using a variable limiting frequency of 1730.

При гармоническом продолжении спектра можно избежать проблем в точке перехода между базовой полосой (основной кодер) и расширенной полосой, а также между последующими патчами. Без оценки F0, которая является необходимым условием функционирования системы, возможно гармоническое продолжение случайных сигналов без слышимых помех, при этом не нарушаются гармония и переходные звуковые моменты.With harmonious continuation of the spectrum, problems can be avoided at the transition point between the base band (main encoder) and the extended band, as well as between subsequent patches. Without an estimate of F 0 , which is a necessary condition for the functioning of the system, a harmonic continuation of random signals without audible interference is possible, while harmony and transient sound moments are not violated.

Варианты реализации настоящего изобретения относятся к способу, который подходит для всех аудио приложений, где не доступен полный диапазон частот.Embodiments of the present invention relate to a method that is suitable for all audio applications where the full frequency range is not available.

Например, способ можно применять для трансляции аудио информации с помощью цифрового радио, Интернет потока или приложений, применяющих аудио коммуникацию.For example, the method can be used to broadcast audio information using digital radio, the Internet stream or applications that use audio communication.

Другие варианты реализации настоящего изобретения относятся к декодеру, увеличивающему полосу частот, который получает сигнал с расширенным диапазоном частот на основе входного аудио сигнала и параметрического сигнала, при этом параметрический сигнал указывает на частоту сдвига и параметр плотности мощности. Декодер, увеличивающий полосу частот, включает генератор патчей, блок объединения и выходной интерфейс. Генератор патчей создает сигнал с полосой высоких частот, при этом полоса высоких частот созданного сигнала генерируется на основе частотного сдвига полосы частот входного аудио сигнала. Частотный сдвиг производится на основе частоты смещения. Генератор патчей увеличивает или уменьшает полосу высоких частот созданного сигнала при помощи коэффициента, равного значению параметра плотности мощности или равного величине, обратной значению параметра плотности мощности. Блок объединения соединяет созданный сигнал с полосой высоких частот и входной аудио сигнал для получения аудио сигнала с расширенным диапазоном частот. Выходной интерфейс обеспечивает вывод сигнала с расширенным диапазоном частот.Other embodiments of the present invention relate to a bandwidth increasing decoder that receives a signal with an extended frequency range based on an input audio signal and a parametric signal, wherein the parametric signal indicates a shift frequency and a power density parameter. The bandwidth increasing decoder includes a patch generator, a combiner, and an output interface. The patch generator creates a signal with a high frequency band, and the high frequency band of the generated signal is generated based on the frequency shift of the frequency band of the input audio signal. Frequency offset is based on the offset frequency. The patch generator increases or decreases the high frequency band of the generated signal by using a coefficient equal to the value of the power density parameter or equal to the value inverse to the value of the power density parameter. The combining unit connects the generated signal with a high frequency band and an input audio signal to obtain an audio signal with an extended frequency range. The output interface provides a signal output with an extended frequency range.

Остальные варианты реализации настоящего изобретения относятся к декодеру, увеличивающему полосу частот, который был описан выше, при этом генератор патчей увеличивает или уменьшает полосу высоких частот сигнала с полосой высоких частот при помощи коэффициента, равного значению параметра плотности мощности или равного величине, обратной значению параметра плотности мощности. Параметр плотности мощности в данном случае указывается во входном аудио сигнале.Other embodiments of the present invention relate to a decoder increasing the frequency band as described above, wherein the patch generator increases or decreases the high frequency band of the signal with the high frequency band by a factor equal to the value of the power density parameter or equal to the reciprocal of the density parameter power. The power density parameter in this case is indicated in the input audio signal.

Несмотря на то что настоящее изобретение было описано в нескольких вариантах реализации, возможны другие изменения и варианты функционирования в рамках данного изобретения. Необходимо отметить, что существует множество альтернативных способов реализации способов, а также путей композиции настоящего изобретения. Предполагается, что нижеследующая формула включает все подобные опции и изменения, т.к. они не выходят за рамки объема и сущности настоящего изобретения.Despite the fact that the present invention has been described in several embodiments, other changes and functioning options are possible within the scope of this invention. It should be noted that there are many alternative ways to implement the methods, as well as the ways of composition of the present invention. The following formula is intended to include all such options and changes as they do not go beyond the scope and essence of the present invention.

Необходимо отметить, что в зависимости от условий схема изобретения может быть реализована в качестве программного обеспечения. Реализация изобретения может быть произведена на цифровых средствах хранения информации. Например, на гибком диске или CD, которые являются читаемыми и имеют возможность работы с программируемой компьютерной системой для того, чтобы выполнялся соответствующий способ. В целом, изобретение состоит из компьютерного программного продукта с программным кодом, который хранится на читаемом носителе, для осуществления изобретенного способа, когда программный продукт выполняется на компьютере. Иными словами, изобретение может быть реализовано как компьютерная программа с программным кодом для осуществления способа, когда компьютерный программный продукт выполняется на компьютере.It should be noted that, depending on the conditions, the scheme of the invention can be implemented as software. The implementation of the invention can be made on digital storage media. For example, on a floppy disk or CD, which are readable and have the ability to work with a programmable computer system in order to perform the corresponding method. In general, the invention consists of a computer program product with program code that is stored on a readable medium for implementing the inventive method when the program product is executed on a computer. In other words, the invention can be implemented as a computer program with program code for implementing the method when the computer program product is executed on a computer.

Claims (17)

1. Аудио кодер (100), (400), (1500) для получения выходного сигнала (132) с использованием входного сигнала (101), включающий генератор патчей (110), предназначенный для генерации, как минимум, одного высокочастотного сигнала с расширенной полосой частот (112), который содержит полосу высоких частот, основанную на полосе низких частот входного аудиосигнала (102), при этом, если генерируются разные высокочастотные сигналы с расширенной полосой частот (112), они содержат разные частоты в своих полосах;
компаратор (120) вычисляет множество параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудиосигнала (102) и созданного сигнала с полосой высоких частот (112); каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудиосигналом (102) и созданным сигналом с полосой высоких частот (112); компаратор (120) определяет один параметр сравнения из множества параметров сравнения так, чтобы выделенный параметр сравнения соответствовал заранее заданному критерию;
выходной интерфейс (130) обеспечивает выходной сигнал (132) для последующей передачи или хранения, при этом выходной сигнал (132) включает параметр на основе частоты смещения, который соответствует определенному параметру сравнения.
1. Audio encoder (100), (400), (1500) to obtain the output signal (132) using the input signal (101), including a patch generator (110), designed to generate at least one high-frequency signal with an extended band frequencies (112), which contains a high frequency band based on the low frequency band of the input audio signal (102), while if different high-frequency signals with an extended frequency band (112) are generated, they contain different frequencies in their bands;
a comparator (120) calculates a plurality of comparison parameters, wherein the comparison parameter is calculated based on a comparison of the input audio signal (102) and the generated signal with the high frequency band (112); each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal (102) and the generated signal with a high frequency band (112); the comparator (120) determines one comparison parameter from the set of comparison parameters so that the selected comparison parameter corresponds to a predetermined criterion;
the output interface (130) provides an output signal (132) for subsequent transmission or storage, while the output signal (132) includes a parameter based on a bias frequency that corresponds to a specific comparison parameter.
2. Аудио кодер по п.1, включающий компаратор плотности мощности (430), который сравнивает параметры на основе плотности мощности полосы высоких частот созданного сигнала с полосой высоких частот (112) и соответствующей полосы входного аудио сигнала (102) для получения параметра плотности мощности; параметр плотности мощности указывает на соотношение плотности мощности полосы высоких частот созданного сигнала с полосой высоких частот (112) и соответствующей полосы частот входного аудио сигнала (102); индикация параметра выходного аудио сигнала (132) основана на параметре плотности мощности.2. The audio encoder according to claim 1, including a power density comparator (430), which compares the parameters based on the power density of the high frequency band of the generated signal with the high frequency band (112) and the corresponding band of the input audio signal (102) to obtain a power density parameter ; the power density parameter indicates the ratio of the power density of the high-frequency band of the generated signal with the high-frequency band (112) and the corresponding frequency band of the input audio signal (102); the indication of the output audio signal parameter (132) is based on the power density parameter. 3. Аудио кодер по п.1, в котором компаратор выполняет сравнение входного аудио сигнала и созданного сигнала с полосой высоких частот путем вычисления результата взаимной корреляции входного аудио сигнала и созданного сигнала с полосой высоких частот; вычисляемый параметр сравнения основывается на результате взаимной корреляции; параметр взаимной корреляции представляет собой частоту смещения сигнала с полосой высоких частот и, таким образом, соотносится с вычисляемым параметром сравнения.3. The audio encoder according to claim 1, in which the comparator compares the input audio signal and the generated signal with the high frequency band by calculating the result of the mutual correlation of the input audio signal and the generated signal with the high frequency band; the calculated comparison parameter is based on the result of cross-correlation; the cross-correlation parameter is the frequency of the signal offset with the high-frequency band and, thus, correlates with the calculated comparison parameter. 4. Декодер расширения полосы пропускания (500), (600) для получения аудио сигнала с расширенным диапазоном частот (532) на основе входного аудио сигнала (502) и параметрического сигнала (504), при этом параметрический сигнал (504) включает указание на частоту смещения и параметр плотности мощности; декодер, увеличивающий полосу частот, включающий генератор патчей (510), который создает сигнал с полосой высоких частот (512), при этом полоса высоких частот сигнала с полосой высоких частот (512) создается на основе частотного сдвига полосы частот входного аудио сигнала (502); частотный сдвиг основан на частоте смещения; генератор патчей (510) увеличивает или уменьшает полосу высоких частот сигнала с полосой высоких частот (512) на коэффициент, равный значению параметра плотности мощности или, соответственно, равный обратному значению параметра плотности мощности;
блок объединения (529), который соединяет сигнал с полосой высоких частот (512) и входной аудио сигнал (502) для получения сигнала с расширенным диапазоном частот (532);
при этом блок объединения предусматривает возможность пренебрегать частью полосы высоких частот ВЧ-сигнала с расширенной полосой (512), где пренебрегаемая часть высокочастотной полосы ВЧ-сигнала с расширенной полосой (512) содержит частоты, более низкие, чем верхняя частота среза входного аудиосигнала (502); и
выходной интерфейс (530) обеспечивает вывод сигнала с расширенным диапазоном частот (532).
4. The bandwidth expansion decoder (500), (600) for receiving an audio signal with an extended frequency range (532) based on the input audio signal (502) and the parametric signal (504), while the parametric signal (504) includes an indication of the frequency bias and power density parameter; a bandwidth increasing decoder including a patch generator (510) that generates a signal with a high frequency band (512), wherein the high frequency band of the signal with the high frequency band (512) is created based on the frequency shift of the frequency band of the input audio signal (502) ; frequency offset is based on the offset frequency; the patch generator (510) increases or decreases the high frequency band of the signal with the high frequency band (512) by a factor equal to the value of the power density parameter or, correspondingly, equal to the inverse of the power density parameter;
a combining unit (529) that connects the signal to the high frequency band (512) and the input audio signal (502) to obtain a signal with an extended frequency range (532);
however, the combining unit provides the ability to neglect part of the high frequency band of the RF signal with an extended band (512), where the neglected part of the high frequency band of the RF signal with an extended band (512) contains frequencies lower than the upper cut-off frequency of the input audio signal (502) ; and
the output interface (530) provides a signal output with an extended frequency range (532).
5. Декодер по п.4, включающий основной декодер (610), который генерирует входной аудио сигнал (502) на основе кодированного входного аудио сигнала (602), при этом основной декодер (610) генерирует входной сигнал (502) с постоянной верхней предельной частотой; генератор патчей (510) генерирует полосу высоких частот сигнала с полосой высоких частот (512) при помощи сдвига полосы частот входного аудио сигнала (502) на частоту, равную верхней предельной частоте входного аудио сигнала (502) совместно с частотой сдвига.5. The decoder according to claim 4, including the main decoder (610), which generates an input audio signal (502) based on the encoded input audio signal (602), while the main decoder (610) generates an input signal (502) with a constant upper limit frequency; a patch generator (510) generates a high frequency band of a signal with a high frequency band (512) by shifting the frequency band of the input audio signal (502) by a frequency equal to the upper limit frequency of the input audio signal (502) together with the shift frequency. 6. Декодер по п.4, в котором генератор патчей (510) генерирует сигнал с полосой высоких частот (512) во временной области.6. The decoder according to claim 4, in which the patch generator (510) generates a signal with a high frequency band (512) in the time domain. 7. Декодер по п.6, в котором генератор патчей (510) генерирует сигнал с полосой высоких частот (512) на основе односторонней модуляции полосы частот.7. The decoder according to claim 6, in which the patch generator (510) generates a signal with a high frequency band (512) based on one-way modulation of the frequency band. 8. Декодер расширения полосы пропускания (1200) для получения сигнала с расширенным диапазоном частот (532) на основе входного аудио сигнала (502), включающий генератор патчей (1210), который генерирует, как минимум, один сигнал с полосой высоких частот (1212), имеющий полосу высоких частот на основе входного сигнала (502), при этом нижняя предельная частота полосы высоких частот созданного сигнала с полосой высоких частот (1212) ниже, чем верхняя предельная частота входного аудио сигнала (502); если генерируются разные сигналы с полосами высоких частот (1212), то сигналы (1212) имеют разные частоты в рамках полос высоких частот;
компаратор (1220) вычисляет множество параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала (502) и созданного сигнала с полосой высоких частот (1212); каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом (502) и созданным сигналом с полосой высоких частот (1212);
компаратор (1220) определяет один параметр сравнения из множества параметров сравнения так, чтобы выделенный параметр сравнения соответствовал заранее заданному критерию;
блок объединения (1230) соединяет входной аудио сигнал (502) и сигнал с полосой высоких частот для получения сигнала с расширенным диапазоном частот (532), при этом созданный сигнал с полосой высоких частот, который используется для получения сигнала с расширенным диапазоном частот (532), основан на частоте смещения, соответствующей определенному параметру сравнения;
выходной интерфейс (1240) обеспечивает вывод сигнала с расширенным диапазоном частот (532).
8. A bandwidth expansion decoder (1200) for receiving a signal with an extended frequency range (532) based on an input audio signal (502), including a patch generator (1210) that generates at least one signal with a high frequency band (1212) having a high frequency band based on an input signal (502), wherein the lower limit frequency of the high frequency band of the generated signal with the high frequency band (1212) is lower than the upper limit frequency of the input audio signal (502); if different signals with high frequency bands (1212) are generated, then signals (1212) have different frequencies within the high frequency bands;
a comparator (1220) calculates a plurality of comparison parameters, wherein the comparison parameter is calculated based on a comparison of the input audio signal (502) and the generated signal with the high frequency band (1212); each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal (502) and the generated signal with a high frequency band (1212);
the comparator (1220) determines one comparison parameter from the set of comparison parameters so that the selected comparison parameter matches a predetermined criterion;
the combining unit (1230) connects the input audio signal (502) and the signal with a high frequency band to obtain a signal with an extended frequency range (532), while the generated signal with a high frequency band that is used to obtain a signal with an extended frequency range (532) based on a bias frequency corresponding to a specific comparison parameter;
the output interface (1240) provides a signal output with an extended frequency range (532).
9. Декодер, по п.8, в котором генератор патчей (1210) увеличивает или уменьшает полосу высоких частот сигнала с полосой высоких частот (1212) на коэффициент, равный значению параметра плотности мощности или, соответственно, равный обратному значению параметра плотности мощности, при этом индикация параметра плотности мощности содержится во входном аудио сигнале (502).9. The decoder of claim 8, in which the patch generator (1210) increases or decreases the high frequency band of the signal with the high frequency band (1212) by a factor equal to the value of the power density parameter or, correspondingly, equal to the inverse of the power density parameter, The indication of the power density parameter is contained in the input audio signal (502). 10. Декодер по п.4, который имеет средства интерполяции, при этом временной фрейм включает множество временных интервалов; каждый временной фрейм имеет соответствующую частоту смещения; при помощи средств интерполяции частота смещения временного фрейма или множество частот смещения разных временных фреймов подвергаются интерполяции для каждого временного интервала временного фрейма для того, чтобы получить интерполированную частоту смещения для каждого временного интервала.10. The decoder according to claim 4, which has interpolation means, wherein the time frame includes a plurality of time intervals; each time frame has a corresponding offset frequency; by means of interpolation, the offset frequency of the time frame or a plurality of offset frequencies of different time frames are interpolated for each time interval of the time frame in order to obtain an interpolated offset frequency for each time interval. 11. Декодер расширения полосы пропускания по п.8, в котором компаратор выполняет сравнение входного аудио сигнала и созданного сигнала с полосой высоких частот путем вычисления результата взаимной корреляции входного аудио сигнала и созданного сигнала с полосой высоких частот; вычисляемый параметр сравнения основывается на результате взаимной корреляции; параметр взаимной корреляции представляет собой частоту смещения сигнала с полосой высоких частот и, таким образом, соотносится с вычисляемым параметром сравнения.11. The bandwidth expansion decoder of claim 8, wherein the comparator compares the input audio signal and the generated signal with the high frequency band by calculating the result of cross-correlation of the input audio signal and the generated signal with the high frequency band; the calculated comparison parameter is based on the result of cross-correlation; the cross-correlation parameter is the frequency of the signal offset with the high-frequency band and, thus, correlates with the calculated comparison parameter. 12. Способ (700) получения выходного сигнала с использованием входного аудио сигнала, включающий создание (710), как минимум, одного сигнала с расширенной полосой частот, при этом созданный сигнал имеет полосу высоких частот; полоса высоких частот созданного сигнала основывается на полосе низких частот входного аудио сигнала; если генерируются разные сигналы с полосами высоких частот, то созданные сигналы имеют разные частоты в рамках полос высоких частот;
вычисление (720) множества параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот; каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот;
определение (730) параметра сравнения из множества параметров сравнения, при этом выделенный параметр сравнения соответствует заранее заданному критерию;
обеспечение (740) выходного сигнала для последующей передачи или хранения, при этом выходной сигнал включает индикацию параметра на основе частоты смещения, которая соответствует определенному параметру сравнения.
12. A method (700) for obtaining an output signal using an input audio signal, including generating (710) at least one signal with an extended frequency band, wherein the generated signal has a high frequency band; the high frequency band of the generated signal is based on the low frequency band of the input audio signal; if different signals with high frequency bands are generated, then the created signals have different frequencies within the high frequency bands;
calculating (720) a plurality of comparison parameters, wherein the comparison parameter is calculated based on comparing the input audio signal and the generated signal with the high frequency band; each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal and the generated signal with a high frequency band;
determining (730) a comparison parameter from a plurality of comparison parameters, wherein the highlighted comparison parameter corresponds to a predetermined criterion;
providing (740) an output signal for subsequent transmission or storage, wherein the output signal includes an indication of a parameter based on an offset frequency that corresponds to a specific comparison parameter.
13. Способ (800) формирования аудио сигнала с расширенной полосой частот на основе входного аудиосигнала и параметрического сигнала, содержащего указание частоты смещения и параметра плотности мощности, включающий:
генерацию (810) ВЧ-сигнала с расширенной полосой частот, при этом полоса высоких частот созданного сигнала генерируется на основе частотного сдвига полосы частот входного аудио сигнала; частотный сдвиг, в свою очередь, основывается на частоте смещения;
увеличение (820) или уменьшение полосы частот сигнала с полосой высоких частот на коэффициент, равный значению параметра плотности мощности или равный обратному значению параметра плотности мощности;
объединение (830) сигнала с полосой высоких частот и входного аудио сигнала для получения аудио сигнала с расширенным диапазоном частот;
при этом частью полосы высоких частот ВЧ-сигнала с расширенной полосой частот (512) можно пренебречь, а пренебрегаемая часть высокочастотной полосы ВЧ-сигнала с расширенной полосой частот (512) содержит частоты, более низкие, чем верхняя частота среза входного аудио сигнала (502); и
вывод (840) аудиосигнала с расширенной полосой частот.
13. A method (800) for generating an audio signal with an extended frequency band based on an input audio signal and a parametric signal containing an indication of the offset frequency and the power density parameter, including:
generating (810) an RF signal with an extended frequency band, wherein the high frequency band of the generated signal is generated based on the frequency shift of the frequency band of the input audio signal; the frequency shift, in turn, is based on the bias frequency;
increase (820) or decrease the frequency band of the signal with the high-frequency band by a factor equal to the value of the power density parameter or equal to the inverse of the power density parameter;
combining (830) a signal with a high frequency band and an input audio signal to produce an audio signal with an extended frequency range;
while part of the high-frequency band of the RF signal with the extended frequency band (512) can be neglected, and the neglected part of the high-frequency band of the RF signal with the expanded frequency band (512) contains frequencies lower than the upper cut-off frequency of the input audio signal (502) ; and
output (840) of an audio signal with an extended frequency band.
14. Способ (1300) формирования сигнала с расширенным диапазоном частот на основе входного аудио сигнала, включающий создание (1310), как минимум, одного сигнала с полосой высоких частот на основе входного аудио сигнала, при этом нижняя предельная частота полосы высоких частот созданного сигнала ниже, чем верхняя предельная частота входного аудио сигнала;
если генерируются разные сигналы с полосами высоких частот, то созданные сигналы имеют разные частоты в рамках полос высоких частот;
вычисление (1320) множества параметров сравнения, при этом параметр сравнения вычисляется на основе сравнения входного аудио сигнала и созданного сигнала с полосой высоких частот; каждый параметр сравнения из множества параметров сравнения вычисляется на основе разной частоты смещения между входным аудио сигналом и созданным сигналом с полосой высоких частот;
определение (1330) параметра сравнения из множества параметров сравнения, приэтом выделенный параметр сравнения соответствует заранее заданному критерию;
объединение (1340) входного аудио сигнала и сигнала с полосой высоких частот для получения аудио сигнала с расширенным диапазоном частот; при этом сигнал с расширенным диапазоном частот основывается на частоте смещения, которая соответствует определенному параметру компенсации;
вывод (1350) аудио сигнала с расширенным диапазоном частот.
14. A method (1300) for generating a signal with an extended frequency range based on an input audio signal, including generating (1310) at least one signal with a high frequency band based on the input audio signal, wherein the lower limit frequency of the high frequency band of the generated signal is lower than the upper limit frequency of the input audio signal;
if different signals with high frequency bands are generated, then the created signals have different frequencies within the high frequency bands;
calculating (1320) a plurality of comparison parameters, wherein the comparison parameter is calculated based on comparing the input audio signal and the generated signal with the high frequency band; each comparison parameter from a plurality of comparison parameters is calculated based on a different offset frequency between the input audio signal and the generated signal with a high frequency band;
determining (1330) the comparison parameter from the plurality of comparison parameters, wherein the highlighted comparison parameter corresponds to a predetermined criterion;
combining (1340) an input audio signal and a signal with a high frequency band to obtain an audio signal with an extended frequency range; wherein the signal with an extended frequency range is based on a bias frequency that corresponds to a specific compensation parameter;
output (1350) of an audio signal with an extended frequency range.
15. Машиночитаемый носитель, хранящий компьютерную программу с программным кодом для осуществления способа по п.12, при условии выполнения компьютерной программы с использованием компьютера или микроконтроллера.15. Machine-readable medium storing a computer program with program code for implementing the method according to item 12, provided that the computer program is executed using a computer or microcontroller. 16. Машиночитаемый носитель, хранящий компьютерную программу с кодом программы для осуществления способа по п.13, при условии выполнения компьютерной программы с использованием компьютера или микроконтроллера.16. A computer-readable medium storing a computer program with a program code for implementing the method according to item 13, provided that the computer program is executed using a computer or microcontroller. 17. Машиночитаемый носитель, хранящий компьютерную программу, имеющую код программы для осуществления способа по п.14, при условии выполнения компьютерной программы с применением компьютера или микроконтроллера. 17. A computer-readable medium storing a computer program having a program code for implementing the method according to 14, provided that the computer program is executed using a computer or microcontroller.
RU2011126331/08A 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder RU2523035C2 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12252208P 2008-12-15 2008-12-15
US61/122,522 2008-12-15
PCT/EP2009/066980 WO2010069885A1 (en) 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder

Publications (2)

Publication Number Publication Date
RU2011126331A RU2011126331A (en) 2013-01-10
RU2523035C2 true RU2523035C2 (en) 2014-07-20

Family

ID=42046434

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2011126331/08A RU2523035C2 (en) 2008-12-15 2009-12-11 Audio encoder and bandwidth extension decoder

Country Status (2)

Country Link
RU (1) RU2523035C2 (en)
WO (1) WO2010070643A1 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL216903A (en) * 2010-12-10 2016-09-29 Advanced Vision Tech (A V T ) Ltd Conveying apparatus with an imaging backing surface
RU2608447C1 (en) 2013-01-29 2017-01-18 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for generating extended by frequency signal using subranges time smoothing
TWI557726B (en) * 2013-08-29 2016-11-11 杜比國際公司 System and method for determining a master scale factor band table for a highband signal of an audio signal

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2005106296A (en) * 2002-08-08 2005-08-27 Квэлкомм Инкорпорейтед (US) ADAPTED TO BAND QUANTUM QUANTIZATION
EP1636791B1 (en) * 2003-06-25 2007-03-07 Coding Technologies AB Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
RU2323469C2 (en) * 2003-10-02 2008-04-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for processing at least two input values
RU2325708C2 (en) * 2003-10-02 2008-05-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for processing signal containing sequence of discrete values

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5448949A (en) 1993-08-24 1995-09-12 Heidelberger Druckmaschinen Ag Method and device for adjusting a contact pressure between ink-carrying cylinders of a printing machine
US6129015A (en) 1993-11-23 2000-10-10 Quad/Tech, Inc. Method and apparatus for registering color in a printing press
US5812705A (en) 1995-02-28 1998-09-22 Goss Graphic Systems, Inc. Device for automatically aligning a production copy image with a reference copy image in a printing press control system
US5790186A (en) * 1995-12-27 1998-08-04 Advanced Vision Technology (A.V.T.) Ltd. Apparatus and method for reducing shade effects during print quality control
US6166366A (en) 1997-07-23 2000-12-26 Cc1, Inc. System and method for monitoring and controlling the deposition of pattern and overall material coatings
DE19855177A1 (en) 1998-11-30 2000-06-08 Windmoeller & Hoelscher Circumferential and lateral register adjustment method for printing roller of printing machine by comparing actual position of individual images with desired position and adjusting rollers accordingly
DE20122584U1 (en) 2001-03-27 2006-07-27 Windmöller & Hölscher Kg Print image setting device for rotary printing machine has camera feeding successively acquired print images to control or regulating unit that produces signals for participating rollers
ATE418453T1 (en) * 2004-03-23 2009-01-15 Koenig & Bauer Ag PRINTING MACHINE WITH AN INLINE INSPECTION SYSTEM

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2005106296A (en) * 2002-08-08 2005-08-27 Квэлкомм Инкорпорейтед (US) ADAPTED TO BAND QUANTUM QUANTIZATION
EP1636791B1 (en) * 2003-06-25 2007-03-07 Coding Technologies AB Apparatus and method for encoding an audio signal and apparatus and method for decoding an encoded audio signal
RU2323469C2 (en) * 2003-10-02 2008-04-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for processing at least two input values
RU2325708C2 (en) * 2003-10-02 2008-05-27 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Device and method for processing signal containing sequence of discrete values

Also Published As

Publication number Publication date
WO2010070643A1 (en) 2010-06-24
RU2011126331A (en) 2013-01-10

Similar Documents

Publication Publication Date Title
US11670316B2 (en) Audio encoder and bandwidth extension decoder
RU2523035C2 (en) Audio encoder and bandwidth extension decoder
AU2015203736B2 (en) Audio encoder and bandwidth extension decoder