RU2819779C1

RU2819779C1 - Low frequency amplification for loudspeakers

Info

Publication number: RU2819779C1
Application number: RU2022112946A
Authority: RU
Inventors: Пер Экстранд; Юйсин ХАО; Сюэмэй ЮЙ
Original assignee: Долби Интернешнл Аб; Долби Лабораторис Лайсэнзин Корпорейшн
Priority date: 2020-03-20
Filing date: 2021-03-19
Publication date: 2024-05-24

Abstract

FIELD: physics.

SUBSTANCE: invention relates to acoustics. Device comprises means for receiving an audio signal, means for converting a signal, means for amplifying low frequencies, comprising an upsampler, a harmonic generator, a device for processing dynamic characteristics, a converter, a filter, a delay element and a mixer, as well as an inverse transformation unit. Harmonic generator comprises an amplifier, a compressor, an adder, as well as a normalization unit, a multiplier, and a loudness correction stage.

EFFECT: elimination of spectral overlap effect.

18 cl, 12 dwg, 2 tbl

Description

ПЕРЕКРЕСТНЫЕ ССЫЛКИ НА РОДСТВЕННЫЕ ЗАЯВКИCROSS-REFERENCES TO RELATED APPLICATIONS

[0001] Настоящая заявка притязает на приоритет международной заявки № PCT/CN2020/080460, поданной 20 марта 2020 года, и предварительной заявки на патент США № 63/010 390, поданной 15 апреля 2020 года, которые ссылкой полностью включаются в данный документ. [0001] This application claims priority to International Application No. PCT/CN2020/080460, filed March 20, 2020, and U.S. Provisional Patent Application No. 63/010,390, filed April 15, 2020, both of which are incorporated by reference herein in their entirety.

ОБЛАСТЬ ТЕХНИКИTECHNICAL FIELD

[0002] Настоящее изобретение относится к обработке звука и, в частности, к усилению низких частот.[0002] The present invention relates to audio processing and, in particular, to bass enhancement.

ПРЕДПОСЫЛКИ ИЗОБРЕТЕНИЯBACKGROUND OF THE INVENTION

[0003] Если иное не указано в данном документе, подходы, описанные в данном разделе, не являются известным уровнем техники для формулы изобретения в данной заявке, и их не следует признавать известным уровнем техники из-за включения в данный раздел.[0003] Unless otherwise indicated herein, the approaches described in this section are not prior art to the claims herein and should not be considered prior art for inclusion in this section.

[0004] Низкочастотный эффект является желательным опытом пользователя и показателем пользовательской оценки мобильных устройств, таких как мобильные телефоны, мультимедийные проигрыватели, планшетные компьютеры, ноутбуки, наушники, микронаушники и т.д. Вследствие физических ограничений преобразователей в мобильных устройствах (например, размера мембраны, веса магнита и т.д.), для громкоговорителя мобильного устройства представляет сложность полное воспроизведение акустических характеристик исходного низкочастотного звука. Как следствие, в мобильных устройствах часто реализованы технические решения обработки звука (например, с использованием программных процессов и т.д.) для улучшения низкочастотного звука. Эти процессы усиления низких частот в широком смысле могут быть названы техническими решениями «виртуальных низких частот».[0004] Low frequency effect is a desirable user experience and user evaluation indicator of mobile devices such as mobile phones, multimedia players, tablet computers, laptops, headphones, earbuds, etc. Due to the physical limitations of transducers in mobile devices (eg, diaphragm size, magnet weight, etc.), it is difficult for a mobile device loudspeaker to fully reproduce the acoustic characteristics of the original low-frequency sound. As a consequence, mobile devices often implement technical audio processing solutions (e.g., using software processes, etc.) to improve low-frequency audio. These low-frequency enhancement processes can broadly be called "virtual low-frequency" technical solutions.

СУЩНОСТЬ ИЗОБРЕТЕНИЯSUMMARY OF THE INVENTION

[0005] Одной проблемой, связанной с существующими системами усиления низких частот, является то, что они могут характеризоваться высокой вычислительной сложностью. С учетом вышеизложенного может иметься потребность в реализации усиления низких частот с пониженной вычислительной сложностью.[0005] One problem with existing low frequency amplification systems is that they can be highly computationally complex. Given the above, there may be a need to implement low frequency amplification with reduced computational complexity.

[0006] Как более подробно обсуждается в данном документе, в вариантах осуществления обсуждены технические решения для усиления низких частот на основе принципа «отсутствия основной гармоники». В данном принципе установлено, что в психоакустическом отношении, если человек слышит гармоники низкочастотного сигнала, а не сам низкочастотный сигнал (основную гармонику), мозг слушателя способен экстраполировать и, таким образом, воспринимать отсутствующий низкочастотный сигнал. Таким образом, для громкоговорителей, физически не отвечающих требованиям воспроизведения низкочастотных сигналов (низких частот), способом психоакустического повышения качества является генерирование гармоник для диапазона низких частот с целью усиления низкочастотного эффекта.[0006] As discussed in more detail herein, embodiments discuss low frequency enhancement solutions based on the "no fundamental" principle. This principle establishes that psychoacoustically, if a person hears the harmonics of a low-frequency signal rather than the low-frequency signal itself (the fundamental), the listener's brain is able to extrapolate and thus perceive the missing low-frequency signal. Thus, for loudspeakers that are physically unable to reproduce low-frequency signals (low frequencies), a method of psychoacoustic enhancement is to generate harmonics for the low-frequency range to enhance the low-frequency effect.

[0007] Техническое решение усиления низких частот, раскрытое в данном описании, является менее сложным в вычислительном отношении, чем традиционные технические решения виртуальных низких частот, однако достигает подобного результата. Таким образом, в вариантах осуществления уменьшена вычислительная сложность. Дополнительно пониженная вычислительная сложность обеспечивает возможность сокращения времени ожидания. Техническое решение также включает схемы регулировки громкости для регулировки мощности генерируемых гармоник, что приводит к более реалистичному восприятию результирующей громкости и большей привлекательности низкочастотного эффекта.[0007] The low frequency enhancement solution disclosed herein is less computationally complex than traditional virtual low frequency solutions but achieves a similar result. Thus, in embodiments, computational complexity is reduced. Additionally, reduced computational complexity makes it possible to reduce latency. The solution also includes volume control circuits to adjust the power of the generated harmonics, resulting in a more realistic perception of the resulting volume and greater low-frequency effect appeal.

[0008] Технические решения, раскрытые в данном описании, могут использоваться для усиления выходного сигнала из динамиков среднего размера и преобразователей меньшего размера, например, громкоговорителей мобильных телефонов, беспроводных громкоговорителей и т.д.[0008] The techniques disclosed herein can be used to amplify the output from mid-size speakers and smaller transducers, such as mobile phone speakers, wireless speakers, etc.

[0009] Согласно варианту осуществления реализуемый компьютером способ обработки звука включает прием первого сигнала в области преобразования. Первый сигнал в области преобразования представляет собой гибридный комплексный сигнал в области преобразования, имеющий множество полос. По меньшей мере одна из множества полос имеет множество поддиапазонов, и первый сигнал в области преобразования имеет первое множество гармоник. [0009] In an embodiment, a computer-implemented audio processing method includes receiving a first signal in a conversion domain. The first transform domain signal is a hybrid complex transform domain signal having multiple bands. At least one of the plurality of bands has a plurality of subbands, and the first signal in the conversion domain has a first plurality of harmonics.

[0010] Способ дополнительно включает генерирование второго сигнала в области преобразования на основе первого сигнала в области преобразования. Второй сигнал в области преобразования генерируют путем генерирования гармоник для первого сигнала в области преобразования согласно нелинейному процессу. Второй сигнал в области преобразования имеет второе множество гармоник, которое отличается от первого множества гармоник. Второй сигнал в области преобразования дополнительно генерируют путем выполнения расширения громкости в отношении второго множества гармоник. Второй сигнал в области преобразования представляет собой комплекснозначный сигнал, имеющий мнимую часть.[0010] The method further includes generating a second transform domain signal based on the first transform domain signal. The second transform domain signal is generated by generating harmonics for the first transform domain signal according to a nonlinear process. The second signal in the conversion domain has a second harmonic set that is different from the first harmonic set. The second transform domain signal is further generated by performing volume expansion with respect to the second set of harmonics. The second signal in the transformation domain is a complex-valued signal that has an imaginary part.

[0011] Способ дополнительно включает генерирование третьего сигнала в области преобразования путем фильтрации второго сигнала в области преобразования. Третий сигнал в области преобразования имеет множество полос, и по меньшей мере одна из множества полос имеет множество поддиапазонов. Способ дополнительно включает генерирование четвертого сигнала в области преобразования путем микширования третьего сигнала в области преобразования с подвергнутой задержке версией первого сигнала в области преобразования, при этом данный поддиапазон третьего сигнала в области преобразования микшируют с соответствующим поддиапазоном подвергнутой задержке версии первого сигнала в области преобразования.[0011] The method further includes generating a third signal in the transform domain by filtering the second signal in the transform domain. The third signal in the transform domain has a plurality of bands, and at least one of the plurality of bands has a plurality of subbands. The method further includes generating a fourth transform domain signal by mixing the third transform domain signal with a delayed version of the first transform domain signal, wherein a given subband of the third transform domain signal is mixed with a corresponding subband of the delayed version of the first transform domain signal.

[0012] Согласно другому варианту осуществления устройство содержит громкоговоритель и процессор. Процессор выполнен с возможностью управления устройством для реализации одного или более способов, описанных в данном документе. Устройство может дополнительно содержать детали, подобные таковым в одном или более способах, описанных в данном документе.[0012] According to another embodiment, the device includes a loudspeaker and a processor. The processor is configured to control the device to implement one or more of the methods described herein. The device may further comprise parts similar to those in one or more of the methods described herein.

[0013] Согласно другому варианту осуществления на энергонезависимом машиночитаемом носителе хранится компьютерная программа, которая при исполнении процессором управляет устройством для исполнения обработки, включающей один или более способов, описанных в данном документе.[0013] In another embodiment, a computer program is stored on a non-transitory computer-readable medium that, when executed by a processor, controls an apparatus to perform processing including one or more methods described herein.

[0014] Следующее подробное описание и сопроводительные графические материалы обеспечивают дополнительное понимание сущности и преимуществ различных реализаций.[0014] The following detailed description and accompanying drawings provide further understanding of the nature and advantages of the various implementations.

КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS

[0015] На фиг. 1 изображена блок-схема системы 100 обработки звука.[0015] In FIG. 1 is a block diagram of an audio processing system 100.

[0016] На фиг. 2 изображена блок-схема системы 200 усиления низких частот. [0016] In FIG. 2 is a block diagram of a bass enhancement system 200.

[0017] На фиг. 3 изображена блок-схема генератора 300 гармоник. [0017] In FIG. 3 is a block diagram of a harmonic generator 300.

[0018] На фиг. 4 изображена блок-схема генератора 400 гармоник. [0018] In FIG. 4 is a block diagram of a harmonic generator 400.

[0019] На фиг. 5 изображена блок-схема генератора 500 гармоник. [0019] In FIG. 5 is a block diagram of a harmonic generator 500.

[0020] На фиг. 6 изображен график 600, на котором показаны кривые равной громкости. [0020] In FIG. 6 is a graph 600 showing equal loudness curves.

[0021] На фиг. 7 изображен график 700, на котором показаны различные коэффициенты c усиления сжатия.[0021] In FIG. 7 is a graph 700 showing various compression gain factors c .

[0022] На фиг. 8 изображена блок-схема генератора 800 гармоник.[0022] In FIG. 8 is a block diagram of a harmonic generator 800.

[0023] На фиг. 9A, 9B, 9C, 9D, 9E и 9F показан набор графиков 900a-900f. [0023] In FIG. 9A, 9B, 9C, 9D, 9E and 9F show a set of plots 900a-900f.

[0024] На фиг. 10 изображена блок-схема системы 1000 усиления низких частот. [0024] In FIG. 10 is a block diagram of a bass enhancement system 1000.

[0025] На фиг. 11 изображена архитектура 1100 мобильного устройства для реализации признаков и процессов, описанных в данном документе, согласно варианту осуществления.[0025] In FIG. 11 depicts a mobile device architecture 1100 for implementing the features and processes described herein, according to an embodiment.

[0026] На фиг. 12 изображена схема последовательности операций способа 1200 обработки звука. [0026] In FIG. 12 is a flowchart of an audio processing method 1200.

ПОДРОБНОЕ ОПИСАНИЕDETAILED DESCRIPTION

[0027] В данном документе описаны технические решения, относящиеся к усилению низких частот. В нижеследующем описании в целях разъяснения многочисленные примеры и конкретные подробности изложены для того, чтобы обеспечить полное понимание настоящего изобретения. Однако специалисту в данной области техники будет очевидно, что настоящее изобретение, определяемое формулой изобретения, может включать некоторые или все признаки из этих примеров сами по себе или в комбинации с другими признаками, описанными ниже, и может дополнительно включать модификации и эквиваленты признаков и концепций, описанных в данном документе.[0027] This document describes technical solutions related to bass enhancement. In the following description, for purposes of explanation, numerous examples and specific details are set forth in order to provide a thorough understanding of the present invention. However, it will be apparent to one skilled in the art that the present invention, as defined by the claims, may include some or all of the features of these examples, alone or in combination with other features described below, and may further include modifications and equivalents of the features and concepts, described in this document.

[0028] В следующем описании подробно описаны различные способы, процессы и процедуры. И хотя определенные этапы могут быть описаны в некотором порядке, этот порядок главным образом предназначен для удобства и ясности. Определенный этап может повторяться более одного раза, может происходить до или после других этапов (даже если эти этапы иначе описаны в другом порядке) и может происходить параллельно другим этапам. Следование второго этапа за первым этапом требуется только тогда, когда первый этап необходимо выполнить до начала второго этапа. Такая ситуация будет конкретно указана, если это не ясно из контекста.[0028] The following description describes in detail various methods, processes and procedures. Although certain steps may be described in some order, this order is primarily for convenience and clarity. A given step may be repeated more than once, may occur before or after other steps (even if those steps are otherwise described in a different order), and may occur in parallel with other steps. The second stage follows the first stage only when the first stage must be completed before the start of the second stage. This situation will be specifically stated if it is not clear from the context.

[0029] В данном документе используются термины «и», «или» и «и/или». Такие термины следует прочитывать как имеющие включающее значение. Например, «A и B» может означать по меньшей мере следующее: «и А, и В», «по меньшей мере и A, и B». В качестве другого примера «A или B» может означать по меньшей мере следующее: «по меньшей мере А», «по меньшей мере В», «и А, и В», «по меньшей мере и A, и B». В качестве другого примера «A и/или B» может означать по меньшей мере следующее: «А и В», «A или B». Когда подразумевается исключительное «или», оно будет обозначаться конкретно (например, «или А, или В», «самое большее одно из А и В»).[0029] The terms “and”, “or” and “and/or” are used herein. Such terms should be read as having an inclusive meaning. For example, "A and B" may mean at least the following: "both A and B", "at least both A and B". As another example, "A or B" may mean at least the following: "at least A", "at least B", "both A and B", "at least both A and B". As another example, "A and/or B" may mean at least the following: "A and B", "A or B". When an exclusive “or” is intended, it will be indicated specifically (for example, “either A or B,” “at most one of A and B”).

[0030] В данном документе описаны различные функции обработки связанные с такими структурами, как блоки, элементы, компоненты, схемы и т.д. В целом эти структуры могут быть реализованы процессором под управлением одной или более компьютерных программ.[0030] Various processing functions associated with structures such as blocks, elements, components, circuits, etc. are described herein. In general, these structures may be implemented by a processor under control of one or more computer programs.

[0031] На фиг. 1 изображена блок-схема системы 100 обработки звука. Система 100 обработки звука в целом принимает входной звуковой сигнал 102, обрабатывает входной звуковой сигнал 102 согласно процессам усиления низких частот, описанным в данном документе, и генерирует выходной звуковой сигнал 104. Система 100 обработки звука содержит систему 110 преобразования сигнала, систему 120 усиления низких частот, систему 130 дополнительной обработки (необязательно) и систему 140 обратного преобразования сигнала. Система 100 обработки звука может содержать другие компоненты, которые (для краткости) подробно не обсуждены. Компоненты системы 100 обработки звука могут быть реализованы одной или более компьютерными программами, исполняемыми процессором.[0031] In FIG. 1 is a block diagram of an audio processing system 100. The audio processing system 100 generally receives an input audio signal 102, processes the input audio signal 102 according to the bass enhancement processes described herein, and generates an output audio signal 104. The audio processing system 100 includes a signal conditioning system 110, a bass enhancement system 120 , an additional processing system 130 (optional) and a signal deconversion system 140. The audio processing system 100 may include other components that (for the sake of brevity) are not discussed in detail. The components of the audio processing system 100 may be implemented by one or more computer programs executed by a processor.

[0032] Система 101 преобразования сигнала принимает входной звуковой сигнал 102, выполняет процесс преобразования сигнала и генерирует преобразованный звуковой сигнал 112. Входной звуковой сигнал 102 может представлять собой цифровой сигнал во временной области, содержащий несколько дискретных значений, которые соответствуют звуку (например, звуку в формате импульсно-кодовой модуляции (PCM) формы сигнала). Входной звуковой сигнал 102 может иметь частоту дискретизации 32 кГц, 44,1 кГц, 48 кГц, 192 кГц и т.д. Входной звуковой сигнал 102 может происходить из различных форматов, включая стандарт Комитета по перспективным телевизионным системам (ATSC) для сжатия цифрового звука (AC-3, E-AC-3). В качестве конкретного примера входной звуковой сигнал 102 может происходить из сигнала Dolby Digital Plus™ с частотой дискретизации 48 кГц.[0032] Signal conversion system 101 receives input audio signal 102, performs a signal conversion process, and generates a converted audio signal 112. Input audio signal 102 may be a digital time domain signal containing multiple discrete values that correspond to audio (e.g., audio in pulse code modulation (PCM) waveform format). The input audio signal 102 may have a sampling rate of 32 kHz, 44.1 kHz, 48 kHz, 192 kHz, etc. The input audio signal 102 may come from a variety of formats, including the Advanced Television Systems Committee (ATSC) standard for digital audio compression (AC-3, E-AC-3). As a specific example, the input audio signal 102 may originate from a Dolby Digital Plus™ signal at a sampling rate of 48 kHz.

[0033] Система 110 преобразования сигнала может выполнять различные процессы преобразования сигнала. В целом процесс преобразования сигнала выполняет преобразование входного звукового сигнала 102 из первой области сигнала во вторую область сигнала. Например, первая область может представлять собой временную область, а вторая область сигнала может представлять собой частотную область, квадратурную зеркальную частотную (QMF) область, комплексную квадратурную зеркальную частотную (CQMF) область, гибридную комплексную квадратурную зеркальную частотную (HCQMF) область и т.д. Преобразование из первой области сигнала во вторую область сигнала может также быть названо «анализом», например, анализом преобразования, анализом сигнала, анализом блока фильтров, анализом QMF, анализом CQMF, анализом HCQMF и т.д.[0033] The signal conversion system 110 may perform various signal conversion processes. In general, the signal conversion process converts the input audio signal 102 from a first signal domain to a second signal domain. For example, the first domain may be a time domain, and the second signal domain may be a frequency domain, a quadrature mirror frequency (QMF) domain, a complex quadrature mirror frequency (CQMF) domain, a hybrid complex quadrature mirror frequency (HCQMF) domain, etc. . The transformation from the first signal region to the second signal region may also be called "analysis", for example, transformation analysis, signal analysis, filter bank analysis, QMF analysis, CQMF analysis, HCQMF analysis, etc.

[0034] В целом информацию в области QMF генерируют при помощи фильтра, частотная характеристика которого представляет собой зеркальное отражение относительно π/2 частотной характеристики другого фильтра; совместно эти фильтры известны как QMF-пара. Теория QMF также включает блоки фильтров с количеством каналов более двух (например, 64 канала); они могут быть названы M-канальными блоками QMF. Теория QMF дополнительно содержит информацию о M-канальных блоках псевдо-QMF, которые относятся к классу, называемому модулированными блоками фильтров. В целом информация в области «CQMF» является результатом применения к сигналу во временной области комплексно-модулированного блока фильтров дискретного преобразования Фурье (DFT). CQMF представляет собой «комплексный» сигнал, так как он содержит комплекснозначные сигналы, например, сигналы, содержащие мнимую часть в дополнение к вещественной части. В целом информация в области «HCQMF» соответствует информации в области CQMF, в которой блок фильтров CQMF был распространен на гибридную структуру для получения эффективной неравномерной разрешающей способности по частоте, которая лучше согласуется с разрешающей способностью по частоте слуховой системы человека. В целом термин «гибридный» относится к структуре, в которой по меньшей мере одна полоса частот разделена на поддиапазоны. [0034] In general, QMF information is generated using a filter whose frequency response is a mirror image of the π/2 frequency response of another filter; together these filters are known as a QMF pair. QMF theory also includes filter banks with more than two channels (e.g. 64 channels); these can be called M-channel QMF blocks. QMF theory additionally contains information about M-channel pseudo-QMF blocks, which belong to a class called modulated filter blocks. In general, the information in the "CQMF" domain is the result of applying a complex-modulated discrete Fourier transform (DFT) filter bank to the time domain signal. CQMF is a "complex" signal because it contains complex-valued signals, such as signals containing an imaginary part in addition to a real part. In general, the information in the “HCQMF” domain corresponds to the information in the CQMF domain, in which the CQMF filter bank has been extended to a hybrid structure to obtain an effective non-uniform frequency resolution that better matches the frequency resolution of the human auditory system. In general, the term “hybrid” refers to a structure in which at least one frequency band is divided into subbands.

[0035] Согласно конкретной реализации HCQMF информацию HCQMF генерируют с получением 77 полос частот, при этом нижние полосы CQMF дополнительно разделены на поддиапазоны с целью получения более высокой разрешающей способности по частоте для более низких частот. Согласно дополнительной конкретной реализации система 110 преобразования сигнала преобразует каждый канал входного звукового сигнала 102 в 64 полосы CQMF и дополнительно делит нижние 3 полосы на поддиапазоны следующим образом: первая полоса делится на 8 поддиапазонов, а каждая из второй и третьей полос делится на 4 поддиапазона. (Данное гибридное разделение самых низких полос на поддиапазоны имеет целью повышение низкочастотной разрешающей способности этих полос.) Система 110 преобразования сигнала может содержать фильтры Найквиста для разделения полос на поддиапазоны. Тогда 77 полос HCQMF соответствуют 61 самой высокой полосе CQMF с добавлением 16 поддиапазонов (8+4+4) из самых низких 3 полос CQMF. Поддиапазоны и полосы могут быть пронумерованы от 0 до 76, причем номер 0 имеет самый низкий частотный поддиапазон. Тогда другие поддиапазоны пронумерованы от 1 до 15, а остальные полосы пронумерованы от 16 до 76. Тогда эти 77 полос HCQMF могут быть названы «гибридными полосами», или «каналами», наряду с их номером, например гибридная полоса 0, гибридная полоса 1, гибридная полоса 76, канал 0, канал 1, канал 76 и т.д. Гибридные полосы 0–15 могут быть также названы «поддиапазонами» наряду с их номером, например, поддиапазон 0, поддиапазон 1, поддиапазон 15 и т.д. Гибридные полосы 16–76 могут быть также названы «полосами» наряду с их номером, например, полоса 16, полоса 17, полоса 76 и т.д. Каналы 1 и 3 могут иметь полосы пропускания на оси отрицательной частоты, однако другие каналы этим обычно не характеризуются.[0035] In a specific HCQMF implementation, HCQMF information is generated into 77 frequency bands, with the lower CQMF bands further divided into subbands to obtain higher frequency resolution for lower frequencies. According to a further specific implementation, the signal conditioning system 110 converts each channel of the input audio signal 102 into 64 CQMF bands and further divides the lower 3 bands into subbands as follows: the first band is divided into 8 subbands, and each of the second and third bands is divided into 4 subbands. (This hybrid subbanding of the lowest bands is intended to increase the low frequency resolution of these bands.) Signal conditioning system 110 may include Nyquist filters to subband the bands. Then the 77 HCQMF bands correspond to the 61 highest CQMF bands with the addition of 16 sub-bands (8+4+4) of the lowest 3 CQMF bands. Subbands and bands can be numbered from 0 to 76, with number 0 being the lowest frequency subband. Then the other subbands are numbered from 1 to 15, and the remaining bands are numbered from 16 to 76. Then these 77 HCQMF bands can be called "hybrid bands", or "channels", along with their number, for example, hybrid band 0, hybrid band 1, hybrid band 76, channel 0, channel 1, channel 76, etc. Hybrid bands 0–15 may also be called "subbands" along with their number, e.g. subband 0, subband 1, subband 15, etc. Hybrid bands 16–76 may also be called "strips" along with their number, such as band 16, band 17, band 76, etc. Channels 1 and 3 may have bandwidths on the negative frequency axis, but other channels typically do not.

[0036] (Следует отметить, что термины «QMF», «CQMF» и «HCQMF» в данном документе используются несколько упрощенно. В частности, термины «QMF»/«CQMF» могут упрощенно использоваться для отсылки к блоку фильтров DFT, который может содержать более двух полос. Термин «HCQMF» может упрощенно использоваться для отсылки к блоку фильтров неравномерного DFT, который может содержать более двух полос.)[0036] (It should be noted that the terms "QMF", "CQMF" and "HCQMF" are used somewhat simplistically throughout this document. In particular, the terms "QMF"/"CQMF" may be simplistically used to refer to a DFT filter bank that can contain more than two bands. The term "HCQMF" can be simplistically used to refer to a non-uniform DFT filter bank that can contain more than two bands.)

[0037] В качестве конкретного примера система 110 преобразования сигнала выполняет преобразование HCQMF в отношении входного звукового сигнала 102 для генерирования преобразованного звукового сигнала 112, имеющего 77 полос частот. В этом случае область сигнала в виде преобразованного звукового сигнала 112 может быть названа областью HCQMF или гибридной областью, а преобразование HCQMF может быть названо анализом HCQMF.[0037] As a specific example, the signal conversion system 110 performs HCQMF conversion on the input audio signal 102 to generate a converted audio signal 112 having 77 frequency bands. In this case, the signal region of the converted audio signal 112 may be called an HCQMF region or a hybrid region, and the HCQMF transformation may be called an HCQMF analysis.

[0038] Ширина полосы и частота дискретизации полос будут зависеть от частоты дискретизации входного звукового сигнала 102. Например, когда входной звуковой сигнал 102 имеет частоту дискретизации 48 кГц (соответствующую максимальной ширине полосы 24 кГц), обсужденная выше гибридная структура с 77 полосами приводит к частоте дискретизации 750 Гц для всех полос. 61 полоса с самыми высокими частотами имеет ширину полосы пропускания 375 Гц; 8 поддиапазонов с самыми низкими частотами имеют ширину полосы пропускания 93,75 Гц; и поддиапазоны со следующими самыми низкими частотами имеют ширину полосы пропускания 187,5 Гц.[0038] The bandwidth and sampling frequency of the bands will depend on the sampling frequency of the input audio signal 102. For example, when the input audio signal 102 has a sampling frequency of 48 kHz (corresponding to a maximum bandwidth of 24 kHz), the 77-band hybrid structure discussed above results in a frequency 750 Hz sampling for all bands. The 61 highest frequency bands have a bandwidth of 375 Hz; The 8 lowest frequency subbands have a bandwidth of 93.75 Hz; and the subbands with the next lowest frequencies have a bandwidth of 187.5 Hz.

[0039] Система 120 усиления низких частот принимает преобразованный звуковой сигнал 112, выполняет усиление низкой частоты и генерирует усиленный звуковой сигнал 122. В целом система 120 усиления низких частот генерирует гармоники для преобразованного звукового сигнала 112 с целью психоакустического восприятия слушателем отсутствующей основной гармоники. Дополнительные подробности системы 120 усиления низких частот предоставлены ниже (например, со ссылкой на фиг. 2 и т.д.).[0039] Bass enhancement system 120 receives the converted audio signal 112, performs low frequency amplification, and generates an enhanced audio signal 122. Overall, bass enhancement system 120 generates harmonics for the converted audio signal 112 for the purpose of psychoacoustically perceiving the missing fundamental harmonic to the listener. Additional details of the bass enhancement system 120 are provided below (eg, with reference to FIG. 2, etc.).

[0040] Система 130 дополнительной обработки является необязательной. При наличии система 130 дополнительной обработки принимает усиленный звуковой сигнал 122, выполняет дополнительную обработку сигнала и генерирует обработанный звуковой сигнал 132. Альтернативно система 130 дополнительной обработки может действовать в отношении преобразованного звукового сигнала 112 перед действием системы 120 усиления низких частот, в этом случае система 120 усиления низких частот принимает в качестве своего входного сигнала сигнал, выведенный из системы 130 дополнительной обработки (вместо приема выходного сигнала непосредственно из системы 110 преобразования сигнала). В качестве другой возможности система 130 дополнительной обработки может представлять собой несколько систем дополнительной обработки, действующих как до, так и после системы 120 усиления низких частот. Конкретная компоновка системы 130 дополнительной обработки в системе 100 обработки звука может изменяться согласно конкретным типам дополнительной обработки, которую выполняет система 130 дополнительной обработки.[0040] The post-processing system 130 is optional. If present, the after-processing system 130 receives the amplified audio signal 122, performs further processing on the signal, and generates the processed audio signal 132. Alternatively, the after-processing system 130 may act on the converted audio signal 112 before acting on the bass boost system 120, in which case the boost system 120 The low pass receives as its input the signal output from the post-processing system 130 (instead of receiving the output signal directly from the signal conditioning system 110). As another possibility, the post-processing system 130 may be multiple post-processing systems operating both before and after the bass enhancement system 120. The specific layout of the post-processing system 130 in the audio processing system 100 may vary according to the particular types of post-processing that the post-processing system 130 performs.

[0041] В целом система 130 дополнительной обработки выполняет дополнительную обработку входного звукового сигнала 102 в области преобразования. Этим обеспечивается возможность действия системы 120 усиления низких частот в комбинации с существующими техническими решениями обработки звука, которые реализованы в области преобразования. Примеры дополнительной обработки включают усиление диалога, интеллектуальное выравнивание частотной характеристики, регулировку уровня громкости, ограничение спектра и т.д. Усиление диалога относится к усилению речевых сигналов (например, по сравнению со звуковыми эффектами) с целью повышения разборчивости речи. Интеллектуальное выравнивание частотной характеристики относится к выполнению динамической регулировки звукового тона, например, для обеспечения согласованности спектрального баланса (также известного как «тональный» или «тембральный»). Регулировка уровня громкости относится к увеличению громкости тихого звука и уменьшению громкости громкого звука, например, для уменьшения необходимости выполнения слушателем ручной регулировки громкости. Спектральное ограничение относится к ограничению выбранных частот или полос частот, например, для ограничения самых низких частот, которые трудно выводить из громкоговорителей малого размера.[0041] In general, the additional processing system 130 performs additional processing of the input audio signal 102 in the conversion domain. This allows the bass enhancement system 120 to operate in combination with existing audio processing solutions that have been implemented in the conversion field. Examples of additional processing include dialogue enhancement, intelligent frequency response equalization, volume control, spectrum limiting, etc. Dialogue enhancement refers to the enhancement of speech signals (e.g., over sound effects) to improve speech intelligibility. Intelligent frequency response equalization refers to performing dynamic adjustments to the audio tone, for example to ensure consistent spectral balance (also known as "tonal" or "timbral"). Volume control refers to increasing the volume of a quiet sound and decreasing the volume of a loud sound, for example, to reduce the need for the listener to make manual volume adjustments. Spectral clipping refers to limiting selected frequencies or frequency bands, for example to limit the lowest frequencies that are difficult to output from small speakers.

[0042] Система 140 обратного преобразования сигнала принимает усиленный звуковой сигнал 122 (или необязательно обработанный звуковой сигнал 132), выполняет обратное преобразование и генерирует выходной звуковой сигнал 104. Обратное преобразование обычно преобразует сигнал из второй области сигнала обратно в первую область сигнала. В целом обратное преобразование представляет собой процесс преобразования сигнала, обратный процессу, который выполняется системой 110 преобразования сигнала. Например, когда система 110 преобразования сигнала выполняет преобразование HCQMF, система 140 обратного преобразования сигнала выполняет обратное преобразование HCQMF. Преобразование из второй области сигнала обратно в первую область сигнала также может быть названо «синтезом», например, синтезом преобразования, синтезом сигнала, синтезом блока фильтров и т.д.; а обратное преобразование HCQMF может быть названо синтезом HCQMF.[0042] The deconversion system 140 receives the amplified audio signal 122 (or optionally the processed audio signal 132), performs the deconversion, and generates an output audio signal 104. The deconversion typically converts the signal from the second signal region back to the first signal region. In general, deconversion is a signal conversion process that is the reverse of the process performed by signal conversion system 110. For example, when the signal conditioning system 110 performs the HCQMF transform, the signal deconversion system 140 performs the inverse HCQMF transform. Conversion from the second signal domain back to the first signal domain may also be called "synthesis", such as transform synthesis, signal synthesis, filter bank synthesis, etc.; and the inverse transformation of HCQMF can be called HCQMF synthesis.

[0043] Таким образом, выходной звуковой сигнал 104 соответствует входному звуковому сигналу 102 с добавлением усиления низких частот и/или дополнительных усилений сигнала. Выходной звуковой сигнал 104 затем может выводиться громкоговорителем и восприниматься слушателем в форме звука.[0043] Thus, the output audio signal 104 corresponds to the input audio signal 102 with the addition of bass boost and/or additional signal enhancements. The output audio signal 104 can then be output by a loudspeaker and perceived by the listener in the form of sound.

[0044] Как обсуждено выше и более подробно ниже, система 120 усиления низких частот подходит для динамиков с размером от малого до среднего. Процессы, реализуемые системой 120 усиления низких частот, могут являться более простыми, чем многие существующие способы усиления низких частот; по сравнению с этими существующими способами система 120 усиления низких частот имеет более низкую вычислительную сложность и допускает краткое время ожидания, в то же время по-прежнему сохраняя качество звука. Система 120 усиления низких частот хорошо подходит для динамиков среднего размера, например, в телевизорах или беспроводных динамиках, а также является эффективной для усиления низких частот преобразователей малого размера, например, для мобильных телефонов, ноутбуков и планшетов. Система 120 усиления низких частот в одном режиме работы не только добавляет гармоники в микшированный сигнал, но также добавляет (динамически измененные) исходные низкие частоты, т. е. она может действовать с целью получения внутреннего подъема в области низких частот.[0044] As discussed above and in more detail below, the bass enhancement system 120 is suitable for small to medium sized speakers. The processes implemented by the bass enhancement system 120 may be simpler than many existing bass enhancement techniques; Compared to these existing methods, the bass enhancement system 120 has lower computational complexity and allows for short latency while still maintaining audio quality. The bass boost system 120 is well suited for medium-sized speakers, such as those found in televisions or wireless speakers, and is also effective for boosting the bass frequencies of small-sized transducers, such as those found in cell phones, laptops, and tablets. The bass boost system 120, in one mode of operation, not only adds harmonics to the mixed signal, but also adds (dynamically modified) original bass frequencies, i.e., it can operate to produce an internal boost in the bass region.

[0045] На фиг. 2 изображена блок-схема системы 200 усиления низких частот. Система 200 усиления низких частот может быть использована в качестве системы 120 усиления низких частот (см. фиг. 1). Для краткости, описание фиг. 2 сосредоточено на одном пути обработки сигнала с целью описания общего принципа действия системы 200 усиления низких частот; дополнительные пути обработки сигнала могут также быть реализованы в изменениях систем усиления низких частот, описанных в данном документе (см., например, фиг. 10). Дополнительные пути обработки сигнала также будут кратко описаны здесь.[0045] In FIG. 2 is a block diagram of a bass enhancement system 200. The bass boost system 200 may be used as the bass boost system 120 (see FIG. 1). For brevity, the description of FIG. 2 focuses on one signal processing path for the purpose of describing the general operating principle of the bass enhancement system 200; additional signal processing paths may also be implemented in variations of the low frequency amplification systems described herein (see, for example, FIG. 10). Additional signal processing pathways will also be briefly described here.

[0046] Система 200 усиления низких частот принимает преобразованный звуковой сигнал 112 (см. фиг. 1). Как обсуждено выше, преобразованный звуковой сигнал 112 представляет собой гибридный комплексный сигнал в области преобразования (например, сигнал в области HCQMF) с несколькими полосами (например, 77 гибридными полосами, причем 3 полосы с самыми низкими частотами разделены на поддиапазоны). Как комплексный сигнал преобразованный звуковой сигнал 112 имеет комплексные значения, например, как действительные значения, так и мнимые значения. Каждый поддиапазон может обрабатываться в своем собственном пути обработки, поэтому следующее описание сосредоточено на обработке одного поддиапазона (например, одного из поддиапазонов 0, 2, 4, 6 и т.д.). Система 200 усиления низких частот содержит повышающий дискретизатор 202 (необязательно), генератор 204 гармоник, устройство 206 обработки динамических характеристик (необязательно), преобразователь 208 (необязательно), фильтр 212, элемент 214 задержки и микшер 216.[0046] Bass enhancement system 200 receives converted audio signal 112 (see FIG. 1). As discussed above, the converted audio signal 112 is a hybrid complex signal in the transform domain (eg, a signal in the HCQMF domain) with multiple bands (eg, 77 hybrid bands, with the 3 lowest frequency bands divided into subbands). As a complex signal, the converted audio signal 112 has complex values, such as both real values and imaginary values. Each subrange may be processed in its own processing path, so the following description focuses on the processing of a single subrange (eg, one of subranges 0, 2, 4, 6, etc.). Bass enhancement system 200 includes an upsampler 202 (optional), a harmonic generator 204, a dynamics processor 206 (optional), a converter 208 (optional), a filter 212, a delay element 214, and a mixer 216.

[0047] Повышающий дискретизатор 202 принимает преобразованный звуковой сигнал 112, выполняет повышающую дискретизацию и генерирует подвергаемый повышающей дискретизации сигнал 220. В качестве примера, когда входной звуковой сигнал 102 (см. фиг. 1) имеет частоту дискретизации 48 кГц, и преобразованный звуковой сигнал 112 обрабатывается с получением 64 полос, каждая полоса имеет частоту дискретизации 750 Гц. Повышающий дискретизатор 202 может выполнять повышающую дискретизацию выбранного поддиапазона преобразованного звукового сигнала 112 в 2, 3, 4, 5, 6 и т.д. раз. Подходящее значение повышающей дискретизации равно 4, например, так, что подвергаемый повышающей дискретизации сигнал 220 имеет частоту дискретизации 3 кГц, когда выбранный поддиапазон преобразованного звукового сигнала 112 имеет частоту дискретизации 750 Гц. Подвергаемый повышающей дискретизации сигнал 220 представляет собой комплексный сигнал в области преобразования. Подвергаемый повышающей дискретизации сигнал 220 имеет ширину полосы, которая соответствует ширине полосы выбранного поддиапазона преобразованного звукового сигнала 112. В качестве примера, когда выбранный поддиапазон 0, имеющий ширину полосы пропускания 93,75 Гц, вводится в повышающий дискретизатор, подвергаемый повышающей дискретизации сигнал 220 так же имеет ширину полосы 93,75 Гц.[0047] The upsampler 202 receives the converted audio signal 112, performs upsampling, and generates an upsampled signal 220. As an example, when the input audio signal 102 (see FIG. 1) has a sampling rate of 48 kHz, and the converted audio signal 112 processed to produce 64 bands, each band having a sampling rate of 750 Hz. Upsampler 202 may upsample a selected subband of the converted audio signal 112 to 2, 3, 4, 5, 6, etc. once. A suitable upsampling value is 4, for example, such that the upsampled signal 220 has a sampling rate of 3 kHz when the selected subband of the converted audio signal 112 has a sampling rate of 750 Hz. The upsampled signal 220 is a complex signal in the transform domain. The upsampled signal 220 has a bandwidth that corresponds to the bandwidth of the selected subband of the converted audio signal 112. As an example, when the selected subband 0, having a bandwidth of 93.75 Hz, is input to the upsampler, the upsampled signal 220 also has a bandwidth of 93.75 Hz.

[0048] Повышающий дискретизатор 202 может быть реализован путем выполнения синтеза CQMF. В качестве примера для повышающей дискретизации поддиапазона 0 от 750 Гц до 3000 Гц (4-кратная повышающая дискретизация), повышающий дискретизатор может реализовывать 4-канальный синтез CQMF, причем один входной сигнал представляет собой поддиапазон 0, а другие 3 входных сигнала являются нулевыми (обнуленными). Синтез выполнен для сохранения сигнала 220 как комплекснозначного сигнала во временной области.[0048] The upsampler 202 may be implemented by performing CQMF synthesis. As an example, to upsample subband 0 from 750 Hz to 3000 Hz (4x upsampling), the upsampler can implement 4-channel CQMF synthesis, with one input signal being subband 0 and the other 3 input signals being null (nulled) ). The synthesis is performed to store signal 220 as a complex-valued time domain signal.

[0049] Повышающий дискретизатор 202 является необязательным. В целом повышающий дискретизатор 202 обеспечивает дополнительный запас при генерировании гармоник (см. генератор 204 гармоник) для обеспечения возможности расширения ширины полосы без эффекта наложения спектров (также называемого спектральным наложением). При обработке одного или более поддиапазонов самых низких частот повышающий дискретизатор 202 может быть опущен. Например, при обработке только самой низкой полосы (например, поддиапазона 0), повышающий дискретизатор 202 может быть опущен, так как без наложения могут быть сгенерированы гармоники (по меньшей мере) до 6-го порядка. При обработке двух самых низких поддиапазонов (например, поддиапазонов 0 и 2) повышающий дискретизатор 2 может быть опущен, если генерируются гармоники только 2-го и 3-го порядков. При обработке трех самых низких полос (например, поддиапазонов 0, 2 и 4) без эффекта наложения спектров могут быть сгенерированы только гармоники 2-го порядка. Это более подробно обсуждается со ссылкой на генератор 204 гармоник.[0049] Upsampler 202 is optional. In general, upsampler 202 provides additional headroom in harmonic generation (see harmonic generator 204) to allow bandwidth expansion without aliasing (also called aliasing). When processing one or more of the lowest frequency subbands, the upsampler 202 may be omitted. For example, when processing only the lowest band (eg, subband 0), the upsampler 202 may be omitted, since harmonics up to (at least) 6th order can be generated without aliasing. When processing the two lowest subbands (eg, subbands 0 and 2), upsampler 2 may be omitted if only 2nd and 3rd order harmonics are generated. When processing the three lowest bands (eg sub-bands 0, 2 and 4) without aliasing, only 2nd order harmonics can be generated. This is discussed in more detail with reference to harmonic generator 204.

[0050] Генератор 204 гармоник принимает подвергаемый повышающей дискретизации сигнал 220 (или выбранный сигнал поддиапазона преобразованного звукового сигнала 112, когда повышающий дискретизатор 202 опущен) и генерирует его гармоники с образованием сигнала 222. Как упоминается со ссылкой на повышающий дискретизатор 202, при генерировании гармоник для сигнала 222 генератор 204 гармоник расширяет ширину полосы его входного сигнала. Например, когда поддиапазон 0 охватывает частоты от 0 до 93,75 Гц, частота дискретизации 750 Гц может являться достаточной для предотвращения эффекта наложения спектров сгенерированных гармоник. Аналогично, когда поддиапазон 2 охватывает частоты от 93,75 до 187,5 Гц, для предотвращения эффекта наложения спектров сгенерированных гармоник может являться достаточной частота дискретизации 750 Гц. Однако, когда поддиапазон 4 охватывает частоты от 187,5 до 281,25 Гц, гармоники приближаются к частоте Найквиста исходного сигнала (с частотой дискретизации 750 Гц), поэтому для поддиапазонов 4, 6 и т.д. рекомендуется повышающая дискретизация. Сигнал 222 представляет собой комплексный сигнал в области преобразования. Сигнал 222 имеет ширину полосы, которая больше ширины полосы входного сигнала в генератор 204 гармоник, вследствие добавления частот гармоник. Например, когда подвергаемый повышающей дискретизации сигнал 220 имеет ширину полосы 93,75 Гц, сигнал 222 может иметь ширину полосы, которая превышает 300 Гц.[0050] The harmonic generator 204 receives the upsampled signal 220 (or the selected subband signal of the converted audio signal 112 when the upsampler 202 is omitted) and generates harmonics thereof to produce a signal 222. As mentioned with reference to the upsampler 202, when generating harmonics for signal 222, a harmonic generator 204 expands the bandwidth of its input signal. For example, when subband 0 covers frequencies from 0 to 93.75 Hz, a sampling rate of 750 Hz may be sufficient to prevent aliasing of the generated harmonics. Similarly, when sub-band 2 covers frequencies from 93.75 to 187.5 Hz, a sampling rate of 750 Hz may be sufficient to prevent aliasing of the generated harmonics. However, when sub-band 4 covers frequencies from 187.5 to 281.25 Hz, the harmonics approach the Nyquist frequency of the original signal (with a sampling rate of 750 Hz), so for sub-bands 4, 6, etc. Upsampling is recommended. Signal 222 is a complex transform domain signal. Signal 222 has a bandwidth that is greater than the input bandwidth to harmonic generator 204 due to the addition of harmonic frequencies. For example, when upsampled signal 220 has a bandwidth of 93.75 Hz, signal 222 may have a bandwidth that is greater than 300 Hz.

[0051] В генераторе 204 гармоник используется нелинейный процесс для генерирования гармоник. В целом нелинейный процесс применяет разные коэффициенты усиления к разным компонентам сигнала. Примеры нелинейных процессов включают умножение, цикл задержки c обратной связью, выпрямление и т.д., как дополнительно подробно описано ниже со ссылкой на фиг. 3, 4, 5 и 8. [0051] The harmonic generator 204 uses a nonlinear process to generate harmonics. In general, the nonlinear process applies different gains to different signal components. Examples of nonlinear processes include multiplication, closed-loop delay loop, rectification, etc., as further described in detail below with reference to FIG. 3, 4, 5 and 8.

[0052] Генератор 204 гармоник может также выполнять расширение громкости при генерировании сигнала 222. Поскольку уровень звукового давления для фиксированного диапазона громкости (в фоне) увеличивается с частотой в диапазоне низких/средних частот (например, менее 800 Гц), генератор 204 гармоник выполняет расширение в динамике при генерировании сигнала 222. Примеры процессов расширения громкости включают динамическое сжатие и коррекцию громкости. Дополнительные подробности расширения громкости предоставлены ниже со ссылкой на фиг. 6.[0052] Harmonic generator 204 may also perform volume spreading when generating signal 222. Since the sound pressure level for a fixed volume range (in the background) increases with frequency in the low/mid frequency range (e.g., less than 800 Hz), harmonic generator 204 performs spreading dynamically when generating signal 222. Examples of loudness expansion processes include dynamic compression and loudness equalization. Additional details of volume expansion are provided below with reference to FIG. 6.

[0053] Устройство 206 обработки динамических характеристик принимает сигнал 222, выполняет обработку динамических характеристик и генерирует сигнал 224. Сигнал 224 представляет собой комплексный сигнал в области преобразования. В целом устройство 206 обработки динамических характеристик реализует обработку динамических характеристик путем выполнения сжатия в отношении сигнала 222 с целью управления соотношением кратковременных и тональных компонентов сигнала 224. Устройство 206 обработки динамических характеристик может реализовать время срабатывания ограничителя, относительно более длительное (например, более длительное в 4–12 раз, например в 8 раз более длительное), чем время выключения. Например, время срабатывания ограничителя может составлять от 140 до 180 мс (например, 160 мс), а время выключения может составлять от 15 до 25 мс (например, 20 мс). Устройство 206 обработки динамических характеристик может реализовать обнаружение несвязанных плавных пиков с использованием топологии с прямой связью. Устройство 206 обработки динамических характеристик может реализовать сжатие, которое подобно сжатию, выполняемому генератором гармоник (который более подробно описан со ссылкой на фиг. 3, 4 и 5).[0053] The dynamics processing device 206 receives the signal 222, performs the dynamics processing, and generates a signal 224. The signal 224 is a complex transform domain signal. In general, the dynamics processing device 206 implements dynamics processing by performing compression on the signal 222 to control the ratio of the short-term and tonal components of the signal 224. The dynamics processing device 206 may implement a limiter response time that is relatively longer (for example, 4 times longer). –12 times, for example 8 times longer) than the shutdown time. For example, the limiter's actuation time may be from 140 to 180 ms (eg, 160 ms), and the off time may be from 15 to 25 ms (eg, 20 ms). The dynamics processing apparatus 206 may implement unrelated soft peak detection using a feed-forward topology. The dynamics processor 206 may implement compression that is similar to the compression performed by a harmonic generator (which is described in more detail with reference to FIGS. 3, 4, and 5).

[0054] Устройство 206 обработки динамических характеристик является необязательным. Когда устройство 206 обработки динамических характеристик опущено, преобразователь 208 принимает сигнал 222 вместо сигнала 224.[0054] The dynamics processing device 206 is optional. When dynamics processing device 206 is omitted, transducer 208 receives signal 222 instead of signal 224.

[0055] Преобразователь 208 принимает сигнал 224 (или сигнал 222, когда устройство 206 обработки динамических характеристик опущено), отбрасывает мнимую часть из сигнала 224 и генерирует сигнал 228. В целом отбрасывание мнимой части снижает вычислительную сложность следующих блоков анализирующих фильтров (например, фильтра 212) вследствие обработки действительнозначных сигналов вместо комплекснозначных сигналов. Как обсуждено выше, сигнал 224 представляет собой комплексный сигнал в области преобразования, который имеет комплексные значения, например, как действительные значения, так и мнимые значения. Преобразователь 208 может отбрасывать мнимую часть сигнала путем взятия вещественной части комплекснозначного сигнала. Сигнал 228 представляет собой действительнозначный сигнал в области преобразования.[0055] Converter 208 receives signal 224 (or signal 222 when dynamics processor 206 is omitted), discards the imaginary portion of signal 224, and generates signal 228. In general, discarding the imaginary portion reduces the computational complexity of subsequent analysis filter blocks (e.g., filter 212 ) due to the processing of real-valued signals instead of complex-valued signals. As discussed above, signal 224 is a complex transform domain signal that has complex values, such as both real values and imaginary values. Converter 208 may discard the imaginary part of the signal by taking the real part of the complex-valued signal. Signal 228 represents a real-valued signal in the transform domain.

[0056] Преобразователь 208 является необязательным и в некоторых вариантах осуществления системы 200 усиления низких частот может быть опущен. Когда повышающий дискретизатор 202 опущен, преобразователь 208 также должен быть опущен, для того чтобы мнимая часть оставалась в пути обработки сигнала для использования следующими компонентами.[0056] Converter 208 is optional and in some embodiments of bass enhancement system 200 may be omitted. When upsampler 202 is omitted, converter 208 must also be omitted in order for the imaginary part to remain in the signal processing path for use by downstream components.

[0057] Фильтр 212 принимает сигнал 228 (или сигнал 224, когда преобразователь 208 опущен, или сигнал 222, когда опущены устройство 206 обработки динамических характеристик и преобразователь 208), выполняет фильтрацию входного сигнала и генерирует сигнал 230. Сигнал 230 представляет собой комплекснозначный сигнал в области преобразования. В целом при фильтрации сигнал 228 разделяется на поддиапазоны в качестве одного из входных сигналов в микшер 216. Особенности фильтрации будут зависеть от того, выполнялась ли повышающая дискретизация (см. повышающий дискретизатор 202).[0057] Filter 212 receives signal 228 (or signal 224 when transducer 208 is omitted, or signal 222 when dynamics processor 206 and transducer 208 are omitted), filters the input signal, and generates signal 230. Signal 230 is a complex-valued signal in transformation areas. In general, filtering splits signal 228 into subbands as one of the input signals to mixer 216. The specifics of filtering will depend on whether upsampling has been performed (see upsampler 202).

[0058] Когда повышающий дискретизатор 202 отсутствует, фильтр 212 может быть реализован путем подачи входного сигнала (например, сигнала 228) в 8-канальный блок фильтров Найквиста для генерирования сигнала 230, который имеет гибридные поддиапазоны 0–7.[0058] When upsampler 202 is not present, filter 212 may be implemented by feeding an input signal (eg, signal 228) to an 8-channel Nyquist filter bank to generate signal 230, which has hybrid subbands 0–7.

[0059] Когда повышающий дискретизатор 202 присутствует, фильтр 212 может быть реализован блоком анализирующих фильтров CQMF и двумя или более фильтрами Найквиста. Вещественная часть входного сигнала (например, сигнала 228) подается в блок анализирующих фильтров CQMF; блок анализирующих фильтров CQMF имеет соответствующее количество каналов для генерирования сигнала 230, имеющего сигналы поддиапазонов с частотой дискретизации 750 Гц. Тогда это соответствующее количество каналов зависит от выполненной повышающей дискретизации. Например, когда выполнена 4-кратная повышающая дискретизация, и, таким образом, в фильтре 212 используется 4-канальный блок анализирующих фильтров CQMF, каждый из трех сигналов поддиапазонов CQMF с самой низкой частотой подается в соответствующий фильтр Найквиста (один из которых генерирует гибридные поддиапазоны 0-7, один из которых генерирует гибридные поддиапазоны 8-11, и один из которых генерирует гибридные поддиапазоны 12-15). В качестве другого примера, когда выполнена 2-кратная повышающая дискретизация, и, таким образом, в фильтре 212 используется 2-канальный блок анализирующих фильтров CQMF, каждый из двух сигналов поддиапазонов CQMF подается в соответствующий фильтр Найквиста (один из которых генерирует гибридные поддиапазоны 0-7, и один из которых генерирует гибридные поддиапазоны 8-11). Остальные каналы CQMF, если они присутствуют, предоставляются в микшер 216 (с соответствующей задержкой, которая соответствует задержке фильтров Найквиста).[0059] When upsampler 202 is present, filter 212 may be implemented by a CQMF analysis filter bank and two or more Nyquist filters. The real part of the input signal (for example, signal 228) is fed to the CQMF analysis filter block; the CQMF analysis filter bank has a suitable number of channels to generate a signal 230 having subband signals with a sampling rate of 750 Hz. This corresponding number of channels then depends on the upsampling performed. For example, when 4x upsampling is performed, and thus a 4-channel CQMF analysis filter bank is used in filter 212, each of the three lowest frequency CQMF subband signals is fed into a corresponding Nyquist filter (one of which generates hybrid subbands 0 -7, one of which generates hybrid subbands 8-11, and one of which generates hybrid subbands 12-15). As another example, when 2x upsampling is performed and thus a 2-channel CQMF analysis filter bank is used in filter 212, each of the two CQMF subband signals is fed to a corresponding Nyquist filter (one of which generates hybrid 0- 7, and one of which generates hybrid subbands 8-11). The remaining CQMF channels, if present, are provided to mixer 216 (with an appropriate delay that matches the delay of the Nyquist filters).

[0060] Фильтр 212 может быть реализован фильтрами, которые подобны фильтрам, используемым в системе 110 преобразования сигнала (см. фиг. 1). Например, первый анализирующий фильтр Найквиста с 8 каналами может генерировать поддиапазоны 0-7, второй анализирующий фильтр Найквиста с 4 каналами может генерировать поддиапазоны 8-11, и третий анализирующий фильтр Найквиста с 4 каналами может генерировать поддиапазоны 12–15.[0060] Filter 212 may be implemented by filters that are similar to those used in signal conditioning system 110 (see FIG. 1). For example, a first 8-channel Nyquist analysis filter can generate subbands 0-7, a second 4-channel Nyquist analysis filter can generate subbands 8-11, and a third 4-channel Nyquist analysis filter can generate subbands 12-15.

[0061] Элемент 214 задержки принимает преобразованный звуковой сигнал 112, реализует период задержки и генерирует сигнал 232. Сигнал 232 соответствует подвергнутой задержке версии преобразованного звукового сигнала 112 согласно периоду задержки. Элемент 214 задержки может быть реализован с использованием запоминающего устройства, сдвигового регистра и т.д. Период задержки соответствует времени обработки других компонентов в цепочке обработки сигнала, например, повышающего дискретизатора 202, генератора 204 гармоник, устройства 206 обработки динамических характеристик, преобразователя 208, фильтра 212 и т.д. Так как некоторые из этих других компонентов являются необязательными, период задержки уменьшается по мере того, как опускаются эти необязательные компоненты. В одном примере период задержки составляет 961 дискретных значений, из которых 577 соответствуют повышающей дискретизации, и 384 соответствуют остальным компонентам, например, фильтрам Найквиста. В качестве другого примера, когда опущен повышающий дискретизатор 202, период задержки составляет 384 дискретных значений.[0061] Delay element 214 receives converted audio signal 112, implements a delay period, and generates signal 232. Signal 232 corresponds to a delayed version of converted audio signal 112 according to the delay period. The delay element 214 may be implemented using a memory device, a shift register, etc. The delay period corresponds to the processing time of other components in the signal processing chain, such as upsampler 202, harmonic generator 204, dynamics processor 206, converter 208, filter 212, etc. Since some of these other components are optional, the delay period decreases as these optional components are omitted. In one example, the delay period is 961 samples, of which 577 correspond to upsampling and 384 correspond to the remaining components, such as Nyquist filters. As another example, when upsampler 202 is omitted, the delay period is 384 samples.

[0062] Микшер 216 принимает сигнал 230 и сигнал 232, выполняет микширование и генерирует усиленный звуковой сигнал 122 (см. фиг. 1). Усиленный звуковой сигнал 122 представляет собой сигнал в области преобразования. Микшер 216 микширует сигналы на основе полос. Например, каждый из сигнала 230 и сигнала 232 может иметь 77 гибридных полос (например, 8+4+4+61 полос HCQMF), и микшер 216 микширует поддиапазон 0 сигнала 230 с поддиапазоном 0 сигнала 232, микширует поддиапазон 1 сигнала 230 с поддиапазоном 1 сигнала 232 и т.д. Микшер 216 необязательно микширует все полосы; при генерировании усиленного звукового сигнала 122 одна или более полос сигнала 232 могут быть пропущены. Например, могут быть пропущены без микширования полосы самых высоких частот (например, одна или более гибридных полос 16–77) сигнала 232.[0062] Mixer 216 receives signal 230 and signal 232, performs mixing, and generates an amplified audio signal 122 (see FIG. 1). The amplified audio signal 122 is a transform domain signal. Mixer 216 mixes signals on a band basis. For example, signal 230 and signal 232 may each have 77 hybrid bands (e.g., 8+4+4+61 HCQMF bands), and mixer 216 mixes subband 0 of signal 230 with subband 0 of signal 232, mixes subband 1 of signal 230 with subband 1 signal 232, etc. Mixer 216 does not necessarily mix all bands; when generating the amplified audio signal 122, one or more bands of the signal 232 may be skipped. For example, the highest frequency bands (e.g., one or more hybrid bands 16-77) of signal 232 may be passed without mixing.

[0063] Ниже предоставлены дополнительные подробности системы 200 усиления низких частот. В первую очередь, обращаясь к фиг. 3-5, обсуждены различные возможности для генератора 204 гармоник.[0063] Further details of the bass enhancement system 200 are provided below. Referring first to FIG. 3-5, various possibilities for harmonic generator 204 are discussed.

[0064] На фиг. 3 изображена блок-схема генератора 300 гармоник. Генератор 300 гармоник может использоваться в качестве генератора 204 гармоник (см. фиг. 2). В целом генератор 300 гармоник генерирует каждую следующую гармонику путем умножения (например, с использованием прямого умножения сигналов) входного сигнала и предыдущих гармоник.[0064] In FIG. 3 is a block diagram of a harmonic generator 300. The harmonic generator 300 may be used as the harmonic generator 204 (see FIG. 2). In general, the harmonic generator 300 generates each subsequent harmonic by multiplying (eg, using direct signal multiplication) the input signal and the previous harmonics.

[0065] Генератор 300 гармоник содержит один или более множителей 302 (показаны два: 302a и 302b), две или более ступеней 304 усиления (показаны три: 304a, 304b и 304c), два или более компрессоров 306 (показаны три: 306a, 306b и 306c) и два или более сумматоров 308 (показаны три: 308a, 308b и 308c). В целом каждый ряд компонентов в генераторе 300 гармоник соответствует одной из генерируемых гармоник, поэтому количество рядов (и соответствующее количество компонентов) может регулироваться для реализации требуемого количества гармоник. Первый ряд обработки содержит ступень 304a усиления, компрессор 306a и сумматор 308a. Второй ряд обработки содержит множитель 302а, ступень 304b усиления, компрессор 306b и сумматор 308b. Третий ряд обработки содержит множитель 302b, ступень 304c усиления, компрессор 306c и сумматор 308c. Для генерирования дополнительных гармоник могут быть добавлены дополнительные ряды, причем каждый новый ряд соединен с предыдущим рядом способом, который подобен способу, показанному на фигуре.[0065] The harmonic generator 300 includes one or more multipliers 302 (two shown: 302a and 302b), two or more gain stages 304 (three shown: 304a, 304b and 304c), two or more compressors 306 (three shown: 306a, 306b and 306c) and two or more adders 308 (three shown: 308a, 308b and 308c). In general, each row of components in the harmonic generator 300 corresponds to one of the generated harmonics, so the number of rows (and the corresponding number of components) can be adjusted to realize the desired number of harmonics. The first processing row includes a gain stage 304a, a compressor 306a, and an adder 308a. The second processing row includes a multiplier 302a, a gain stage 304b, a compressor 306b, and an adder 308b. The third processing row includes a multiplier 302b, a gain stage 304c, a compressor 306c, and an adder 308c. Additional rows may be added to generate additional harmonics, each new row being connected to the previous row in a manner similar to that shown in the figure.

[0066] Генератор 300 гармоник принимает входной сигнал 320, также обозначенный как «x». Входной сигнал 320 соответствует подвергаемому повышающей дискретизации сигналу 220 (см. фиг. 2), когда повышающий дискретизатор 202 присутствует, или преобразованному звуковому сигналу 112, когда повышающий дискретизатор 202 отсутствует. Входной сигнал 320 представляет собой комплексный сигнал в области преобразования. Например, входной сигнал 320 может соответствовать полосе HCQMF (например, гибридному поддиапазону 0, гибридному поддиапазону 2, гибридному поддиапазону 4, гибридному поддиапазону 6 и т.д.). Генератор 300 гармоник генерирует сигнал 222 (см. фиг. 2).[0066] Harmonic generator 300 receives input signal 320, also designated “x”. Input signal 320 corresponds to the upsampled signal 220 (see FIG. 2) when upsampler 202 is present, or the converted audio signal 112 when upsampler 202 is absent. Input signal 320 is a complex transform domain signal. For example, input signal 320 may correspond to an HCQMF band (eg, hybrid subband 0, hybrid subband 2, hybrid subband 4, hybrid subband 6, etc.). The harmonic generator 300 generates a signal 222 (see FIG. 2).

[0067] Начиная с множителей 302, множитель 302а принимает входной сигнал 320, выполняет умножение входного сигнала 320 на самого себя и генерирует сигнал 322а, также обозначенный как «x²». Множитель 302b принимает входной сигнал 320 и сигнал 322а, выполняет умножение входного сигнала 320 на сигнал 322а и генерирует сигнал 322b, также обозначенный как «x³». Следует отметить, что выходной сигнал данного множителя предоставляется в качестве входного сигнала в множитель в следующем ряду обработки: сигнал 322а предоставляется в множитель 302b, сигнал 322b предоставляется в множитель в следующем ряду (показан пунктирной линией) и т.д.[0067] Starting with multipliers 302, multiplier 302a receives input signal 320, multiplies input signal 320 by itself, and generates signal 322a, also denoted " ^x2 ". Multiplier 302b receives input signal 320 and signal 322a, multiplies input signal 320 by signal 322a, and generates signal 322b, also designated “ ^x3 ”. It should be noted that the output signal of a given multiplier is provided as an input signal to the multiplier in the next row of processing: signal 322a is provided to multiplier 302b, signal 322b is provided to the multiplier in the next row (shown by the dotted line), etc.

[0068] Обращаясь к ступеням 304 усиления, ступень 304a усиления принимает входной сигнал 320, применяет коэффициент усиления g ₁ и генерирует сигнал 324a. Ступень 304b усиления принимает сигнал 322a, применяет коэффициент усиления g ₂ и генерирует сигнал 324b. Ступень 304c усиления принимает сигнал 322b, применяет коэффициент усиления g ₃ и генерирует сигнал 324c. При необходимости коэффициенты усиления g ₁, g ₂, g ₃ и т.д. могут регулироваться, обычно в виде осуществления настройки для каждого конкретного устройства, реализующего генератор 300 гармоник. В целом коэффициент усиления g ₁ может быть намного меньше других коэффициентов усиления (например, составлять менее 50 % относительно других коэффициентов усиления). Приравнивание коэффициента усиления g ₁ малому значению уменьшает то, что называется прямым сигналом, соответствующим исходной низкочастотной гармонике, которая является нежелательной в громкоговорителях малого размера, физически не отвечающих требованиям воспроизведения любого сигнала в частотном диапазоне прямого сигнала. При необходимости коэффициент усиления g ₁ может приравниваться нулю для исключения прямого сигнала.[0068] Referring to gain stages 304, gain stage 304a receives input signal 320, applies gain g ₁ and generates signal 324a. Gain stage 304b receives signal 322a, applies gain g ₂ and generates signal 324b. Gain stage 304c receives signal 322b, applies gain g ₃ and generates signal 324c. If necessary, gain factors g ₁ , g ₂ , g ₃ , etc. can be adjusted, usually in the form of making adjustments for each specific device implementing the harmonic generator 300. In general, the gain g ₁ can be much smaller than other gains (for example, less than 50% relative to other gains). Setting the gain g ₁ to a small value reduces what is called the direct signal corresponding to the original low-frequency harmonic, which is undesirable in small speakers that are physically unable to reproduce any signal in the frequency range of the direct signal. If necessary, the gain g ₁ can be set to zero to eliminate the direct signal.

[0069] Обращаясь к компрессорам 306, компрессор 306a принимает сигнал 324а, выполняет динамическое сжатие и генерирует сигнал 326a. Компрессор 306b принимает сигнал 324b, выполняет динамическое сжатие и генерирует сигнал 326b. Компрессор 306c принимает сигнал 324c, выполняет динамическое сжатие и генерирует сигнал 326c. Динамическое сжатие в целом соответствует уравнению y ^r, где y соответствует входному сигналу (например, сигналу 324a), и r – это степень сжатия, при этом r меньше 1. Степень сжатия r может отличаться для каждой гармоники (например, для каждого ряда). Например, степень сжатия r ₁ для компрессора 306a может отличаться от степени сжатия r ₂ для компрессора 306b, которая может отличаться от степени сжатия r ₃ для компрессора 306с, и т.д. Степени сжатия могут регулироваться в форме параметров настройки на основе конкретных физических характеристик устройства, реализующего генератор 300 гармоник. Дополнительные подробности компрессоров 306 предоставлены ниже в обсуждении относительно расширения громкости.[0069] Referring to compressors 306, compressor 306a receives signal 324a, performs dynamic compression, and generates signal 326a. Compressor 306b receives signal 324b, performs dynamic compression, and generates signal 326b. Compressor 306c receives signal 324c, performs dynamic compression, and generates signal 326c. Dynamic compression generally follows the equation y ^r , where y corresponds to the input signal (eg, signal 324a) and r is the compression ratio, with r less than 1. The compression ratio r may be different for each harmonic (for example, for each row). For example, the compression ratio r ₁ for compressor 306a may be different from the compression ratio r ₂ for compressor 306b, which may be different from the compression ratio r ₃ for compressor 306c, etc. The compression ratios may be adjusted in the form of settings based on the specific physical characteristics of the device implementing the harmonic generator 300. Additional details of the 306 compressors are provided below in the discussion regarding volume expansion.

[0070] Обращаясь к сумматорам 308, сумматор 308с принимает сигнал 326с (и любой выходной сигнал из сумматора в любом дополнительном ряду), выполняет сложение и генерирует сигнал 328b. Сумматор 308b принимает сигнал 326b и сигнал 328b, выполняет сложение и генерирует сигнал 328a. Сумматор 308а принимает сигнал 326а и сигнал 328а, выполняет сложение и генерирует сигнал 222 (см. фиг. 2). Следует отметить, что один из входных сигналов в данный сумматор предоставляется сумматором в следующем ряду обработки: сумматор 308с принимает выходной сигнал сумматора в следующем ряду обработки (показан пунктирной линией), сумматор 308b принимает выходной сигнал сумматора 308с, сумматор 308а принимает выходной сигнал сумматора 308b, и т.д.[0070] Referring to the adders 308, the adder 308c receives signal 326c (and any output from the adder in any additional row), performs the addition, and generates signal 328b. Adder 308b receives signal 326b and signal 328b, performs an addition, and generates signal 328a. Adder 308a receives signal 326a and signal 328a, performs the addition, and generates signal 222 (see FIG. 2). It should be noted that one of the inputs to this adder is provided by the adder in the following processing row: adder 308c receives the output of the adder in the next processing row (shown by the dotted line), adder 308b receives the output of adder 308c, adder 308a receives the output of adder 308b, etc.

[0071] Генератор 300 гармоник обрабатывает комплекснозначные сигналы, например, сигналы с очень малым вкладом отрицательных частот. Таким образом, при генерировании гармоник путем умножения комплекснозначного сигнала на самого себя получается более чистый выходной сигнал, чем если бы входной сигнал являлся действительнозначным, например, это приводит к меньшим интермодуляционным искажениям. В комплекснозначном случае для входного сигнала, состоящего из множества частот, генерируются только требуемые члены с добавлением членов из сумм частот, но не членов из разностей частот, как было бы в случае действительнозначной обработки. Разностные члены, хотя и обычно с низкими частотами, являются более неприятными для восприятия, чем суммарные члены. Суммарные члены могут фактически являться желательными, например, тогда, когда входной сигнал содержит гармонический ряд.[0071] The harmonic generator 300 processes complex-valued signals, for example, signals with a very small contribution of negative frequencies. Thus, generating harmonics by multiplying a complex-valued signal by itself produces a cleaner output signal than if the input signal were real-valued, for example, resulting in less intermodulation distortion. In the complex-valued case, for an input signal consisting of many frequencies, only the required terms are generated, with the addition of terms from the sums of frequencies, but not terms from the differences of frequencies, as would be the case for real-valued processing. Difference terms, although usually low-frequency, are more unpleasant to hear than sum terms. The sum terms may in fact be desired, for example, when the input signal contains a harmonic series.

[0072] На фиг. 4 изображена блок-схема генератора 400 гармоник. Генератор 400 гармоник может использоваться в качестве генератора 204 гармоник (см. фиг. 2). В целом генератор 400 гармоник генерирует гармоники путем применения цикла задержки с обратной связью к входному сигналу. Генератор 400 гармоник содержит множитель 402, ступень 404 усиления, ступень 406 сложения, компрессор 408, ступень 410 задержки, ступень 412 усиления и ступень 414 усиления.[0072] In FIG. 4 is a block diagram of a harmonic generator 400. The harmonic generator 400 may be used as the harmonic generator 204 (see FIG. 2). In general, the harmonic generator 400 generates harmonics by applying a feedback delay loop to an input signal. The harmonic generator 400 includes a multiplier 402, a gain stage 404, an add stage 406, a compressor 408, a delay stage 410, a gain stage 412, and a gain stage 414.

[0073] Генератор 400 гармоник принимает входной сигнал 420. Входной сигнал 420 соответствует подвергаемому повышающей дискретизации сигналу 220 (см. фиг. 2), когда повышающий дискретизатор 202 присутствует, или преобразованному звуковому сигналу 112, когда повышающий дискретизатор 202 отсутствует. Входной сигнал 420 представляет собой комплексный сигнал в области преобразования. Например, входной сигнал 420 может соответствовать полосе HCQMF (например, гибридному поддиапазону 0, гибридному поддиапазону 2, гибридному поддиапазону 4, гибридному поддиапазону 6 и т.д.). Генератор 400 гармоник генерирует сигнал 222 (см. фиг. 2).[0073] The harmonic generator 400 receives an input signal 420. The input signal 420 corresponds to the upsampled signal 220 (see FIG. 2) when the upsampler 202 is present, or the converted audio signal 112 when the upsampler 202 is absent. Input signal 420 is a complex transform domain signal. For example, input signal 420 may correspond to an HCQMF band (eg, hybrid subband 0, hybrid subband 2, hybrid subband 4, hybrid subband 6, etc.). A harmonic generator 400 generates a signal 222 (see FIG. 2).

[0074] Множитель 402 принимает входной сигнал 420, умножает входной сигнал 420 на сигнал 432 и генерирует сигнал 422. Сигнал 432 может также быть назван сигналом 432 обратной связи, и он обсуждается более подробно ниже со ссылкой на ступень 412 усиления.[0074] Multiplier 402 receives input signal 420, multiplies input signal 420 by signal 432, and generates signal 422. Signal 432 may also be referred to as feedback signal 432, and is discussed in more detail below with reference to gain stage 412.

[0075] Ступень 404 усиления принимает входной сигнал 420, применяет коэффициент усиления a и генерирует сигнал 424. Коэффициент усиления a может также быть назван переходным коэффициентом усиления. Значение коэффициента усиления a может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 400 гармоник.[0075] Gain stage 404 receives input signal 420, applies gain a, and generates signal 424. Gain a may also be referred to as transient gain. The value of the gain a may be adjusted in the form of a tuning parameter based on the particular physical characteristics of the device implementing the harmonic generator 400.

[0076] Ступень 406 сложения принимает сигнал 422 и сигнал 424, выполняет сложение и генерирует сигнал 426. Комбинация ступени 404 усиления и ступени 406 сложения при добавлении к сигналу 422 используется для содействия запуску цикла c обратной связью (например, когда сигнал 432 изначально равен нулю) и в остальном способствует поддержанию работы цикла c обратной связью.[0076] Adder stage 406 receives signal 422 and signal 424, performs the addition, and generates signal 426. The combination of gain stage 404 and adder stage 406, when added to signal 422, is used to assist in starting a closed-loop loop (for example, when signal 432 is initially zero ) and otherwise contributes to maintaining the operation of the feedback loop.

[0077] Компрессор 408 принимает сигнал 426, выполняет динамическое сжатие и генерирует сигнал 428. Динамическое сжатие в целом соответствует уравнению y ^r, где y соответствует входному сигналу (например, сигналу 426), и r – это степень сжатия, при этом r меньше 1. Степень сжатия может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 400 гармоник. Дополнительные подробности компрессора 408 предоставлены ниже в обсуждении относительно расширения громкости.[0077] Compressor 408 receives signal 426, performs dynamic compression, and generates signal 428. Dynamic compression generally follows the equation y ^r , where y corresponds to the input signal (eg, signal 426) and r is the compression ratio, with r less than 1 The compression ratio may be adjusted in the form of a tuning parameter based on the specific physical characteristics of the device implementing the harmonic generator 400. Additional details of the 408 compressor are provided below in the discussion regarding volume expansion.

[0078] Ступень 410 задержки принимает сигнал 428, выполняет операцию задержки и генерирует сигнал 430. Ступень 410 задержки может быть реализована с использованием запоминающего устройства.[0078] Delay stage 410 receives signal 428, performs a delay operation, and generates signal 430. Delay stage 410 may be implemented using a memory device.

[0079] Ступень 412 усиления принимает сигнал 430, применяет коэффициент усиления g и генерирует сигнал 432. Коэффициент усиления g может также быть назван коэффициентом усиления обратной связи. Как обсуждено выше в отношении множителя 402, сигнал 432 умножается на входной сигнал 420 для генерирования гармоник теоретически неограниченного порядка.[0079] Gain stage 412 receives signal 430, applies gain g , and generates signal 432. Gain g may also be referred to as feedback gain. As discussed above with respect to multiplier 402, signal 432 is multiplied by input signal 420 to generate harmonics of a theoretically unlimited order.

[0080] Ступень 414 усиления принимает сигнал 428, применяет коэффициент усиления h и генерирует сигнал 222 (см. фиг. 2). Коэффициент усиления h может также быть назван выходным коэффициентом усиления. Значение коэффициента усиления h может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 400 гармоник.[0080] Gain stage 414 receives signal 428, applies gain h, and generates signal 222 (see FIG. 2). The gain h can also be called the output gain. The value of the gain h may be adjusted in the form of a tuning parameter based on the specific physical characteristics of the device implementing the harmonic generator 400.

[0081] Как и в случае генератора 300 гармоник, генератор 400 гармоник генерирует прямой сигнал, соответствующий исходной низкочастотной гармонике. При необходимости прямой сигнал может быть уменьшен путем регулировки значений коэффициента усиления a и степени сжатия r.[0081] As with the harmonic generator 300, the harmonic generator 400 generates a direct signal corresponding to the original low frequency harmonic. If necessary, the direct signal can be reduced by adjusting the values of the gain a and the compression ratio r .

[0082] Как и в случае генератора 300 гармоник, генератор 400 гармоник обрабатывает комплекснозначные сигналы, и при генерировании гармоник путем умножения комплекснозначного сигнала на самого себя получается более чистый выходной сигнал, чем если бы входной сигнал являлся действительнозначным.[0082] As with the harmonic generator 300, the harmonic generator 400 processes complex-valued signals, and by generating harmonics by multiplying the complex-valued signal by itself, a cleaner output signal is produced than if the input signal were real-valued.

[0083] На фиг. 5 изображена блок-схема генератора 500 гармоник. Генератор 500 гармоник может использоваться в качестве генератора 204 гармоник (см. фиг. 2). Генератор 500 гармоник подобен генератору 400 гармоник (см. фиг. 4) за исключением добавления сигнала переходного коэффициента усиления после компрессора. Генератор 500 гармоник содержит множитель 502, компрессор 504, ступень 506 усиления, ступень 508 сложения, ступень 510 задержки, ступень 512 усиления и ступень 514 усиления.[0083] In FIG. 5 is a block diagram of a harmonic generator 500. The harmonic generator 500 may be used as the harmonic generator 204 (see FIG. 2). The harmonic generator 500 is similar to the harmonic generator 400 (see FIG. 4) except for the addition of a transient gain signal after the compressor. The harmonic generator 500 includes a multiplier 502, a compressor 504, a gain stage 506, an add stage 508, a delay stage 510, a gain stage 512, and a gain stage 514.

[0084] Генератор 500 гармоник принимает входной сигнал 520. Входной сигнал 520 соответствует подвергаемому повышающей дискретизации сигналу 220 (см. фиг. 2), когда повышающий дискретизатор 202 присутствует, или преобразованному звуковому сигналу 112, когда повышающий дискретизатор 202 отсутствует. Входной сигнал 520 представляет собой комплексный сигнал в области преобразования. Например, входной сигнал 520 может соответствовать полосе HCQMF (например, гибридному поддиапазону 0, гибридному поддиапазону 2, гибридному поддиапазону 4, гибридному поддиапазону 6 и т.д.). Генератор 500 гармоник генерирует сигнал 222 (см. фиг. 2).[0084] The harmonic generator 500 receives an input signal 520. The input signal 520 corresponds to the upsampled signal 220 (see FIG. 2) when the upsampler 202 is present, or the converted audio signal 112 when the upsampler 202 is absent. Input signal 520 is a complex transform domain signal. For example, input signal 520 may correspond to an HCQMF band (eg, hybrid subband 0, hybrid subband 2, hybrid subband 4, hybrid subband 6, etc.). The harmonic generator 500 generates a signal 222 (see FIG. 2).

[0085] Множитель 502 принимает входной сигнал 520, умножает входной сигнал 520 на сигнал 532 и генерирует сигнал 522. Сигнал 532 может также быть назван сигналом 532 обратной связи, и он обсуждается более подробно ниже со ссылкой на ступень 512 усиления.[0085] Multiplier 502 receives input signal 520, multiplies input signal 520 by signal 532, and generates signal 522. Signal 532 may also be referred to as feedback signal 532, and is discussed in more detail below with reference to gain stage 512.

[0086] Компрессор 504 принимает сигнал 522, выполняет динамическое сжатие и генерирует сигнал 524. Динамическое сжатие в целом соответствует уравнению y ^r, где y соответствует входному сигналу (например, сигналу 522), и r – это степень сжатия, при этом r меньше 1. Степень сжатия может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 500 гармоник. Дополнительные подробности компрессора 504 предоставлены ниже в обсуждении относительно расширения громкости.[0086] Compressor 504 receives signal 522, performs dynamic compression, and generates signal 524. Dynamic compression generally follows the equation y ^r , where y corresponds to the input signal (eg, signal 522) and r is the compression ratio, with r less than 1 The compression ratio may be adjusted in the form of a tuning parameter based on the specific physical characteristics of the device implementing the harmonic generator 500. Additional details of the 504 compressor are provided below in the discussion regarding volume expansion.

[0087] Ступень 506 усиления принимает входной сигнал 520, применяет коэффициент усиления a и генерирует сигнал 526. Коэффициент усиления a может также быть назван переходным коэффициентом усиления. Значение коэффициента усиления a может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 500 гармоник.[0087] Gain stage 506 receives input signal 520, applies gain a, and generates signal 526. Gain a may also be referred to as transient gain. The value of the gain a may be adjusted in the form of a tuning parameter based on the particular physical characteristics of the device implementing the harmonic generator 500.

[0088] Ступень 508 сложения принимает сигнал 524 и сигнал 526, выполняет сложение и генерирует сигнал 528. Комбинация ступени 506 усиления и ступени 508 сложения при добавлении к сигналу 524 используется для содействия запуску цикла c обратной связью (например, когда сигнал 532 изначально равен нулю) и в остальном способствует поддержанию работы цикла c обратной связью.[0088] Adder stage 508 receives signal 524 and signal 526, performs the addition, and generates signal 528. The combination of gain stage 506 and adder stage 508, when added to signal 524, is used to assist in starting a closed-loop loop (for example, when signal 532 is initially zero ) and otherwise contributes to maintaining the operation of the feedback loop.

[0089] Ступень 510 задержки принимает сигнал 528, выполняет операцию задержки и генерирует сигнал 530. Ступень 510 задержки может быть реализована с использованием запоминающего устройства.[0089] Delay stage 510 receives signal 528, performs a delay operation, and generates signal 530. Delay stage 510 may be implemented using a memory device.

[0090] Ступень 512 усиления принимает сигнал 530, применяет коэффициент усиления g и генерирует сигнал 532. Коэффициент усиления g может также быть назван коэффициентом усиления обратной связи. Как обсуждено выше в отношении множителя 502, сигнал 532 умножается на входной сигнал 520 для генерирования гармоник теоретически неограниченного порядка.[0090] Gain stage 512 receives signal 530, applies gain g , and generates signal 532. Gain g may also be referred to as feedback gain. As discussed above with respect to multiplier 502, signal 532 is multiplied by input signal 520 to generate harmonics of a theoretically unlimited order.

[0091] Ступень 514 усиления принимает сигнал 524, применяет коэффициент усиления h и генерирует сигнал 222 (см. фиг. 2). Коэффициент усиления h может также быть назван выходным коэффициентом усиления. Значение коэффициента усиления h может регулироваться в форме параметра настройки на основе конкретных физических характеристик устройства, реализующего генератор 500 гармоник.[0091] Gain stage 514 receives signal 524, applies gain h, and generates signal 222 (see FIG. 2). The gain h can also be called the output gain. The value of the gain h may be adjusted in the form of a tuning parameter based on the particular physical characteristics of the device implementing the harmonic generator 500.

[0092] По сравнению с генератором 300 гармоник (см. фиг. 3) и генератором 400 гармоник (см. фиг. 4), генератор 500 гармоник избегает пути прямого сигнала за счет сложения входного сигнала 520 позднее в цикле (например, в виде сигнала 526). В такой компоновке входной сигнал 520 пропускается через множитель 502 (в отличие от сумматора 406 на фиг. 4) как часть генерирования сигнала 222, поэтому сигнал 222 не содержит прямой сигнал.[0092] Compared to harmonic generator 300 (see FIG. 3) and harmonic generator 400 (see FIG. 4), harmonic generator 500 avoids the direct signal path by adding input signal 520 later in the cycle (e.g., as a signal 526). In such an arrangement, input signal 520 is passed through multiplier 502 (as opposed to adder 406 in FIG. 4) as part of generating signal 222, so signal 222 does not contain a direct signal.

[0093] Как и в случае генератора 300 гармоник и генератора 400 гармоник, генератор 500 гармоник обрабатывает комплекснозначные сигналы, и при генерировании гармоник путем умножения комплекснозначного сигнала на самого себя получается более чистый выходной сигнал, чем если бы входной сигнал являлся действительнозначным.[0093] As with harmonic generator 300 and harmonic generator 400, harmonic generator 500 processes complex-valued signals, and by generating harmonics by multiplying the complex-valued signal by itself, a cleaner output signal is produced than if the input signal were real-valued.

Расширение громкостиVolume expansion

[0094] Как обсуждено выше, поскольку уровень звукового давления для фиксированного диапазона громкости (в фоне) увеличивается с частотой в диапазоне низких/средних частот (например, менее 800 Гц), генераторы гармоник (например, генератор 204 гармоник, изображенный на фиг. 2, генератор 300 гармоник, изображенный на фиг. 3, генератор 400 гармоник, изображенный на фиг. 4, генератор 500 гармоник, изображенный на фиг. 5, и т.д.) при генерировании своих выходных сигналов выполняют расширение в динамических характеристиках. При выполнении расширения громкости в генераторах гармоник могут использоваться компрессоры (например, компрессоры 306, изображенные на фиг. 3, компрессор 408, изображенный на фиг. 4, компрессор 504, изображенный на фиг. 5, и т.д.). Примеры процессов расширения громкости включают динамическое сжатие и коррекцию громкости. [0094] As discussed above, since the sound pressure level for a fixed volume range (in the background) increases with frequency in the low/mid frequency range (eg, less than 800 Hz), harmonic generators (eg, harmonic generator 204 shown in FIG. 2 , the harmonic generator 300 shown in Fig. 3, the harmonic generator 400 shown in Fig. 4, the harmonic generator 500 shown in Fig. 5, etc.) perform expansion in the dynamic characteristics when generating their output signals. When performing volume expansion, the harmonic generators may use compressors (eg, compressors 306 of FIG. 3, compressor 408 of FIG. 4, compressor 504 of FIG. 5, etc.). Examples of loudness expansion processes include dynamic compression and loudness equalization.

Динамическое сжатиеDynamic compression

[0095] Генераторы гармоник могут генерировать гармоники n-го порядка с использованием операции, соответствующей уравнению (1):[0095] Harmonic generators can generate nth order harmonics using an operation corresponding to equation (1):

[0096] В уравнении (1) n – порядок гармоники, y – выходной сигнал, x – входной сигнал, – комплексная экспоненциальная функция, j – мнимое число, и фаза. Выходной сигнал генерируется путем n-кратного умножения входного сигнала на самого себя. Соответственно увеличение n повышает порядок генерируемой гармоники. (Правая сторона уравнения (1) служит позднее в данном документе в качестве иллюстрации того, почему динамическое расширение однозначно приводит к динамическому сжатию, когда сигналы были умножены сами на себя).[0096] In equation (1), n is the harmonic order, y is the output signal, x is the input signal, is a complex exponential function, j is an imaginary number, and phase. The output signal is generated by multiplying the input signal n times by itself. Accordingly, increasing n increases the order of the generated harmonic. (The right side of equation (1) serves later in this document as an illustration of why dynamic expansion clearly results in dynamic compression when the signals have been multiplied by themselves.)

[0097] На фиг. 6 изображен график 600, на котором показаны кривые равной громкости. На графике 600 ось х представляет собой частоту в Гц, а ось у – уровень звукового давления (SPL) в дБ. График 600 содержит 6 кривых 602a, 602b, 602c, 602d, 602e и 602f (совместно – кривые 602). Каждая из кривых 602 соответствует уровню громкости в фоне, который представляет собой логарифмическую меру воспринимаемой амплитуды звука. Каждая из кривых 602 может также быть названа кривой равной громкости звука. Кривая 602а соответствует порогу восприятия, кривая 602b соответствует громкости 20 фонов, кривая 602с соответствует громкости 40 фонов, кривая 602d соответствует громкости 60 фонов, кривая 602е соответствует громкости 80 фонов, и кривая 602f соответствует громкости 100 фонов.[0097] In FIG. 6 is a graph 600 showing equal loudness curves. In the 600 graph, the x-axis represents the frequency in Hz and the y-axis represents the sound pressure level (SPL) in dB. The graph 600 contains 6 curves 602a, 602b, 602c, 602d, 602e and 602f (collectively, curves 602). Each of the curves 602 corresponds to a background loudness level, which is a logarithmic measure of the perceived amplitude of the sound. Each of the curves 602 may also be referred to as a sound volume equal curve. Curve 602a corresponds to the perceptual threshold, curve 602b corresponds to the loudness of 20 phons, curve 602c corresponds to the loudness of 40 phons, curve 602d corresponds to the loudness of 60 phons, curve 602e corresponds to the loudness of 80 phons, and curve 602f corresponds to the loudness of 100 phons.

[0098] При генерировании гармоник при помощи операции, описанной в уравнении (1), динамические характеристики расширяются с коэффициентом n. С учетом этой информации, кривые 602 равной громкости звука предполагают соотношение по уравнению (2):[0098] When generating harmonics using the operation described in equation (1), the dynamic characteristics are expanded by a factor n . Given this information, equal sound volume curves 602 assume the relationship of Equation (2):

[0099] В уравнении (2) член представляет собой степень расширения остатка, которая связана с основной частотой f и порядком гармоник n. Степень расширения остатка обычно находится в диапазоне 1,1-1,4 в зависимости от основной частоты f и порядка гармоник n. Когда гармоники генерируются согласно уравнению (1), требуемая степень расширения может достигаться путем сжатия выходного сигнала из генератора гармоник с коэффициентом . (В качестве отступления термины «расширение» и «сжатие» в целом можно использовать как синонимы, причем «сжатие» используется, когда степень меньше 1, а «расширение» используется, когда степень больше 1. Поэтому коэффициент может быть назван «сжатием» из-за делителя n).[0099] In equation (2), the term represents the degree of expansion of the remainder, which is related to the fundamental frequency f and the harmonic order n . Residue expansion ratio usually in the range of 1.1-1.4 depending on the fundamental frequency f and the order of the harmonics n . When harmonics are generated according to equation (1), the required expansion ratio is can be achieved by compressing the output signal from the harmonic generator by a factor . (As an aside, the terms "expansion" and "compression" can generally be used interchangeably, with "compression" being used when the degree is less than 1 and "expansion" being used when the degree is greater than 1. Therefore, the coefficient may be called "compression" due to the divisor n ).

[0100] На графике 600 линии 610 и 612 иллюстрируют пример расширения громкости. Линия 610 указывает диапазон громкости от 20 фонов до 80 фонов для основной частоты 50 Гц. Линия 612 соответствует генерированию 50 Гц гармоники 4-го порядка из 400 Гц с таким же диапазоном громкости. Стрелка 614 от 610 до 612 указывает генерирование гармоники 4-го порядка. Динамический диапазон SPL основной частоты (линия 610) составляет приблизительно 38 дБ в пределах диапазона громкости от 20 до 80 фонов, а динамический диапазон SPL гармоники 4-го порядка (линия 612) составляет приблизительно 50 дБ для того же диапазона громкости. Таким образом, при генерировании гармоники 4-го порядка из основной гармоники с громкостью 80 фонов и частотой 50 Гц эту гармонику необходимо ослабить на приблизительно 20 дБ. Когда основная гармоника, напротив, имеет громкость 20 фонов, эту гармонику необходимо ослабить почти на 40 дБ, с увеличением в необходимом ослаблении на приблизительно 20 дБ.[0100] In graph 600, lines 610 and 612 illustrate an example of volume expansion. Line 610 indicates a volume range from 20 phons to 80 phons for a fundamental frequency of 50 Hz. Line 612 corresponds to generating a 50 Hz 4th order harmonic from 400 Hz with the same volume range. Arrow 614 from 610 to 612 indicates 4th order harmonic generation. The dynamic range of the fundamental frequency SPL (line 610) is approximately 38 dB over the loudness range from 20 to 80 phons, and the dynamic range of the 4th order harmonic SPL (line 612) is approximately 50 dB over the same loudness range. Thus, when generating a 4th order harmonic from a fundamental with a volume of 80 phons and a frequency of 50 Hz, this harmonic must be attenuated by approximately 20 dB. When the fundamental, on the other hand, is 20 phons loud, that harmonic needs to be attenuated by nearly 40 dB, with an increase in the required attenuation of approximately 20 dB.

[0101] Степень расширения SPL по отношению к фону, также называемая расширением громкости, может быть аппроксимирована согласно уравнению (3):[0101] The degree of SPL spreading relative to the background, also called loudness spreading, can be approximated according to equation (3):

[0102] В уравнении (3) – это степень расширения SPL по отношению к фону, которая включает обратное отношение к частоте f.[0102] In equation (3) is the degree of expansion of the SPL relative to the background, which includes the inverse of the frequency f .

[0103] Степень расширения остатка задана уравнением (4):[0103] Residue expansion ratio given by equation (4):

[0104] В уравнении (4) степень расширения остатка соответствует соотношению степени расширения SPL по отношению к фону основной частоты f и степени расширения SPL по отношению к фону гармоники которое соответствует соотношению между натуральным логарифмом n (порядка гармоники) и натуральным логарифмом f (основной частоты). Иначе говоря, степень расширения остатка определяет коэффициент, необходимый при генерировании n-й гармоники на основе основной частоты f (в Гц). Уравнения (3) и (4) хорошо согласуются с кривыми равной громкости, изображенными на фиг. 6, в диапазоне громкости 20-80 фонов и при частотах от 20 до 1000 Гц. При использовании генератора 400 гармоник (см. фиг. 4) или генератора 500 гармоник (см. фиг. 5), необходимое динамическое сжатие может быть выполнено с достаточной точностью при использовании одного простого компрессора, имеющего постоянную степень (например, такого, как компрессор 408 или компрессор 504).[0104] In equation (4), the expansion ratio of the remainder corresponds to the ratio of the degree of expansion SPL in relation to the background of the fundamental frequency f and the degree of expansion SPL in relation to the background of the harmonic which corresponds to the relationship between the natural logarithm of n (harmonic order) and the natural logarithm of f (fundamental frequency). In other words, the degree of expansion of the remainder defines the coefficient required when generating the nth harmonic based on the fundamental frequency f (in Hz). Equations (3) and (4) are in good agreement with the equal loudness curves shown in Fig. 6, in the volume range of 20-80 backgrounds and at frequencies from 20 to 1000 Hz. When using a harmonic generator 400 (see FIG. 4) or a harmonic generator 500 (see FIG. 5), the required dynamic compression can be achieved with reasonable accuracy using a single simple compressor having a constant degree (for example, such as compressor 408 or compressor 504).

[0105] Компрессор может применять динамическое сжатие с использованием усредняющего фильтра первого порядка во избежание искажения вследствие нормализации на основе дискретных значений. Усредняющий фильтр первого порядка может обрабатывать управляющий сигнал s, который может быть вычислен согласно уравнению (5):[0105] The compressor may apply dynamic compression using a first order averaging filter to avoid distortion due to sample-based normalization. The first order averaging filter can process the control signal s , which can be calculated according to equation (5):

[0106] В уравнении (5) m – номер дискретного значения, c – коэффициент усиления сжатия, и α – весовой коэффициент между значением управляющего сигнала для предыдущего дискретного значения и значением коэффициента усиления сжатия для текущего дискретного значения. Весовой коэффициент α может быть также назван экспоненциальным коэффициентом сглаживания, и он соответствует полюсу в системе нижних частот первого порядка.[0106] In Equation (5), m is the sample number, c is the compression gain, and α is the weighting coefficient between the control signal value for the previous sample and the compression gain value for the current sample. The weighting factor α can also be called the exponential smoothing factor, and it corresponds to a pole in the first-order low-pass system.

[0107] Весовой коэффициент α может быть вычислен с использованием уравнения (6):[0107] The weighting factor α can be calculated using equation (6):

[0108] В уравнении (6) частота дискретизации, и постоянная времени. [0108] In equation (6) sampling rate, and time constant.

[0109] Коэффициент усиления сжатия c может быть вычислен с использованием уравнения (7):[0109] The compression gain c can be calculated using equation (7):

[0110] В уравнении (7) a и b – полиномиальные коэффициенты, которые применяются к каждому порядку величины дискретного значения m входного сигнала x. Применение коэффициента усиления сжатия c (или сглаженной версии s по уравнению (5)) к сигналу x в виде c ⋅ x (или c ⋅ x) соответствует рациональному приближению , которое представляет собой абсолютное значение сигнала x, подвергнутого воздействию степени сжатия r, умноженное на знаковую функцию x. [0110] In equation (7), a and b are polynomial coefficients that apply to each order of magnitude of the sample value m of the input signal x . Applying a compression gain c (or a smoothed version of s from equation (5)) to a signal x of the form c ⋅ x (or c ⋅ x ) corresponds to a rational approximation , which is the absolute value of the signal x subjected to the compression ratio r , multiplied by the sign function of x .

[0111] На фиг. 7 изображен график 700, на котором показаны различные коэффициенты c усиления сжатия. На графике 700 ось x представляет собой входную мощность (входного сигнала x) в дБ, и ось y представляет собой коэффициент усиления сжатия c в дБ. Показаны различные кривые, при этом каждая кривая соответствует некоторому значению степени сжатия r. В частности, для r даны 9 значений в диапазоне от 0,5 до 1,0: 0,5, 0,6, 0,65, 0,7, 0,73, 0,77, 0,8, 0,9 и 1,0, причем каждое значение соответствует одной из кривых на графике 700 (например, значение r, равное 0,5, соответствует верхней кривой). Следует отметить, что указанные коэффициенты усиления по фиг. 7 не являются точными; они представляют собой лишь иллюстрацию общей концепции. Также для графика 700 можно отметить, что коэффициент усиления ограничен для низкой входной мощности и имеет вид отношения . Этим предотвращается избыточное применение усиления в таких обстоятельствах, как кратковременные атаки после тихих периодов сигнала. (Напротив, этот коэффициент усиления в комбинации с постоянной времени в уравнении (6) обеспечивает возможность пропускания через компрессор большей части энергии во время, например, ударных атак, вносящих вклад в восприятие «пробивной силы» в низкочастотном сигнале.) [0111] In FIG. 7 is a graph 700 showing various compression gain factors c . In plot 700, the x-axis represents the input power (input signal x ) in dB, and the y-axis represents the compression gain c in dB. Various curves are shown, with each curve corresponding to a certain compression ratio value r . In particular, 9 values are given for r in the range from 0.5 to 1.0: 0.5, 0.6, 0.65, 0.7, 0.73, 0.77, 0.8, 0.9 and 1.0, each value corresponding to one of the curves on the graph 700 (for example, an r value of 0.5 corresponds to the top curve). It should be noted that the specified gains in FIG. 7 are not accurate; they are merely an illustration of the general concept. Also for graph 700 it can be noted that the gain is limited for low input power and has the form of the ratio . This prevents excessive gain from being applied in circumstances such as transient attacks following quiet periods of the signal. (In contrast, this gain, in combination with the time constant in equation (6), allows most of the energy to pass through the compressor during, for example, shock attacks, which contribute to the perceived "punch" in the low-frequency signal.)

Коррекция громкостиVolume correction

[0112] Альтернативный подход для достижения расширения громкости заключается в применении нормализации к входному сигналу на первом этапе, перед генерированием гармоник, с последующим этапом регулировки коэффициента усиления. Это может быть названо коррекцией громкости.[0112] An alternative approach to achieve loudness expansion is to apply normalization to the input signal in a first step, before generating harmonics, followed by a gain adjustment step. This may be called volume correction.

[0113] На фиг. 8 изображена блок-схема генератора 800 гармоник. Генератор 800 гармоник в целом выполняет коррекцию громкости с использованием нормализации входных сигналов. Амплитудная нормализация теоретически позволяет предотвращать динамическое расширение гармоник (с коэффициентом n, когда n≥2) при генерировании согласно уравнению (1).[0113] In FIG. 8 is a block diagram of a harmonic generator 800. The harmonic generator 800 generally performs loudness correction using normalization of the input signals. Amplitude normalization theoretically allows to prevent dynamic expansion of harmonics (by a factor of n when n ≥2) when generated according to equation (1).

[0114] Генератор 800 гармоник содержит две или более ступеней 802 нормализации (показаны две: 802a и 802b), два или более множителей 804 (показаны два: 804a и 804b), две или более ступеней 806 коррекции громкости (показаны две: 806a и 806b), два или более сумматоров 808 (показаны два: 808a и 808b) и сумматор 810. В целом каждый ряд компонентов в генераторе 800 гармоник соответствует одной из генерируемых гармоник, поэтому количество рядов (и соответствующее количество компонентов) может регулироваться для реализации требуемого количества гармоник. Первый ряд обработки содержит ступень 802a нормализации, множитель 804a, ступень 806a коррекции громкости и сумматор 808а. Второй ряд обработки содержит ступень 802b нормализации, множитель 804b, ступень 806b коррекции громкости и сумматор 808b. Для генерирования дополнительных гармоник могут быть добавлены дополнительные ряды, причем каждый новый ряд соединен с предыдущим рядом способом, который подобен способу, показанному на фигуре.[0114] The harmonic generator 800 includes two or more normalization stages 802 (two shown: 802a and 802b), two or more multipliers 804 (two shown: 804a and 804b), two or more loudness correction stages 806 (two shown: 806a and 806b ), two or more adders 808 (two shown: 808a and 808b), and an adder 810. In general, each row of components in the harmonic generator 800 corresponds to one of the harmonics generated, so the number of rows (and the corresponding number of components) can be adjusted to realize the desired number of harmonics. . The first processing row includes a normalization stage 802a, a multiplier 804a, a loudness correction stage 806a, and an adder 808a. The second processing row includes a normalization stage 802b, a multiplier 804b, a loudness correction stage 806b, and an adder 808b. Additional rows may be added to generate additional harmonics, each new row being connected to the previous row in a manner similar to that shown in the figure.

[0115] Генератор 800 гармоник принимает входной сигнал 820. Входной сигнал 820 соответствует подвергаемому повышающей дискретизации сигналу 220 (см. фиг. 2), когда повышающий дискретизатор 202 присутствует, или преобразованному звуковому сигналу 112, когда повышающий дискретизатор 202 отсутствует. Входной сигнал 820 представляет собой комплексный сигнал в области преобразования. Например, входной сигнал 820 может соответствовать полосе HCQMF (например, гибридному поддиапазону 0, гибридному поддиапазону 2, гибридному поддиапазону 4, гибридному поддиапазону 6 и т.д.). Генератор 800 гармоник генерирует сигнал 222 (см. фиг. 2).[0115] The harmonic generator 800 receives an input signal 820. The input signal 820 corresponds to the upsampled signal 220 (see FIG. 2) when the upsampler 202 is present, or the converted audio signal 112 when the upsampler 202 is absent. Input signal 820 is a complex transform domain signal. For example, input signal 820 may correspond to an HCQMF band (eg, hybrid subband 0, hybrid subband 2, hybrid subband 4, hybrid subband 6, etc.). A harmonic generator 800 generates a signal 222 (see FIG. 2).

[0116] Начиная со ступеней 802 нормализации, ступень 802а нормализации принимает входной сигнал 820, выполняет нормализацию и генерирует сигнал 822а. Ступень 802b нормализации принимает входной сигнал 820, выполняет нормализацию и генерирует сигнал 822b. Подобно уравнению (5) каждая из ступеней 802 нормализации может выполнять нормализацию с использованием сглаживающего фильтра первого порядка во избежание искажения, вызванного нормализацией от одного дискретного значения к другому. Ступени 802 нормализации могут выполнять нормализацию способом, описанным при помощи уравнения (8):[0116] Starting with normalization stages 802, normalization stage 802a receives input signal 820, performs normalization, and generates signal 822a. Normalization stage 802b receives input signal 820, performs normalization, and generates signal 822b. Similar to equation (5), each of the normalization stages 802 may perform normalization using a first order smoothing filter to avoid distortion caused by normalization from one sample value to another. Normalization stages 802 may perform normalization in the manner described by equation (8):

[0117] В уравнении (8) текущее дискретное значение m нормализованной версии входного сигнала x, – предыдущее дискретное значение нормализованной версии входного сигнала, α – коэффициент сглаживания, и задано уравнением (9):[0117] In equation (8) the current sample value m of the normalized version of the input signal x , is the previous sampled value of the normalized version of the input signal, α is the smoothing coefficient, and given by equation (9):

[0118] В уравнении (9) соответствует соотношению между комплексным значением текущего дискретного значения входного сигнала и амплитудой (также называемой абсолютным значением) текущего дискретного значения входного сигнала. Коэффициент сглаживания, α, может регулироваться по необходимости для управления требуемым временем сглаживания, и он зависит от динамических характеристик входного сигнала. Во время событий атак (например, когда имеет место быстро возрастающая энергия сигнала) применяется меньший α, чем в условиях стационарной или уменьшающейся энергии, во избежание ограничения сигнала.[0118] In equation (9) corresponds to the relationship between the complex value of the current input signal sample and the amplitude (also called the absolute value) of the current input signal sample. The smoothing factor, α , can be adjusted as needed to control the required smoothing time, and is dependent on the dynamic characteristics of the input signal. During attack events (for example, when there is rapidly increasing signal energy), a smaller α is applied than under stationary or decreasing energy conditions to avoid signal clipping.

[0119] Альтернативно в генераторе гармоник может использоваться одна ступень нормализации (например, 802а), при этом выходной сигнал (например, 822а) предоставляется в качестве входного сигнала в каждый из множителей 804.[0119] Alternatively, a single normalization stage (e.g., 802a) may be used in the harmonic generator, with the output signal (e.g., 822a) provided as an input to each of the multipliers 804.

[0120] Обращаясь к множителям 804, множитель 804а принимает входной сигнал 820 и сигнал 822а, умножает эти сигналы друг на друга и генерирует сигнал 824а. Множитель 804b принимает сигнал 822b и сигнал 824а, умножает эти сигналы друг на друга и генерирует сигнал 824b. Сигнал 824а соответствует второй гармонике, сигнал 824b соответствует третьей гармонике, и т.д. Следует отметить, что выходной сигнал данного множителя доставляется в качестве входного сигнала в множитель в следующем ряду обработки: сигнал 824а доставляется в множитель 804b, сигнал 824b доставляется в множитель в следующем ряду (показан пунктирной линией), и т.д.[0120] Referring to multipliers 804, multiplier 804a receives input signal 820 and signal 822a, multiplies these signals by each other, and generates signal 824a. Multiplier 804b receives signal 822b and signal 824a, multiplies these signals by each other, and generates signal 824b. Signal 824a corresponds to the second harmonic, signal 824b corresponds to the third harmonic, etc. It should be noted that the output signal of a given multiplier is delivered as an input signal to the multiplier in the next row of processing: signal 824a is delivered to multiplier 804b, signal 824b is delivered to the multiplier in the next row (shown by the dotted line), etc.

[0121] Обращаясь к ступеням 806 коррекции громкости, ступень 806a коррекции громкости принимает сигнал 824а, выполняет коррекцию громкости и генерирует сигнал 826a. Ступень 806b коррекции громкости принимает сигнал 824b, выполняет коррекцию громкости и генерирует сигнал 826b. В целом ступени 806 коррекции громкости применяют динамическое расширение и ослабление нормализованной энергии сгенерированных гармоник в соответствии с кривыми равной громкости, изображенными на фиг. 6, с целью сохранения громкости по сравнению с основной гармоникой. Для регулировки громкости задан коэффициент коррекции k, при этом k зависит от порядка гармоники n, сглаженной амплитуды основной гармоники (см. уравнение (8)) и индекса гибридной полосы b. Этот коэффициент коррекции k применяется согласно уравнению (10):[0121] Referring to the loudness correction stages 806, the loudness correction stage 806a receives signal 824a, performs loudness correction, and generates signal 826a. Volume correction stage 806b receives signal 824b, performs volume correction, and generates signal 826b. In general, the loudness correction stages 806 apply dynamic expansion and attenuation of the normalized energy of the generated harmonics according to the equal loudness curves depicted in FIG. 6, in order to maintain loudness compared to the fundamental harmonic. To adjust the volume, a correction factor k is specified, and k depends on the order of the harmonic n , the smoothed amplitude of the fundamental harmonic (see equation (8)) and the hybrid band index b . This correction factor k is applied according to equation (10):

[0122] В уравнении (10) гармоника с коррекцией громкости, и нормализованная гармоника, соответственно, для каждой гармоники.[0122] In equation (10) harmonic with volume correction, and normalized harmonic, respectively, for each harmonic.

[0123] Как обсуждено выше, процессы усиления низких частот могут выполняться в отношении одной или более гибридных полос (например, одного или более поддиапазонов 0, 2, 4, 6, 7, 9 и т.д.). В каждой полосе генерируется несколько гармоник, например, 2-я, 3-я и 4-я. Если предположить, что центральная частота аппроксимирует основную частоту в каждой полосе, то соотношение SPL и фона можно вычислить с использованием одного параметра: порядка гармоник n. В качестве примера, первая гибридная полоса (например, поддиапазон 0) имеет центральную частоту 46,875 Гц (например, приблизительно 47 Гц), и соответствующие значения с кривых ELC на фиг. 6 перечислены в таблице 1.[0123] As discussed above, low frequency enhancement processes may be performed on one or more hybrid bands (eg, one or more subbands 0, 2, 4, 6, 7, 9, etc.). Each band generates several harmonics, such as the 2nd, 3rd and 4th. If we assume that the center frequency approximates the fundamental frequency in each band, then the SPL to background ratio can be calculated using a single parameter: harmonic order n . As an example, the first hybrid band (eg, sub-band 0) has a center frequency of 46.875 Hz (eg, approximately 47 Hz), and the corresponding values from the ELC curves in FIG. 6 are listed in Table 1.

[0124] В таблице 1 значение в скобках представляет собой разность SPL по сравнению с основной гармоникой. Функция, представляющая разность SPL гармоники и ее основной гармоники, может быть вычислена согласно уравнению (11):[0124] In Table 1, the value in parentheses represents the difference in SPL compared to the fundamental. A function representing the difference between the SPL of a harmonic and its fundamental can be calculated according to equation (11):

[0125] В уравнении (11) K _b,n – значение коэффициента усиления в дБ, минимальное значение ослабления, X – сглаженная входная энергия основной гармоники в логарифмической шкале, тогда как – зависящий от порядка гармоники n масштабный параметр входной энергии. может быть вычислен согласно уравнению (12):[0125] In equation (11), K _b,n is the gain value in dB, minimum attenuation value, X is the smoothed input fundamental energy on a logarithmic scale, while – scale parameter of the input energy depending on the harmonic order n . can be calculated according to equation (12):

[0126] Коэффициент коррекции в линейной шкале может быть вычислен согласно уравнению (13):[0126] The correction factor in the linear scale can be calculated according to equation (13):

[0127] В уравнениях (12) и (13) все – постоянные на основе гибридных полос, и они могут быть оценены для оптимальной подгонки к кривым ELC, изображенным на фиг. 6. Параметры, перечисленные в таблице 2, будут приводить к достаточной точности для первых шести гибридных полос, и результирующие коэффициенты коррекции громкости изображены на фиг. 9. Для полос 6, 7 и 9 сгенерированные гармоники находятся в диапазоне частот от 700 Гц до 2000 Гц, при этом предполагается, что кривые ELC являются плоскими. Ступени 806 коррекции громкости могут вычислять коэффициенты коррекции громкости с использованием сегментной линейной аппроксимации для уменьшения вычислительной сложности.[0127] In equations (12) and (13), everything are constants based on the hybrid stripes and can be estimated for optimal fit to the ELC curves depicted in FIG. 6. The parameters listed in Table 2 will result in sufficient accuracy for the first six hybrid bands, and the resulting loudness correction factors are depicted in FIG. 9. For bands 6, 7 and 9, the generated harmonics are in the frequency range from 700 Hz to 2000 Hz, assuming that the ELC curves are flat. Loudness correction stages 806 may calculate loudness correction coefficients using segment linear approximation to reduce computational complexity.

[0128] На фиг. 9A, 9B, 9C, 9D, 9E и 9F показан набор графиков 900a–900f. На каждом графике ось х представляет собой амплитуду сигнала нормализованной гармоники в ступени коррекции громкости (например, сигнала 824а, являющегося входным в ступень 806а коррекции громкости, и т.д.), и ось y представляет собой коэффициент коррекции k. График 900а соответствует гибридной полосе 0, график 900b соответствует гибридной полосе 2, график 900с соответствует гибридной полосе 4, график 900d соответствует гибридной полосе 6, график 900е соответствует гибридной полосе 7, и график 900f соответствует гибридной полосе 9. Линии для трех гармоник (2-й, 3-й и 4-й) показаны на каждом графике, однако на графиках 900d, 900e и 900f линии накладываются одна на другую, так как они сходятся с увеличением номера гибридной полосы. В целом линии показывают коэффициенты коррекции громкости k для первых 6 гибридных полос при использовании постоянных на основе гибридных полос, перечисленных в таблице 2.[0128] In FIG. 9A, 9B, 9C, 9D, 9E and 9F show a set of plots 900a-900f. In each plot, the x-axis represents the amplitude of the normalized harmonic signal in the loudness correction stage (eg, the signal 824a input to the loudness correction stage 806a, etc.), and the y-axis represents the correction factor k . Plot 900a corresponds to hybrid band 0, plot 900b corresponds to hybrid band 2, plot 900c corresponds to hybrid band 4, plot 900d corresponds to hybrid band 6, plot 900e corresponds to hybrid band 7, and plot 900f corresponds to hybrid band 9. Lines for three harmonics (2- 1st, 3rd and 4th) are shown in each graph, however in graphs 900d, 900e and 900f the lines overlap as they converge as the hybrid band number increases. Overall, the lines show the loudness correction factors k for the first 6 hybrid bands when using constants based on the hybrid bands listed in Table 2.

[0129] Возвращаясь к фиг. 8 и сумматорам 808, сумматор 808b принимает сигнал 826b (и любой сигнал, принятый из следующего ряда обработки, показанного пунктирной линией), выполняет сложение и генерирует сигнал 828b. Сумматор 808b принимает сигнал 826а и сигнал 828b, выполняет сложение и генерирует сигнал 828a. Следует отметить, что один из входных сигналов в данный сумматор предоставляется сумматором в следующем ряду обработки: сумматор 808b принимает выходной сигнал сумматора в следующем ряду обработки (показан пунктирной линией), сумматор 808а принимает выходной сигнал сумматора 808b, и т.д.[0129] Returning to FIG. 8 and adders 808, adder 808b receives signal 826b (and any signal received from the next row of processing shown in dashed line), adds and generates signal 828b. Adder 808b receives signal 826a and signal 828b, performs an addition, and generates signal 828a. It should be noted that one of the inputs to a given adder is provided by the adder in the next processing row: adder 808b receives the output of the adder in the next processing row (shown by the dotted line), adder 808a receives the output of adder 808b, etc.

[0130] Сумматор 810 принимает входной сигнал 820 и сигнал 828а, выполняет сложение и генерирует сигнал 222 (см. фиг. 2). [0130] Adder 810 receives input signal 820 and signal 828a, performs an addition, and generates signal 222 (see FIG. 2).

Обработка нескольких гибридных полосProcessing of multiple hybrid strips

[0131] Хотя описание системы 200 усиления низких частот (см. фиг. 2) было сосредоточено на обработке одной гибридной полосы, подобная обработка может выполняться в отношении нескольких гибридных полос. Например, система 120 усиления низких частот (см. фиг. 1) может действовать в отношении четырех гибридных полос (например, поддиапазонов 0, 2, 4 и 6), шести гибридных полос (например, поддиапазонов 0, 2, 4, 6, 7 и 9) и т.д. В каждой полосе генерируется несколько гармоник (например, 2-я, 3-я, 4-я и т.д.).[0131] Although the description of the low frequency enhancement system 200 (see FIG. 2) has focused on processing a single hybrid band, similar processing may be performed on multiple hybrid bands. For example, low frequency enhancement system 120 (see FIG. 1) may operate on four hybrid bands (e.g., sub-bands 0, 2, 4, and 6), six hybrid bands (e.g., sub-bands 0, 2, 4, 6, 7 and 9), etc. Each band generates several harmonics (for example, 2nd, 3rd, 4th, etc.).

[0132] На фиг. 10 изображена блок-схема системы 1000 усиления низких частот. Система 1000 усиления низких частот может быть использована в качестве системы 120 усиления низких частот (см. фиг. 1). Система 1000 усиления низких частот подобна системе 200 усиления низких частот (см. фиг. 2), причем подобные компоненты имеют подобные наименования и ссылочные позиции, с добавлением в явном виде нескольких путей обработки. Каждый путь обработки соответствует обработке сигнала гибридного поддиапазона. В качестве конкретного примера показаны 4 пути обработки (например, для обработки гибридных поддиапазонов 0, 2, 4 и 6). При необходимости количество путей обработки может быть увеличено или уменьшено. Например, для обработки гибридных поддиапазонов 0, 2, 4, 6, 7 и 9 может быть использовано шесть путей обработки.[0132] In FIG. 10 is a block diagram of a bass enhancement system 1000. The bass boost system 1000 may be used as the bass boost system 120 (see FIG. 1). Bass boost system 1000 is similar to bass boost system 200 (see FIG. 2), with similar components having similar names and reference numbers, with the addition of multiple processing paths explicitly. Each processing path corresponds to processing a hybrid subband signal. As a specific example, 4 processing paths are shown (eg to process hybrid subbands 0, 2, 4 and 6). If necessary, the number of processing paths can be increased or decreased. For example, six processing paths may be used to process hybrid subbands 0, 2, 4, 6, 7, and 9.

[0133] Система 1000 усиления низких частот принимает преобразованный звуковой сигнал 112 (см. фиг. 1). Как обсуждено выше, преобразованный звуковой сигнал 112 представляет собой гибридный комплексный сигнал в области преобразования с гибридными полосами. В качестве входных сигналов в систему 1000 усиления низких частот показаны четыре из гибридных полос преобразованного звукового сигнала 112: поддиапазон 0 (помеченный как 1002a), поддиапазон 2 (1002b), поддиапазон 4 (1002c) и поддиапазон 6 (1002d). Каждый поддиапазон соответствует одному из путей обработки. Система 1000 усиления низких частот содержит повышающие дискретизаторы 1010 (показаны четыре: 1010a, 1010b, 1010c и 1010d), генераторы 1012 гармоник (показаны четыре: 1012a, 1012b, 1012c и 1012d), сумматор 104, устройство 1016 обработки динамических характеристик (необязательно), преобразователь 1018 (необязательно), фильтр 1022, элемент 1024 задержки и микшер 1026.[0133] Bass enhancement system 1000 receives converted audio signal 112 (see FIG. 1). As discussed above, the converted audio signal 112 is a hybrid complex signal in the hybrid band conversion domain. Four of the hybrid bands of the converted audio signal 112 are shown as input signals to the bass enhancement system 1000: subband 0 (labeled 1002a), subband 2 (1002b), subband 4 (1002c), and subband 6 (1002d). Each subrange corresponds to one of the processing paths. Bass enhancement system 1000 includes upsamplers 1010 (four shown: 1010a, 1010b, 1010c and 1010d), harmonic generators 1012 (four shown: 1012a, 1012b, 1012c and 1012d), adder 104, dynamics processor 1016 (optional), a converter 1018 (optional), a filter 1022, a delay element 1024, and a mixer 1026.

[0134] Повышающий дискретизатор 1010а принимает сигнал 1002а, выполняет повышающую дискретизацию и генерирует подвергаемый повышающей дискретизации сигнал 1030а. Повышающий дискретизатор 1010b принимает сигнал 1002b, выполняет повышающую дискретизацию и генерирует подвергаемый повышающей дискретизации сигнал 1030b. Повышающий дискретизатор 1010c принимает сигнал 1002c, выполняет повышающую дискретизацию и генерирует подвергаемый повышающей дискретизации сигнал 1030c. Повышающий дискретизатор 1010d принимает сигнал 1002d, выполняет повышающую дискретизацию и генерирует подвергаемый повышающей дискретизации сигнал 1030d. Сигналы 1030a, 1030b, 1030c и 1030d представляют собой комплексные сигналы в области преобразования. В остальном повышающие дискретизаторы 1010 подобны тому, что описано выше в отношении повышающего дискретизатора 202 (см. фиг. 2).[0134] Upsampler 1010a receives signal 1002a, performs upsampling, and generates upsampled signal 1030a. Upsampler 1010b receives signal 1002b, performs upsampling, and generates upsampled signal 1030b. Upsampler 1010c receives signal 1002c, performs upsampling, and generates upsampled signal 1030c. Upsampler 1010d receives signal 1002d, performs upsampling, and generates upsampled signal 1030d. Signals 1030a, 1030b, 1030c and 1030d are complex transform domain signals. In other respects, the upsamplers 1010 are similar to those described above with respect to the upsampler 202 (see FIG. 2).

[0135] Генератор 1012а гармоник принимает подвергаемый повышающей дискретизации сигнал 1030а и генерирует его гармоники с образованием сигнала 1032а. Генератор 1012b гармоник принимает подвергаемый повышающей дискретизации сигнал 1030b и генерирует его гармоники с образованием сигнала 1032b. Генератор 1012c гармоник принимает подвергаемый повышающей дискретизации сигнал 1030c и генерирует его гармоники с образованием сигнала 1032c. Генератор 1012d гармоник принимает подвергаемый повышающей дискретизации сигнал 1030d и генерирует его гармоники с образованием сигнала 1032d. Сигналы 1032a, 1032b, 1032c и 1032d представляют собой комплексные сигналы в области преобразования. В остальном генераторы 1012 гармоник подобны генератору 204 гармоник (см. фиг. 2). Например, один или более генераторов 1012 гармоник могут быть реализованы с использованием генератора 300 гармоник (см. фиг. 3), генератора 400 гармоник (см. фиг. 4), генератора 500 гармоник (см. фиг. 5), генератора 800 гармоник (см. фиг. 8) и т.д.[0135] A harmonic generator 1012a receives the upsampled signal 1030a and generates its harmonics to produce a signal 1032a. A harmonic generator 1012b receives the upsampled signal 1030b and generates its harmonics to produce a signal 1032b. A harmonic generator 1012c receives the upsampled signal 1030c and generates its harmonics to produce a signal 1032c. A harmonic generator 1012d receives the upsampled signal 1030d and generates its harmonics to produce a signal 1032d. Signals 1032a, 1032b, 1032c, and 1032d are complex transform domain signals. Otherwise, the harmonic generators 1012 are similar to the harmonic generator 204 (see FIG. 2). For example, one or more harmonic generators 1012 may be implemented using a harmonic generator 300 (see FIG. 3), a harmonic generator 400 (see FIG. 4), a harmonic generator 500 (see FIG. 5), a harmonic generator 800 (see FIG. see Fig. 8), etc.

[0136] Сумматор 1014 принимает сигналы 1032a, 1032b, 1032c и 1032d, выполняет сложение и генерирует сигнал 1034. Сигнал 1034 представляет собой комплексный сигнал в области преобразования.[0136] Adder 1014 receives signals 1032a, 1032b, 1032c, and 1032d, performs addition, and generates signal 1034. Signal 1034 is a complex transform domain signal.

[0137] Устройство 1016 обработки динамических характеристик принимает сигнал 1034, выполняет обработку динамических характеристик и генерирует сигнал 1036. Сигнал 1036 представляет собой комплексный сигнал в области преобразования. В остальном устройство 1016 обработки динамических характеристик подобно устройству 206 обработки динамических характеристик (см. фиг. 2). Устройство 1016 обработки динамических характеристик является необязательным. Когда устройство 1016 обработки динамических характеристик опущено, преобразователь 1018 принимает сигнал 1034 вместо сигнала 1036.[0137] The dynamics processing device 1016 receives the signal 1034, performs the dynamics processing, and generates a signal 1036. The signal 1036 is a complex transform domain signal. Otherwise, the dynamic characteristics processing device 1016 is similar to the dynamic characteristics processing device 206 (see FIG. 2). The dynamic characteristics processing device 1016 is optional. When dynamics processing device 1016 is omitted, transducer 1018 receives signal 1034 instead of signal 1036.

[0138] Преобразователь 1018 принимает сигнал 1036 (или сигнал 1034, когда устройство 1016 обработки динамических характеристик опущено), отбрасывает мнимую часть из сигнала 1036 и генерирует сигнал 1040. Сигнал 1040 представляет собой сигнал в области преобразования. В остальном преобразователь 1018 подобен преобразователю 208 (см. фиг. 2), и его включение является необязательным.[0138] Converter 1018 receives signal 1036 (or signal 1034 when dynamics processor 1016 is omitted), discards the imaginary part from signal 1036, and generates signal 1040. Signal 1040 is a transform domain signal. In other respects, converter 1018 is similar to converter 208 (see FIG. 2), and its inclusion is optional.

[0139] Фильтр 1022 принимает сигнал 1040 (или сигнал 1036, когда преобразователь 1018 опущен, или сигнал 1034, когда опущены устройство 1016 обработки динамических характеристик и преобразователь 1018), выполняет фильтрацию и генерирует сигнал 1042. Сигнал 1042 представляет собой сигнал в области преобразования. В остальном фильтр 1022 подобен фильтру 212 (см. фиг. 2).[0139] Filter 1022 receives signal 1040 (or signal 1036 when transducer 1018 is omitted, or signal 1034 when dynamics processor 1016 and transducer 1018 are omitted), performs filtering, and generates signal 1042. Signal 1042 is a transform domain signal. In other respects, filter 1022 is similar to filter 212 (see FIG. 2).

[0140] Элемент 1024 задержки принимает сигнал 1042, реализует период задержки и генерирует сигнал 1044. Сигнал 1044 соответствует подвергнутой задержке версии преобразованного звукового сигнала 112 согласно периоду задержки. Элемент 1024 задержки может быть реализован с использованием запоминающего устройства, сдвигового регистра и т.д. Период задержки соответствует времени обработки других компонентов в цепочке обработки сигнала; так как некоторые из этих других компонентов являются необязательными, период задержки уменьшается по мере того, как опускаются необязательные компоненты. В остальном элемент 1024 задержки подобен элементу 214 задержки (см. фиг. 2).[0140] Delay element 1024 receives signal 1042, implements a delay period, and generates signal 1044. Signal 1044 corresponds to a delayed version of converted audio signal 112 according to the delay period. The delay element 1024 may be implemented using a memory device, a shift register, etc. The delay period corresponds to the processing time of other components in the signal processing chain; since some of these other components are optional, the delay period decreases as optional components are omitted. Otherwise, delay element 1024 is similar to delay element 214 (see FIG. 2).

[0141] Микшер 1026 принимает сигнал 1042 и сигнал 1044, выполняет микширование и генерирует усиленный звуковой сигнал 122 (см. фиг. 1). В остальном микшер 1026 подобен микшеру 216 (см. фиг. 2).[0141] Mixer 1026 receives signal 1042 and signal 1044, performs mixing, and generates an amplified audio signal 122 (see FIG. 1). In other respects, mixer 1026 is similar to mixer 216 (see FIG. 2).

[0142] На фиг. 11 изображена архитектура 1100 мобильного устройства для реализации признаков и процессов, описанных в данном документе, согласно варианту осуществления. Архитектура 1100 может быть реализована в любом электронном устройстве, включая, но без ограничения: настольный компьютер, потребительское аудиовизуальное (AV) оборудование, радиовещательное оборудование, мобильные устройства (например, смартфон, планшетный компьютер, ноутбук, носимое устройство) и т.д. В показанном примерном варианте осуществления архитектура 1100 предназначена для ноутбука и содержит процессор (процессоры) 1101, интерфейс 1102 периферийных устройств, звуковую подсистему 1103, громкоговорители 1104, микрофон 1105, датчики 1106 (например, акселерометры, гироскопы, барометр, магнитометр, фотокамеру), устройство 1107 обработки данных местоположения (например, приемник GNSS), подсистемы 1108 беспроводной связи (например, Wi-Fi, Bluetooth, сотовой связи) и подсистему (подсистемы) 1109 ввода-вывода (I/O), которая содержит сенсорный контроллер 1110 и другие контроллеры 1111 ввода, сенсорную поверхность 1112 и другие устройства 1113 ввода/управления. Для реализации раскрытых вариантов осуществления также могут быть использованы другие архитектуры с большим или меньшим количеством компонентов.[0142] In FIG. 11 depicts a mobile device architecture 1100 for implementing the features and processes described herein, according to an embodiment. The architecture 1100 may be implemented in any electronic device, including, but not limited to: a desktop computer, consumer audiovisual (AV) equipment, broadcast equipment, mobile devices (e.g., smartphone, tablet computer, laptop, wearable device), etc. In the exemplary embodiment shown, architecture 1100 is for a laptop and includes processor(s) 1101, peripheral interface 1102, audio subsystem 1103, speakers 1104, microphone 1105, sensors 1106 (e.g., accelerometers, gyroscopes, barometer, magnetometer, camera), device 1107 location data processing (e.g., GNSS receiver), wireless communications subsystem 1108 (e.g., Wi-Fi, Bluetooth, cellular), and input/output (I/O) subsystem(s) 1109, which contains touch controller 1110 and other controllers input 1111, touch surface 1112, and other input/control devices 1113. Other architectures with more or fewer components may also be used to implement the disclosed embodiments.

[0143] Интерфейс 114 запоминающего устройства соединен с процессорами 1101, интерфейсом 1102 периферийных устройств и запоминающим устройством 115 (например, флеш-памятью, RAM, ROM). В запоминающем устройстве 1115 хранятся программные команды и данные, включающие, но без ограничения: команды 1116 операционной системы, команды 1117 связи, команды 1118 GUI, команды 1119 обработки данных датчиков, команды 1120 телефона, команды 1121 электронного обмена сообщениями, команды 1122 просмотра веб-страниц, команды 1123 обработки звука, команды 1124 навигации/GNSS и приложения/данные 1125. Команды 1123 обработки звука содержат команды для выполнения обработки звука, описанной в данном документе.[0143] Memory interface 114 is coupled to processors 1101, peripheral interface 1102, and storage device 115 (eg, flash memory, RAM, ROM). Memory 1115 stores software commands and data, including, but not limited to: operating system commands 1116, communication commands 1117, GUI commands 1118, sensor processing commands 1119, telephone commands 1120, electronic messaging commands 1121, web browsing commands 1122. pages, audio processing commands 1123, navigation/GNSS commands 1124, and applications/data 1125. Audio processing commands 1123 contain commands for performing the audio processing described herein.

[0144] На фиг. 12 изображена схема последовательности операций способа 1200 обработки звука. Способ 1200 может выполняться устройством (например, ноутбуком, мобильным телефоном и т.д.), содержащим компоненты архитектуры 1100, изображенной на фиг. 11, для реализации функциональных возможностей системы 100 обработки звука (см. фиг. 1), системы 200 усиления низких частот (см. фиг. 2), системы 1000 усиления низких частот (см. фиг. 10) и т.д., например, путем исполнения одной или более компьютерных программ. В целом способ 1200 выполняет обработку звукового сигнала в области комплекснозначных поддиапазонов (например, в области HCQMF).[0144] In FIG. 12 is a flowchart of an audio processing method 1200. The method 1200 may be performed by a device (eg, laptop, mobile phone, etc.) comprising components of the architecture 1100 depicted in FIG. 11, to implement the functionality of the audio processing system 100 (see FIG. 1), bass enhancement system 200 (see FIG. 2), bass enhancement system 1000 (see FIG. 10), etc., for example , by executing one or more computer programs. In general, method 1200 performs audio signal processing in the complex-valued subband domain (eg, in the HCQMF domain).

[0145] На этапе 1202 принимается первый сигнал в области преобразования. Первый сигнал в области преобразования представляет собой гибридный комплексный сигнал в области преобразования, имеющий ряд полос. По меньшей мере одна из полос имеет ряд поддиапазонов. Первый сигнал в области преобразования имеет первое множество гармоник. Например, система 200 усиления низких частот (см. фиг. 2) может принимать преобразованный звуковой сигнал 112. Первый сигнал в области преобразования может иметь 77 гибридных полос, пронумерованных как 0–76, при этом полосы 0–15 представляют собой поддиапазоны, являющиеся результатом разделения одной или нескольких полос большего размера. Первый сигнал в области преобразования может представлять собой сигнал в области CQMF. Первый сигнал в области преобразования может представлять собой сигнал в области HCQMF, сгенерированный путем разделения (например, с использованием блоков фильтров Найквиста) подмножества каналов сигнала в области CQMF на поддиапазоны для повышения разрешающей способности по частоте для диапазона самых низких частот.[0145] At step 1202, a first signal in the transform domain is received. The first transform domain signal is a hybrid complex transform domain signal having a number of bands. At least one of the bands has a number of subbands. The first signal in the conversion domain has a first set of harmonics. For example, bass enhancement system 200 (see FIG. 2) may receive converted audio signal 112. The first signal in the conversion domain may have 77 hybrid bands numbered 0-76, with bands 0-15 being subbands resulting from separating one or more larger strips. The first signal in the transform domain may be a signal in the CQMF domain. The first transform domain signal may be an HCQMF domain signal generated by dividing (eg, using Nyquist filter banks) a subset of the channels of the CQMF domain signal into subbands to increase frequency resolution for the lowest frequency range.

[0146] На этапе 1204 генерируется второй сигнал в области преобразования на основе первого сигнала в области преобразования. Второй сигнал в области преобразования генерируется путем генерирования гармоник первого сигнала в области преобразования согласно нелинейному процессу. Второй сигнал в области преобразования имеет второе множество гармоник, которые отличаются от первого множества гармоник, и второй сигнал в области преобразования представляет собой комплекснозначный сигнал, имеющий мнимую часть. Второй сигнал в области преобразования дополнительно генерируют путем выполнения расширения громкости в отношении второго множества гармоник. Например, генератор 204 гармоник (см фиг. 2), генератор 300 гармоник (см. фиг. 3), генератор 400 гармоник (см. фиг. 4), генератор 500 гармоник (см. фиг. 5), генератор 800 гармоник (см. фиг. 8) и т.д. может генерировать второй сигнал в области преобразования (например, сигнал 222) на основе первого сигнала в области преобразования (например, сигнала 220 и т.д.)[0146] At step 1204, a second transform domain signal is generated based on the first transform domain signal. The second transform domain signal is generated by generating harmonics of the first transform domain signal according to a nonlinear process. The second signal in the transform domain has a second set of harmonics that are different from the first set of harmonics, and the second signal in the transform domain is a complex-valued signal having an imaginary part. The second transform domain signal is further generated by performing volume expansion with respect to the second set of harmonics. For example, harmonic generator 204 (see FIG. 2), harmonic generator 300 (see FIG. 3), harmonic generator 400 (see FIG. 4), harmonic generator 500 (see FIG. 5), harmonic generator 800 (see . fig. 8), etc. may generate a second transform domain signal (e.g., signal 222) based on a first transform domain signal (e.g., signal 220, etc.)

[0147] На этапе 1206 путем фильтрации второго сигнала в области преобразования генерируется третий сигнал в области преобразования. Третий сигнал в области преобразования имеет несколько ряд полос, и по меньшей мере одна из полос имеет ряд поддиапазонов. Например, фильтр 212 (см. фиг. 2) может фильтровать сигнал 228 (или сигнал 226) для генерирования сигнала 230. В качестве другого примера фильтр 1022 (см. фиг. 10) может фильтровать сигнал 1040 для генерирования сигнала 1042. Третий сигнал в области преобразования может иметь 77 гибридных полос, пронумерованных как 0–76, при этом полосы 0–15 представляют собой поддиапазоны, являющиеся результатом разделения одной или нескольких полос большего размера. Третий сигнал в области преобразования может представлять собой сигнал в области HCQMF.[0147] At step 1206, by filtering the second signal in the transform domain, a third signal in the transform domain is generated. The third signal in the conversion domain has a number of bands, and at least one of the bands has a number of subbands. For example, filter 212 (see FIG. 2) may filter signal 228 (or signal 226) to generate signal 230. As another example, filter 1022 (see FIG. 10) may filter signal 1040 to generate signal 1042. The third signal in The conversion region can have 77 hybrid bands, numbered 0–76, with bands 0–15 being subbands resulting from the division of one or more larger bands. The third signal in the transform domain may be a signal in the HCQMF domain.

[0148] На этапе 1208 генерируется четвертый сигнал в области преобразования путем микширования третьего сигнала в области преобразования с подвергнутой задержке версией первого сигнала в области преобразования. Данный поддиапазон третьего сигнала в области преобразования микшируется с соответствующим поддиапазоном подвергнутой задержке версии первого сигнала в области преобразования. Например, микшер 216 (см. фиг. 2) может микшировать сигнал 230 с подвергнутым задержке сигналом 232. В качестве другого примера микшер 1026 (см. фиг. 10) может микшировать сигнал 1042 с подвергнутым задержке сигналом 1044. Входные сигналы могут иметь 77 гибридных полос, пронумерованных как 0–76, при этом данная полоса входного сигнала (например, полоса 0) микшируется с соответствующей полосой (например, полосой 0) другого входного сигнала.[0148] At step 1208, a fourth transform domain signal is generated by mixing the third transform domain signal with a delayed version of the first transform domain signal. This subband of the third transform domain signal is mixed with a corresponding subband of a delayed version of the first transform domain signal. For example, mixer 216 (see FIG. 2) may mix signal 230 with delayed signal 232. As another example, mixer 1026 (see FIG. 10) may mix signal 1042 with delayed signal 1044. Input signals may have 77 hybrid bands numbered 0–76, where a given band of an input signal (eg, band 0) is mixed with a corresponding band (eg, band 0) of another input signal.

[0149] Способ 1200 может включать дополнительные этапы, соответствующие другим функциональным возможностям системы 200 усиления низких частот, системы 1000 усиления низких частот и т.д., как описано в данном документе. Например, четвертый сигнал в области преобразования может выводиться громкоговорителем, таким как громкоговорители 1104 (см. фиг. 11). В качестве другого примера сигналы в области преобразования могут подвергаться повышающей дискретизации (например, с использованием повышающего дискретизатора 202, повышающих дискретизаторов 1010) перед генерированием гармоник на этапе 1204. В качестве другого примера к сигналам в области преобразования может применяться обработка динамических характеристик, например, с использованием устройства 206 обработки динамических характеристик или устройства 1016 обработки динамических характеристик. В качестве другого примера генерирование гармоник может включать выполнение умножения, использование цикла задержки с обратной связью и т.д. В качестве другого примера второй сигнал в области преобразования может представлять собой ряд вторых сигналов в области преобразования, каждый из которых соответствует гибридной полосе первого сигнала в области преобразования. В качестве другого примера мнимая часть второго сигнала в области преобразования может быть отброшена перед генерированием третьего сигнала в области преобразования.[0149] Method 1200 may include additional steps corresponding to other functionality of bass enhancement system 200, bass enhancement system 1000, etc., as described herein. For example, the fourth signal in the conversion region may be output by a speaker, such as speakers 1104 (see FIG. 11). As another example, the signals in the transform domain may be upsampled (e.g., using upsampler 202, upsamplers 1010) before generating harmonics at step 1204. As another example, dynamics processing may be applied to the signals in the transform domain, e.g. using the dynamic characteristics processing device 206 or the dynamic characteristics processing device 1016. As another example, generating harmonics may involve performing a multiplication, using a feedback delay loop, etc. As another example, the second transform domain signal may be a plurality of second transform domain signals, each of which corresponds to a hybrid band of the first transform domain signal. As another example, the imaginary portion of the second signal in the transform region may be discarded before generating the third signal in the transform region.

Подробности реализацииImplementation details

[0150] Вариант осуществления изобретения может быть реализован в аппаратном обеспечении, исполняемых модулях, которые хранятся на машиночитаемом носителе, или их комбинации (например, в программируемых логических матрицах). Если иное не указано, этапы, исполняемые вариантами осуществления, необязательно должны в своей основе относиться к какому-либо конкретному компьютеру или другому устройству, хотя это может иметь место в некоторых вариантах осуществления. В частности, различные машины общего назначения могут быть использованы вместе с программами, написанными в соответствии с идеями в данном документе, или может быть удобнее сконструировать более специализированное устройство (например, интегральные микросхемы) для выполнения необходимых этапов способа. Таким образом, варианты осуществления могут быть реализованы в одной или более компьютерных программах, исполняющихся на одной или более программируемых компьютерных системах, каждая из которых содержит по меньшей мере один процессор, по меньшей мере одну систему хранения данных (включая энергозависимое и энергонезависимое запоминающие устройства и/или элементы хранения), по меньшей мере одно устройство или порт ввода и по меньшей мере одно устройство или порт вывода. Программный код применяется к входным данным для выполнения функций, описанных в данном документе, и генерирования выходной информации. Выходная информация известным способом применяется к одному или более устройствам вывода.[0150] An embodiment of the invention may be implemented in hardware, executable modules that are stored on a computer-readable medium, or a combination thereof (eg, programmable gate arrays). Unless otherwise indicated, the steps performed by the embodiments need not be inherently related to any particular computer or other device, although this may be the case in some embodiments. In particular, various general purpose machines may be used in conjunction with programs written in accordance with the teachings herein, or it may be more convenient to construct a more specialized device (eg, integrated circuits) to perform the necessary method steps. Thus, embodiments may be implemented in one or more computer programs executing on one or more programmable computer systems, each of which includes at least one processor, at least one storage system (including volatile and nonvolatile storage devices, and/ or storage elements), at least one input device or port, and at least one output device or port. Program code is applied to input data to perform the functions described in this document and generate output information. The output information is applied to one or more output devices in a known manner.

[0151] Каждую такую компьютерную программу предпочтительно сохраняют или загружают на запоминающие носители или устройство (например, твердотельное запоминающее устройство или носители, или магнитные или оптические носители), считываемые программируемым компьютером общего или специального назначения, для конфигурирования и работы компьютера, когда запоминающие носители или устройство считываются компьютерной системой для выполнения процедур, описанных в данном документе. Систему согласно изобретению также можно считать реализованной в виде машиночитаемого запоминающего носителя, оснащенного компьютерной программой, где оснащенный таким образом запоминающий носитель вызывает работу компьютерной системы особым и предопределенным образом для выполнения функций, описанных в данном документе. (Программное обеспечение само по себе, а также нематериальные или энергозависимые сигналы исключены в той степени, в которой они представляют собой непатентоспособный объект).[0151] Each such computer program is preferably stored or loaded onto a storage media or device (e.g., solid-state storage device or media, or magnetic or optical media) readable by a general purpose or special purpose programmable computer for configuring and operating the computer when the storage media or device are read by a computer system to perform the procedures described in this document. The system of the invention can also be considered to be implemented as a computer readable storage medium equipped with a computer program, wherein the storage medium so equipped causes the computer system to operate in a specific and predetermined manner to perform the functions described herein. (Software itself and intangible or volatile signals are excluded to the extent that they constitute non-patentable subject matter.)

[0152] Аспекты систем, описанные в данном документе, могут быть реализованы в соответствующей сетевой среде обработки звука с использованием компьютеров для обработки файлов цифровых или оцифрованных звукозаписей. Части системы адаптивного звука могут включать одну или более сетей, которые содержат любое необходимое количество отдельных машин, в том числе один или более маршрутизаторов (не показаны), которые служат для буферизации и маршрутизации данных, передаваемых между компьютерами. Такая сеть может строиться на разнообразных сетевых протоколах и может представлять собой сеть Интернет, глобальную вычислительную сеть (WAN), локальную вычислительную сеть (LAN) и любую их комбинацию. [0152] Aspects of the systems described herein may be implemented in a suitable networked audio processing environment using computers to process digital or digitized audio recording files. Portions of an adaptive audio system may include one or more networks that contain any desired number of individual machines, including one or more routers (not shown) that serve to buffer and route data transmitted between computers. Such a network can be built on a variety of network protocols and can be the Internet, a wide area network (WAN), a local area network (LAN), and any combination thereof.

[0153] Один или более компонентов, блоков, процессов или других функциональных компонентов могут реализовываться с помощью компьютерной программы, которая управляет действием вычислительного устройства на основе процессора системы. Следует также отметить, что различные функции, раскрытые в данном документе, могут описываться с использованием любого количества комбинаций аппаратного обеспечения, программно-аппаратного обеспечения и/или данных, и/или команд, воплощенных в различных машиночитаемых или читаемых с помощью компьютера носителях, исходя из характеристик их поведения, межрегистровой пересылки, логических компонентов и/или других характеристик. Читаемые с помощью компьютера носители, в которых могут быть воплощены такие форматированные данные и/или команды, включают физические (постоянные), энергонезависимые запоминающие носители в различных формах, таких как оптические, магнитные или полупроводниковые запоминающие носители, но не ограничиваются ими.[0153] One or more components, blocks, processes, or other functional components may be implemented by a computer program that controls the operation of a system processor-based computing device. It should also be noted that the various functions disclosed herein may be described using any number of combinations of hardware, firmware and/or data and/or instructions embodied in various machine-readable or computer-readable media, based on characteristics of their behavior, inter-register transfer, logical components and/or other characteristics. Computer-readable media on which such formatted data and/or instructions may be embodied include, but are not limited to, physical (read-only), nonvolatile storage media in various forms, such as optical, magnetic, or semiconductor storage media.

[0154] В приведенном выше описании различные варианты осуществления настоящего изобретения проиллюстрированы наряду с примерами того, как могут быть реализованы аспекты настоящего описания. Приведенные выше примеры и варианты осуществления не следует считать только вариантами осуществления, и они представлены для иллюстрации гибкости и преимуществ настоящего изобретения, определенных в следующей формуле изобретения. На основе приведенного выше описания и следующей формулы изобретения специалистам в данной области техники будут очевидны другие компоновки, варианты осуществления, реализации и эквиваленты, и они могут быть воплощены без выхода за пределы сущности и объема настоящего описания, которые определены формулой изобретения.[0154] In the above description, various embodiments of the present invention are illustrated along with examples of how aspects of the present description may be implemented. The above examples and embodiments are not to be considered as mere embodiments, but are presented to illustrate the flexibility and advantages of the present invention as defined in the following claims. Based on the above description and the following claims, other arrangements, embodiments, implementations and equivalents will be apparent to those skilled in the art, and may be embodied without departing from the spirit and scope of the present specification as defined by the claims.

Claims

1. A computer-implemented sound processing method, the method including:

receiving a first transform domain signal, wherein the first transform domain signal is a hybrid complex transform domain signal having a plurality of bands, wherein at least one of the plurality of bands has a plurality of subbands, wherein the first transform domain signal has a first plurality of harmonics;

generating an upsampled signal in a transform domain by upsampling a first signal in the transform domain, wherein the upsampled signal is a complex valued time domain signal;

generating a second transform domain signal based on the upsampled first transform domain signal by:

generating a second harmonic set for the upsampled first signal in the transform domain according to a non-linear process, wherein the second signal in the transform domain has a second harmonic set that is different from the first harmonic set; And

performing volume expansion with respect to the second plurality of harmonics, wherein the second signal in the transform domain is a complex-valued signal having an imaginary part;

filtering the second transform domain signal to divide the second transform domain signal into a plurality of subbands and generate a third transform domain signal, wherein the third transform domain signal has a plurality of bands, wherein at least one of the plurality of bands has a plurality of subbands; And

generating a fourth transform domain signal by mixing the third transform domain signal with a delayed version of the first transform domain signal, wherein a given subband of the third transform domain signal is mixed with a corresponding subband of the delayed version of the first transform domain signal.

2. The method of claim 1, wherein the second set of harmonics results in a fourth transform domain signal having perceptually enhanced low frequencies compared to the first transform domain signal.

3. The method according to any of the previous claims, characterized in that the generation of the upsampled signal in the conversion domain is performed according to the synthesis of complex quadrature mirror filtering.

4. Method according to any one of paragraphs. 1–3, characterized in that it additionally includes:

performing dynamic processing on the second transform domain signal before generating a third transform domain signal based on the second transform domain signal.

5. Method according to any one of paragraphs. 1–4, characterized in that the plurality of bands of the first signal in the conversion region has a first band, a second band and a third band, wherein the first band is divided into 8 subbands, and the second band is divided into 4 subbands, and the third band is divided into 4 subbands.

6. Method according to any one of paragraphs. 1–5, characterized in that the first signal in the conversion region has 64 bands, the first band being divided into 8 subbands, the second band being divided into 4 subbands, and the third band being divided into 4 subbands.

7. Method according to any one of paragraphs. 1-6, characterized in that the first signal in the conversion domain has a bandwidth of 24 kHz, wherein the first signal in the conversion domain has 64 bands, and the bandwidth in the form of a bandwidth of each band is 375 Hz.

8. Method according to any one of paragraphs. 1–7, characterized in that the nonlinear process includes multiplication of the first signal in the conversion region.

9. Method according to any one of paragraphs. 1-8, characterized in that the nonlinear process involves a feedback delay loop applied to the first signal in the conversion region.

10. Method according to any one of paragraphs. 1–9, characterized in that the generation of the second signal in the conversion region includes:

generating a second transform domain signal based on one of a plurality of subbands of the first transform domain signal, wherein one of the plurality of subbands is smaller than all of the plurality of subbands of the first transform domain signal.

11. Method according to any one of paragraphs. 1–9, characterized in that the generation of the second signal in the conversion region includes:

generating a plurality of second signals in the transform domain based on two or more of the plurality of subbands of the first signal in the transform domain, wherein two or more of the plurality of subbands are less than all of the plurality of subbands of the first signal in the transform domain, and wherein each of the plurality of second signals in the transform domain transformation corresponds to one of two or more of a plurality of subranges; And

generating a second signal in the transform region by summing the plurality of second signals in the transform region.

12. Method according to any one of paragraphs. 1–11, characterized in that it additionally includes:

output by the loudspeaker the sound corresponding to the fourth signal in the conversion region.

13. Method according to any one of paragraphs. 1–12, characterized in that the first signal in the conversion region is in the first signal region, wherein the method further includes:

receiving an input signal in a second signal region;

generating a first signal in the conversion domain by converting an input signal from the second signal domain to the first signal domain; And

generating an output signal by converting the fourth signal in a transform region from the first signal region to the second signal region.

14. The method according to claim 13, characterized in that the second transform domain is a time domain, the first signal domain is a hybrid complex quadrature mirror filter (HCQMF) signal domain;

wherein generating the first signal in the transform domain includes generating the first signal in the transform domain by performing HCQMF analysis on the input signal; And

wherein generating an output signal includes generating an output signal by performing HCQMF synthesis on the fourth signal in the transform domain.

15. Method according to any one of paragraphs. 1–14, characterized in that it additionally includes:

discarding the imaginary part from the second signal in the transform region before generating a third signal in the transform region.

16. A non-transitory computer-readable medium storing a computer program that, when executed by a processor, controls a device for executing processing, including the method according to any one of claims. 1–15.

17. A device for processing sound, wherein the device contains:

CPU,

wherein the processor is configured to control the device to receive the first signal in the transform domain, wherein the first signal in the transform domain is a hybrid complex transform domain signal having a plurality of complex values and a plurality of bands, wherein at least one of the plurality of bands has a plurality of subbands, wherein the first signal in the conversion region has a first plurality of harmonics;

wherein the processor is configured to control the device for:

generating an upsampled signal in a transform domain by upsampling a first signal in the transform domain, wherein the upsampled signal is a complex valued time domain signal; And

wherein the processor is configured to control the apparatus for filtering the second signal in the transform domain to divide the second signal in the transform domain into a plurality of subbands and generate a third signal in the transform domain, wherein the third signal in the transform domain has a plurality of bands, wherein at least one from a plurality of bands has a plurality of subbands;

wherein the processor is configured to control the apparatus to generate a fourth transform domain signal by mixing the third transform domain signal with a delayed version of the first transform domain signal, wherein a given subband of the third transform domain signal is mixed with a corresponding subband of the delayed version of the first signal in the field of transformation.

18. The device according to claim 17, characterized in that it additionally contains:

a loudspeaker configured to output the fourth signal in the conversion region in the form of sound.