RU2256293C2 - Improving initial coding using duplicating band - Google Patents

Improving initial coding using duplicating band Download PDF

Info

Publication number
RU2256293C2
RU2256293C2 RU99104814/09A RU99104814A RU2256293C2 RU 2256293 C2 RU2256293 C2 RU 2256293C2 RU 99104814/09 A RU99104814/09 A RU 99104814/09A RU 99104814 A RU99104814 A RU 99104814A RU 2256293 C2 RU2256293 C2 RU 2256293C2
Authority
RU
Russia
Prior art keywords
signal
subbands
signals
transposition
frequency
Prior art date
Application number
RU99104814/09A
Other languages
Russian (ru)
Other versions
RU99104814A (en
Inventor
Ларс Густаф ЛИЛЬЕРЮД (SE)
Ларс Густаф ЛИЛЬЕРЮД
Пер Руне Альбин ЭКСТРАНД (SE)
Пер Руне Альбин ЭКСТРАНД
Ларс Фредрик ХЕНН (SE)
Ларс Фредрик ХЕНН
Ханс Магнус Кристофер ЧЕРЛИНГ (SE)
Ханс Магнус Кристофер ЧЕРЛИНГ
Original Assignee
Коудинг Технолоджиз Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from SE9702213A external-priority patent/SE9702213D0/en
Priority claimed from SE9800268A external-priority patent/SE512719C2/en
Application filed by Коудинг Технолоджиз Аб filed Critical Коудинг Технолоджиз Аб
Publication of RU99104814A publication Critical patent/RU99104814A/en
Application granted granted Critical
Publication of RU2256293C2 publication Critical patent/RU2256293C2/en

Links

Images

Landscapes

  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

FIELD: radio engineering; initial coding systems.
SUBSTANCE: band width is reduced in front of coder or within coder followed by duplicating spectrum band in decoder. This is made by using new methods of transposition jointly with spectrum envelope. Proposed invention can be implemented in hardware or software codec, or can be used as self-contained processor in combination with codec. Improvement is ensured irrespective of type of codec and state-of-the-art.
EFFECT: reduced bit transfer speed at desired perception quality or enhanced perception quality at desired bit transfer speed.
20 cl, 34 dwg

Description

Область техникиTechnical field

В системах исходного кодирования цифровые данные сжимаются до передачи или записи, чтобы уменьшить требуемую скорость передачи данных или объем памяти. Настоящее изобретение относиться к новому способу и устройству для усовершенствования систем исходного кодирования посредством дублирования спектральной полосы (ДСП). Достигается существенное снижение скорости передачи данных без ухудшения качества восприятия или, наоборот, достигается улучшение качества восприятия при заданной скорости передачи. Это обеспечивается за счет уменьшения ширины полосы спектра на стороне кодирования и последующего дублирования полосы спектра в декодере, т.е. изобретение использует новые концепции избыточности сигнала в спектральной области.In source coding systems, digital data is compressed before transmission or recording in order to reduce the required data rate or memory. The present invention relates to a new method and apparatus for improving source coding systems by duplicating a spectral band (DSP). A significant reduction in the data transfer rate is achieved without deterioration in the quality of perception, or, conversely, an improvement in the quality of perception at a given transmission rate is achieved. This is achieved by reducing the spectrum bandwidth on the encoding side and then duplicating the spectrum band in the decoder, i.e. the invention uses new concepts of signal redundancy in the spectral domain.

Предшествующий уровень техникиState of the art

Методы исходного кодирования звука могут быть разделены на два класса: кодирование натурального аудиосигнала и кодирование речевого сигнала. Кодирование натурального аудиосигнала широко используется для музыкальных или произвольных сигналов при средних скоростях передачи данных и в принципе предусматривает широкую полосу аудиочастот. Кодеры речевого сигнала в основном ограничены воспроизведением речевого сигнала, но, с другой стороны, могут быть использованы при очень низких скоростях передачи, хотя и при узкой полосе аудиочастот. Широкополосный речевой сигнал обеспечивает весьма существенное повышение качества по сравнению с узкополосным речевым сигналом. Расширение полосы частот не только повышает разборчивость и натуральность речи, но также облегчает распознавание говорящего. Широкополосное кодирование речевого сигнала представляет собой важную проблему, стоящую перед телефонными системами следующего поколения. Кроме того, в связи с ростом областей применения мультимедиа передача музыки и других неречевых сигналов в телефонных системах является желательным качеством.The methods of source audio coding can be divided into two classes: natural audio coding and speech coding. Natural audio coding is widely used for music or arbitrary signals at medium data rates and, in principle, provides for a wide range of audio frequencies. Speech encoders are generally limited to reproducing the speech signal, but, on the other hand, can be used at very low transmission rates, albeit with a narrow band of audio frequencies. A broadband speech signal provides a very significant improvement in quality compared to a narrowband speech signal. Expanding the frequency band not only enhances speech intelligibility and naturalness, but also facilitates speaker recognition. Broadband speech coding is an important challenge facing next-generation telephone systems. In addition, due to the growth of multimedia applications, the transmission of music and other non-speech signals in telephone systems is a desirable quality.

Линейный сигнал с импульсно-кодовой модуляцией (ИКМ), характеризуемый высокой достоверностью, неэффективен по скорости передачи в зависимости от энтропии восприятия. Стандарт компакт-дисков (СД) предписывает частоту дискретизации 44,1 кГц, разрешение 16 бит на выборку и стереорежим. Это соответствует скорости передачи 1411 кбит/сек. Для существенного снижения скорости передачи исходное кодирование может быть выполнено с использованием перцептуальных кодеков аудиосигнала с расщеплением спектра. Эти кодеки натурального аудиосигнала используют нерелевантность восприятия и статистическую избыточность в сигнале. При использовании наилучшей технологии кодирования-декодирования может быть достигнуто уменьшение объема данных примерно на 90% для сигнала стандартного CD-формата без какого-либо ухудшения разборчивости. Таким образом, возможно очень высокое качество звука в стереорежиме при скорости примерно 96 Кбит/сек, т.е. коэффициент сжатия равен примерно 15:1. Некоторые перцептуальные кодеки предусматривают даже более высокие степени сжатия. Чтобы достичь этого, в общем случае необходимо снизить частоту дискретизации и, тем самым, ширину полосы аудиочастот. Общепринятым является уменьшение количества уровней квантования, что допускает случайное искажение звука вследствие квантования, а также использование деградации области стерео, за счет интенсивного кодирования. Широкое использование таких способов приводит к ухудшению восприятия. Существующая технология кодирования-декодирования себя почти исчерпала и дальнейший прогресс в получении выигрыша от кодирования не ожидается. Для дополнительного улучшения характеристик кодирования необходим новый подход.A linear signal with pulse-code modulation (PCM), characterized by high reliability, is inefficient in transmission rate depending on the entropy of perception. The CD-ROM standard prescribes a sampling frequency of 44.1 kHz, a resolution of 16 bits per sample and stereo mode. This corresponds to a transfer rate of 1411 kbit / s. To significantly reduce the transmission speed, the original encoding can be performed using perceptual codecs of the audio signal with spectrum splitting. These natural audio codecs use irrelevant perception and statistical redundancy in the signal. By using the best encoding / decoding technology, a reduction of approximately 90% in the data volume for a standard CD format signal can be achieved without any degradation in legibility. Thus, a very high sound quality in stereo mode is possible at a speed of approximately 96 Kbps, i.e. the compression ratio is approximately 15: 1. Some perceptual codecs provide even higher compression rates. To achieve this, in the general case, it is necessary to reduce the sampling frequency and, thereby, the bandwidth of the audio frequencies. It is generally accepted to reduce the number of quantization levels, which allows for random distortion of the sound due to quantization, as well as the use of stereo region degradation due to intensive coding. The widespread use of such methods leads to poor perception. The existing encoding-decoding technology has almost exhausted itself and further progress in obtaining a gain from encoding is not expected. To further improve coding performance, a new approach is needed.

Человеческая речь и большинство музыкальных инструментов формируют квазистационарные сигналы, получаемые на выходе систем генерации. Согласно теории Фурье, любой периодический сигнал может быть выражен как сумма синусоидальных сигналов с частотами f, 2f, 3f, 4f, 5f и т.д., где f - основная частота. Эти частоты образуют последовательность гармоник. Ограничение полосы частот такого сигнала эквивалентно усечению f последовательности гармоник. Такое усечение изменяет воспринимаемый тембр, окраску тона музыкального инструмента или голоса и приводит к получению аудиосигнала, который будет звучать "приглушенно" или "монотонно", и разборчивость может снизиться. Высокие частоты, таким образом, важны для субъективного ощущения качества звука.Human speech and most musical instruments form quasistationary signals received at the output of generation systems. According to Fourier theory, any periodic signal can be expressed as the sum of sinusoidal signals with frequencies f, 2f, 3f, 4f, 5f, etc., where f is the fundamental frequency. These frequencies form a sequence of harmonics. The limitation of the frequency band of such a signal is equivalent to truncation f of the sequence of harmonics. This trimming changes the perceived timbre, the color of the tone of a musical instrument or voice, and results in an audio signal that will sound “muffled” or “monotonous,” and intelligibility may be reduced. High frequencies are thus important for the subjective sense of sound quality.

Способы, известные из предшествующего уровня техники, в основном предназначались для усовершенствования характеристик кодека, и, в частности, предназначались для регенерации высоких частот (РВЧ), являющейся проблемой при кодировании речевого сигнала. Такие способы используют широкополосные линейные сдвиги частот, нелинейности или наложение спектров (патент США 5.127.054), приводящие к генерации продуктов интермодуляции или других негармонических частотных составляющих, которые создают сильный диссонанс в применении к музыкальным сигналам. Такой диссонанс описывается в литературе по кодированию речи как "резкое" и "грубое" звучание. Другие способы синтезирования речевого сигнала генерируют синусоидальные гармоники, которые основаны на оценке фундаментального тона, и таким образом, ограничены тональными, стационарными звуковыми сигналами (патент США 4.771.465). Такие способы, известные из предшествующего уровня техники, будучи полезными для низкокачественных речевых применений, не применимы для высококачественного речевого сигнала или музыкальных сигналов. Ряд способов направлены на усовершенствование характеристик кодеков высококачественных источников звукового сигнала. Один из них использует синтезированные шумовые сигналы, генерируемые в декодере, чтобы заменить шумоподобные сигналы в речи или музыке, ранее исключавшиеся кодером (см. "Improving Audio Codecs by Noise Substitution" D.Schultz, JAES, Vol.44, № 7/8, 1996). Это выполняется в пределах полосы высоких частот, в остальном передаваемой нормально, на прерывистой основе при наличии шума. Другой способ воссоздает некоторые потерянные гармоники высокой частоты, которые были утеряны в процессе кодирования (см. "Audio Spectral Coder" A.J.S. Ferreira, AES Preprint 4201, 100th Convention, May 11-14 1996, Copenhagen), и также зависит от тональных сигналов и детектирования высоты тона. Оба способа работают на основе низкого рабочего цикла, обеспечивая сравнительно ограниченный выигрыш от кодирования или по эффективности.Methods known from the prior art, mainly intended to improve the characteristics of the codec, and, in particular, were intended for the regeneration of high frequencies (MHF), which is a problem when encoding a speech signal. Such methods employ broadband linear frequency shifts, nonlinearities, or spectral overlays (US Pat. No. 5,127,054), resulting in the generation of intermodulation products or other non-harmonic frequency components that create a strong dissonance when applied to music signals. Such dissonance is described in the literature on speech coding as “sharp” and “rough” sound. Other methods for synthesizing a speech signal generate sinusoidal harmonics that are based on an assessment of the fundamental tone, and thus are limited to tonal, stationary sound signals (US Pat. No. 4,771,465). Such methods, known from the prior art, while being useful for low-quality speech applications, are not applicable for high-quality speech signal or music signals. A number of methods are aimed at improving the characteristics of codecs of high-quality audio sources. One of them uses synthesized noise signals generated in a decoder to replace noise-like signals in speech or music that were previously excluded by the encoder (see "Improving Audio Codecs by Noise Substitution" D. Schultz, JAES, Vol.44, No. 7/8, 1996). This is done within the high-frequency band, which is otherwise transmitted normally, on an intermittent basis in the presence of noise. Another method recreates some of the lost high-frequency harmonics that were lost during the encoding process (see Audio Spectral Coder by AJS Ferreira, AES Preprint 4201, 100 th Convention, May 11-14 1996, Copenhagen) and also depends on tones and pitch detection. Both methods work on the basis of a low duty cycle, providing a relatively limited gain from coding or efficiency.

Сущность изобретенияSUMMARY OF THE INVENTION

Настоящее изобретение предусматривает новый способ и устройство для существенного усовершенствования систем цифрового исходного кодирования и, более конкретно, для усовершенствования кодеков аудиосигналов. Изобретение позволяет уменьшить скорость передачи данных или улучшить качество восприятия, или реализовать комбинацию этих свойств. Изобретение основано на новых способах использования избыточности гармоник, предоставляя возможность отбрасывания полос частот сигнала до передачи или записи. Не ощущается ухудшения восприятия, если декодер выполняет высококачественное повторение (дублирование) спектра согласно изобретению. Отброшенные биты представляют выигрыш от кодирования при фиксированном качестве восприятия. Альтернативно большее количество битов может быть выделено для кодирования информации полосы нижних частот при фиксированной скорости передачи, достигая, таким образом, более высокого качества восприятия.The present invention provides a new method and apparatus for substantially improving digital source coding systems and, more specifically, for improving audio codecs. The invention allows to reduce the data transfer rate or to improve the quality of perception, or to implement a combination of these properties. The invention is based on new ways of using harmonics redundancy, providing the ability to discard the signal frequency bands before transmission or recording. There is no perception deterioration if the decoder performs high-quality repetition (duplication) of the spectrum according to the invention. The discarded bits represent a gain from coding with a fixed quality of perception. Alternatively, a larger number of bits may be allocated to encode low-frequency band information at a fixed transmission rate, thereby achieving higher quality perception.

Настоящее изобретение постулирует, что усеченная последовательность гармоник может быть расширена на основании непосредственного соотношения между спектральными составляющими полосы нижних частот и полосы верхних частот. Эта расширенная последовательность похожа на первоначальную в смысле восприятия, если выполняются определенные правила. Во-первых, экстраполированные спектральные составляющие должны быть гармонически связанными и усеченной последовательностью гармоник, чтобы избежать диссонансных искажений. Настоящее изобретение использует транспозицию как средство для процедуры спектрального дублирования, которая гарантирует удовлетворение этого критерия. Однако для успешной работы нет необходимости, чтобы спектральные составляющие полосы нижних частот образовывали последовательность гармоник, поскольку новые дублированные составляющие, гармонически связанные с составляющими полосы нижних частот, не изменят шумоподобную или нестационарную природу сигнала. Транспозиция определяется как перенос частичных тонов из одного положения на музыкальной шкале в другое при поддержании частотных отношений для этих частичных тонов. Во-вторых, спектральная огибающая, т.е. грубое распределение спектра дублированной полосы высоких частот, должна достаточно хорошо повторять такое распределение первоначального сигнала. Настоящее изобретение обеспечивает два режима работы, ДСП-1 и ДСП-2, которые отличаются способом регулировки огибающей спектра.The present invention postulates that a truncated sequence of harmonics can be extended based on the direct relationship between the spectral components of the low-frequency band and the high-frequency band. This extended sequence is similar to the original in the sense of perception, if certain rules are followed. First, the extrapolated spectral components must be harmonically coupled and truncated by a sequence of harmonics to avoid dissonance distortions. The present invention uses transposition as a means for a spectral duplication procedure that ensures that this criterion is met. However, for successful operation there is no need for the spectral components of the low-frequency band to form a sequence of harmonics, since the new duplicated components, harmoniously connected with the components of the low-frequency band, will not change the noise-like or non-stationary nature of the signal. A transposition is defined as the transfer of partial tones from one position on a musical scale to another while maintaining frequency relationships for these partial tones. Secondly, the spectral envelope, i.e. rough distribution of the spectrum of the duplicated high-frequency band, should repeat this distribution of the initial signal well enough. The present invention provides two operating modes, DSP-1 and DSP-2, which differ in the way the spectrum envelope is adjusted.

Первый режим дублирования спектральной полосы (ДСП-1), предназначенный для усовершенствования применений кодека среднего качества, является одноканальным процессом, который использует исключительно информацию, содержащуюся в принятом сигнале полосы нижних частот в декодере. Спектральная огибающая этого сигнала определяется и экстраполируется, например, с использованием полиномов совместно с набором правил или кодового справочника. Эта информация используется, чтобы непрерывно регулировать и выравнивать дублированную полосу верхних частот. Способ ДСП-1 обеспечивает преимущество постобработки, т.е. не требуется никаких модификаций на стороне кодирования. Владелец радиопередающей станции получит выигрыш в использовании каналов, или будет иметь возможность улучшения качества восприятия, или обеспечит комбинацию этих качеств. Существующий синтаксис и стандарт потока данных может быть использован без изменения.The first spectral band duplication mode (DSP-1), designed to improve medium-quality codec applications, is a single-channel process that uses only the information contained in the received low-frequency band signal in the decoder. The spectral envelope of this signal is determined and extrapolated, for example, using polynomials in conjunction with a set of rules or a code book. This information is used to continuously adjust and align the duplicated high frequency band. The DSP-1 method provides the advantage of post-processing, i.e. no modifications are required on the encoding side. The owner of the radio transmitting station will gain in the use of channels, or will be able to improve the quality of perception, or provide a combination of these qualities. Existing syntax and standard data flow can be used without modification.

Режим ДСП-2, предназначенный для усовершенствования применений кодека высокого качества, является двухканальным процессом, в котором в дополнение к передаваемому сигналу полосы нижних частот согласно режиму ДСП-1 кодируется и передается огибающая спектра полосы верхних частот. Поскольку изменения огибающей спектра имеют гораздо меньшую скорость, чем изменения составляющих сигнала полосы верхних частот, то требуется передача только ограниченного объема информации, чтобы успешно представлять огибающую спектра. Режим ДСП-2 может быть использован для повышения эффективности существующих технологий кодирования-декодирования с минимальным изменением или без изменения существующих синтаксисов или протоколов и как весьма ценное средство для разработки будущих кодеков.The DSP-2 mode, designed to improve the applications of the high-quality codec, is a two-channel process in which, in addition to the transmitted low-frequency signal, according to the DSP-1 mode, the envelope of the high-frequency band spectrum is encoded and transmitted. Since changes in the spectrum envelope are much slower than changes in the components of the highband signal, only a limited amount of information is required to successfully represent the spectrum envelope. The DSP-2 mode can be used to increase the efficiency of existing encoding-decoding technologies with minimal or no change to existing syntaxes or protocols and as a very valuable tool for developing future codecs.

Режимы ДСП-1 и ДСП-2 могут быть использованы для дублирования меньших полос пропускания полосы нижних частот, когда такие полосы исключаются кодером, как обусловлено психо-акустической моделью в условиях битовой недостаточности. Это приводит к улучшению качества восприятия путем спектрального дублирования в полосе нижних частот в дополнение к спектральному дублированию вне полосы нижних частот. Кроме того, режимы ДСП-1 и ДСП-2 могут быть также использованы в кодеках, использующих масштабирование скорости передачи, где качество восприятия сигнала в приемнике изменяется в зависимости от условий в канале передачи. Это обычно включает в себя изменения полосы пропускания аудиосигнала приемника. В этих условиях режимы ДСП могут быть успешно использованы для поддержания постоянной полосы верхних частот, что дополнительно улучшает качество восприятия.The DSP-1 and DSP-2 modes can be used to duplicate smaller pass-bands of the low-frequency band when such bands are excluded by the encoder, as determined by the psycho-acoustic model in the conditions of bit failure. This leads to improved perception by spectral duplication in the low frequency band in addition to spectral duplication outside the low frequency band. In addition, the DSP-1 and DSP-2 modes can also be used in codecs that use transmission rate scaling, where the signal perception quality in the receiver varies depending on the conditions in the transmission channel. This usually includes changes in the bandwidth of the audio signal of the receiver. Under these conditions, DSP modes can be successfully used to maintain a constant high-frequency band, which further improves the quality of perception.

Настоящее изобретение работает на непрерывной основе, осуществляя дублирование содержимого сигналов любого типа, т.е. тональных или нетональных (шумоподобных и сигналов переходных процессов). Кроме того, настоящий способ дублирования спектра создает точную по восприятию копию отброшенных полос из доступных полос частот в декодере.The present invention operates on a continuous basis by duplicating the contents of signals of any type, i.e. tonal or non-tonal (noise-like and transient signals). In addition, the present spectrum duplication method creates a perceptually accurate copy of the discarded bands from the available frequency bands in the decoder.

Следовательно, способ ДСП обеспечивает существенно более высокий уровень выигрыша от кодирования или улучшения качества восприятия по сравнению со способами, известными из предшествующего уровня техники. Это изобретение может быть использовано совместно со способами усовершенствования кодека, известного из предшествующего уровня техники; однако от таких комбинаций не следует ожидать какого-либо повышения эффективности.Therefore, the DSP method provides a significantly higher level of gain from coding or improved perception quality compared to methods known from the prior art. This invention can be used in conjunction with methods for improving a codec known in the art; however, no such increase in effectiveness should be expected from such combinations.

Способ ДСП включает следующие этапы:Particleboard method includes the following steps:

- кодирование сигнала, полученного из исходного сигнала, где частотные полосы сигнала удалены, причем это удаление выполнено до или во время кодирования, при котором формируется первый сигнал,- encoding a signal obtained from the original signal, where the frequency bands of the signal are removed, and this deletion is performed before or during encoding, at which the first signal is generated

- транспозиция частотных полос первого сигнала во время или после декодирования, с формированием второго сигнала,- transposition of the frequency bands of the first signal during or after decoding, with the formation of the second signal,

- выполнение подстройки огибающей спектра и- performing tuning of the envelope of the spectrum and

- комбинирование декодированного сигнала и второго сигнала для формирования выходного сигнала.- combining the decoded signal and the second signal to form the output signal.

Полоса пропускания второго сигнала может быть установлена так, чтобы не перекрываться или частично пересекаться с полосой частот первого сигнала, и может быть установлена в зависимости от временных характеристик исходного сигнала и/или первого сигнала, или условий в канале передачи. Подстройка огибающей спектра выполняется на основании оценки исходной огибающей спектра упомянутого первого сигнала или передаваемой информации огибающей исходного сигнала.The bandwidth of the second signal can be set so as not to overlap or partially overlap with the frequency band of the first signal, and can be set depending on the time characteristics of the original signal and / or the first signal, or conditions in the transmission channel. The tuning of the spectral envelope is performed based on the evaluation of the initial spectral envelope of the first signal or the transmitted envelope information of the original signal.

Настоящее изобретение содержит два основных типа устройств транспозиции: многополосные устройства транспозиции и устройства транспозиции с прогнозированием с изменяющейся во времени схемой поиска, имеющие различные свойства. Основная многополосная транспозиция может быть выполнена согласно настоящему изобретению следующим образом:The present invention contains two main types of transposition devices: multiband transposition devices and prediction transposition devices with a time-varying search pattern having various properties. The main multiband transposition can be performed according to the present invention as follows:

- фильтрация сигнала, подлежащего транспонированию, посредством набора из N≥ 2 полосовых фильтров с полосами пропускания, содержащими частоты (f1,... ,fn), соответственно, для формирования сигналов N полос пропускания,- filtering the signal to be transposed by means of a set of N≥ 2 bandpass filters with passbands containing frequencies (f1, ..., fn), respectively, for generating signals of N passbands,

- сдвиг сигналов полос пропускания по частоте в области, содержащие частоты M(f1,... ,fn), где М≠ 1 представляет коэффициент транспозиции, иa frequency shift of the passband signals in the region containing frequencies M (f1, ..., fn), where M ≠ 1 represents the transposition coefficient, and

- объединение сдвинутых сигналов полос пропускания с формированием транспонированного сигнала.- combining shifted bandwidth signals with the formation of a transposed signal.

Как вариант, эта базовая многополосовая транспозиция может быть выполнена в соответствии с изобретением следующим образом:Alternatively, this basic multiband transposition can be performed in accordance with the invention as follows:

- полосовая фильтрация сигнала, подлежащего транспонированию, с использованием набора анализирующих фильтров или преобразователя, для генерирования низкочастотных сигналов действительных или комплексных субполос,- band-pass filtering of the signal to be transposed using a set of analyzing filters or a converter to generate low-frequency signals of real or complex subbands,

- произвольное количество каналов k с упомянутого набора анализирующих фильтров или преобразователя подключаются к каналам Mk, где M≠ 1, в набор синтезирующих фильтров или преобразователе и- an arbitrary number of channels k from the mentioned set of analyzing filters or a converter are connected to channels Mk, where M ≠ 1, into a set of synthesizing filters or a converter and

- формируется транспонированный сигнал с использованием набора синтезирующих фильтров или преобразователя.- a transposed signal is generated using a set of synthesizing filters or a converter.

Усовершенствованная многополосная транспозиция согласно настоящему изобретению включает в себя подстройки фазы, улучшающие характеристику базовой многополосной транспозиции.The improved multiband transposition according to the present invention includes phase adjustments that improve the performance of the base multiband transposition.

Транспозиция с прогнозированием с изменяющейся во времени схемой поиска согласно настоящему изобретению может быть выполнена следующим образом:A prediction transposition with a time-varying search pattern according to the present invention can be performed as follows:

- обнаружение переходного процесса в первом сигнале,- detection of a transient in the first signal,

- определение, какой сегмент первого сигнала должен быть использован при дублировании частей первого сигнала в зависимости от результата обнаружения переходного процесса,- determining which segment of the first signal should be used when duplicating parts of the first signal, depending on the result of transient detection,

- подстройка свойств вектора состояния и набора кодов в зависимости от результата обнаружения переходного процесса и- fine-tuning the properties of the state vector and set of codes depending on the result of the detection of the transient and

- поиск точек синхронизации в выбранном сегменте первого сигнала на основе точки синхронизации, найденной при предыдущем поиске точки синхронизации.- search for synchronization points in the selected segment of the first signal based on the synchronization point found during a previous search for the synchronization point.

Способы ДСП и устройства согласно настоящему изобретению обеспечивают следующие качества:Particleboard methods and devices according to the present invention provide the following qualities:

1. Эти способы и устройства используют новые концепции избыточности сигнала в спектральной области.1. These methods and devices use new concepts of signal redundancy in the spectral region.

2. Эти способы и сигналы применимы к произвольным сигналам.2. These methods and signals are applicable to arbitrary signals.

3. Каждый набор гармоник индивидуально создается и регулируется.3. Each set of harmonics is individually created and adjusted.

4. Все дублируемые гармоники генерируются таким образом, чтобы сформировать продолжение существующей последовательности гармоник.4. All duplicated harmonics are generated in such a way as to form a continuation of the existing sequence of harmonics.

5. Процесс дублирования спектра основан на транспозиции и не создает никаких помех или создает незначительные помехи.5. The process of spectrum duplication is based on transposition and does not cause any interference or creates slight interference.

6. Дублирование спектра может обеспечить перекрытие множества меньших полос и/или широкий диапазон частот.6. Duplication of the spectrum can provide overlapping multiple smaller bands and / or a wide range of frequencies.

7. В способе ДСП-1 обработка выполняется только на стороне декодера, т.е. все стандарты и протоколы могут использоваться без изменений.7. In the DSP-1 method, processing is performed only on the side of the decoder, i.e. All standards and protocols are subject to change.

8. Способ ДСП-2 может быть использован в соответствии с большинством стандартов и протоколов без изменений или с минимальными изменениями.8. The DSP-2 method can be used in accordance with most standards and protocols without changes or with minimal changes.

9. Способ ДСП-2 предоставляет проектировщику кодека новое мощное средство сжатия.9. The DSP-2 method provides the codec designer with a new powerful compression tool.

10. Кодирование обеспечивает значительный выигрыш. Наиболее эффективное применение относится к совершенствованию различных типов низкоскоростных кодеков, таких как MPEG 1/2 Layer I/II/III (патент США 5.040.217), MPEG 2/4 AAC, Dolby AC-2/3, NTT Twin VQ (патент США 5.684.920), AT&T/Lucent РАС и т.д. Это изобретение также полезно для высококачественных речевых кодеков, таких как широкополосный CELP и SB-ADPCM G.722 и т.д. для повышения качества восприятия. Вышеупомянутые кодеки широко применяются в мультимедиа, в телефонной промышленности, на Интернете, а также в профессиональных системах. Системы T-DAB (Наземная система цифрового звукового вещания) используют низкоскоростные протоколы, которые дают выигрыш в использовании каналов при применении настоящего способа или в повышении качества ЧМ и AM цифрового вещания. Спутниковые системы S-DAB могут получить значительный выигрыш ввиду высоких системных затрат от использования настоящего изобретения, чтобы увеличить количество каналов в мультиплексированной системе цифрового звукового вещания. Кроме того, впервые поток аудиосигналов реального времени в полном диапазоне через Интернет доступен при использовании низкоскоростных телефонных модемов.10. Coding provides significant gains. The most effective application relates to the improvement of various types of low-speed codecs, such as MPEG 1/2 Layer I / II / III (US patent 5.040.217), MPEG 2/4 AAC, Dolby AC-2/3, NTT Twin VQ (US patent 5.684.920), AT & T / Lucent RAS, etc. This invention is also useful for high-quality speech codecs such as Broadband CELP and SB-ADPCM G.722, etc. to improve the quality of perception. The above codecs are widely used in multimedia, in the telephone industry, on the Internet, as well as in professional systems. T-DAB (Terrestrial Digital Audio Broadcasting System) systems use low-speed protocols that benefit in the use of channels when using this method or in improving the quality of FM and AM digital broadcasting. S-DAB satellite systems can greatly benefit from the high system costs of using the present invention to increase the number of channels in a multiplexed digital audio broadcasting system. In addition, for the first time, a full-range stream of real-time audio signals over the Internet is available using low-speed telephone modems.

Краткое описание чертежейBrief Description of the Drawings

Настоящее изобретение поясняется ниже на примерах его осуществления, не ограничивающих объем или сущность изобретения, со ссылками на чертежи, в которых показано следующее:The present invention is explained below with examples of its implementation, not limiting the scope or essence of the invention, with reference to the drawings, which show the following:

Фиг.1 - схематичное представление ДСП в системе кодирования согласно настоящему изобретению;Figure 1 is a schematic representation of a chipboard in a coding system according to the present invention;

Фиг.2 - представление дублирования спектра верхних гармоник согласно настоящему изобретению;Figure 2 - representation of the duplication of the spectrum of the upper harmonics according to the present invention;

Фиг.3 - представление дублирования спектра средних гармоник согласно настоящему изобретению;Figure 3 - representation of the duplication of the spectrum of the middle harmonics according to the present invention;

Фиг.4 - блок-схема варианта реализации во временной области устройства транспозиции согласно настоящему изобретению;4 is a block diagram of an embodiment in the time domain of a transposition device according to the present invention;

Фиг.5 - блок-схема последовательности операций в рабочем цикле устройства транспозиции с прогнозированием схемы поиска;5 is a flowchart in a duty cycle of a transposition device with prediction of a search pattern;

Фиг.6 - блок-схема последовательности операций при поиске точки синхронизации согласно настоящему изобретению;6 is a flowchart for searching for a synchronization point according to the present invention;

Фиг.7а-7b - позиционирование кодовых наборов во время переходных процессов согласно настоящему изобретению;Figa-7b - positioning of the code sets during transients according to the present invention;

Фиг.8 - блок-схема, иллюстрирующая применение нескольких устройств транспозиции во временной области во взаимосвязи с подходящим набором фильтров, для операции ДСП согласно настоящему изобретению;Fig. 8 is a block diagram illustrating the use of several transposition devices in the time domain in conjunction with a suitable set of filters, for a chipboard operation according to the present invention;

Фиг.9а-9с - это блок-схемы, представляющие устройство для анализа и синтеза с использованием преобразования Фурье для короткого интервала времени ПФКВ, выполненное для генерации гармоник 2-го порядка согласно настоящему изобретению;Figa-9c is a block diagram representing a device for analysis and synthesis using the Fourier transform for a short time interval PFKV made to generate 2nd-order harmonics according to the present invention;

Фиг.10а-10b - это блок-схемы для одной субполосы с линейным сдвигом частоты в устройстве ПФКВ согласно настоящему изобретению;Figa-10b is a block diagram for one subband with a linear frequency shift in the device PFKV according to the present invention;

Фиг.11 - схема для одной субполосы с использованием фазоумножителя согласно настоящему изобретению;11 is a diagram for one subband using a phase multiplier according to the present invention;

Фиг.12 - иллюстрация генерирования гармоник 3-го порядка согласно настоящему изобретению;12 is an illustration of generating 3rd order harmonics according to the present invention;

Фиг.13 - иллюстрация генерирования гармоник 2-го и 3-го порядка согласно настоящему изобретению;Fig. 13 is an illustration of the generation of 2nd and 3rd order harmonics according to the present invention;

Фиг.14 - иллюстрация генерирования неперекрывающейся комбинации нескольких гармонических рядов согласно настоящему изобретению;Fig. 14 is an illustration of generating a non-overlapping combination of several harmonic rows according to the present invention;

Фиг.15 - иллюстрация генерирования комбинации с чередованием нескольких гармонических рядов согласно настоящему изобретению;FIG. 15 is an illustration of generating a combination with alternating several harmonic rows according to the present invention; FIG.

Фиг.16 - иллюстрация генерирования широкополосных линейных сдвигов частот;16 is an illustration of generating wideband linear frequency shifts;

Фиг.17 - иллюстрация генерирования субгармоник согласно настоящему изобретению;17 is an illustration of generating subharmonics according to the present invention;

Фиг.18а-18b - блок-схемы перцептуального кодека;Figa-18b is a block diagram of a perceptual codec;

Фиг.19 - базовая структура набора фильтров с максимальным прореживанием;Fig - the basic structure of a set of filters with maximum decimation;

Фиг.20 - иллюстрация генерирования гармоник 2-го порядка в наборе фильтров с максимальным прореживанием согласно настоящему изобретению;FIG. 20 is an illustration of the generation of 2nd order harmonics in a filter set with maximum decimation according to the present invention; FIG.

Фиг.21 - блок-схема усовершенствованной многополосной транспозиции в наборе фильтров с максимальным прореживанием для сигналов субполос согласно настоящему изобретению;21 is a block diagram of an improved multi-band transposition in a filter set with maximum decimation for subband signals according to the present invention;

Фиг.22 - блок-схема последовательности операций, представляющая усовершенствованную многополосную транспозицию в наборе фильтров с максимальным прореживанием для сигналов субполос согласно настоящему изобретению;FIG. 22 is a flowchart showing an improved multi-band transposition in a filter set with maximum decimation for subband signals according to the present invention; FIG.

Фиг.23 - представление субполос и коэффициентов масштабирования для типового кодека;23 is a representation of subbands and scaling factors for a typical codec;

Фиг.24 - представление субполос и информации огибающей для режима ДСП-2 согласно настоящему изобретению;24 is a representation of subbands and envelope information for a DSP-2 mode according to the present invention;

Фиг.25 - иллюстрация скрытой передачи информации огибающей в режиме ДСП-2 согласно настоящему изобретению;Fig - illustration of a hidden transmission of envelope information in the mode of the chipboard-2 according to the present invention;

Фиг.26 - иллюстрация избыточного кодирования в режиме ДСП-2 согласно настоящему изобретению;FIG. 26 is an illustration of redundant coding in DSP-2 mode according to the present invention; FIG.

Фиг.27 - вариант выполнения кодека с использованием способа ДСП-1 согласно настоящему изобретению;Fig. 27 is an embodiment of a codec using the DSP-1 method according to the present invention;

Фиг.28 - вариант выполнения кодека с использованием способа ДСП-2 согласно настоящему изобретению;Fig. 28 is an embodiment of a codec using the DSP-2 method according to the present invention;

Фиг.29 - блок-схема "псевдостерео" генератора согласно настоящему изобретению.FIG. 29 is a block diagram of a “pseudo stereo” generator according to the present invention.

Описание предпочтительных вариантов осуществленияDescription of Preferred Embodiments

При описании вариантов осуществления особый акцент сделан на задачах исходного кодирования естественного аудиосигнала. Однако следует иметь в виду, что настоящее изобретение применимо к целому диапазону задач исходного кодирования, отличающихся от задач кодирования и декодирования аудиосигналов.In describing the embodiments, particular emphasis is placed on the problems of source coding of a natural audio signal. However, it should be borne in mind that the present invention is applicable to a whole range of source coding tasks, different from the tasks of encoding and decoding audio signals.

Основы транспозицииTransposition Basics

Транспозиция, как определено согласно настоящему изобретению, является идеальным способом спектрального дублирования и имеет ряд важных преимуществ по сравнению с предшествующим уровнем техники, в том числе не требуется детектирования основного тона, достигается одинаково высококачественная характеристика для однотонного и полифонического программного материала, и транспозиция реализуется одинаково хорошо для тональных и не тональных сигналов. В противоположность другим способам транспозиция согласно изобретению может быть использована в системах исходного кодирования произвольных аудиосигналов для сигналов произвольного типа.Transposition, as defined according to the present invention, is an ideal method of spectral duplication and has several important advantages compared with the prior art, including the need for detection of the fundamental tone, the same high-quality characteristic is achieved for monophonic and polyphonic program material, and the transposition is implemented equally well for tonal and non-tonal signals. In contrast to other methods, the transposition according to the invention can be used in source coding systems of arbitrary audio signals for signals of an arbitrary type.

Коэффициент М точной транспозиции дискретного по времени сигнала х(n) в форме суммы косинусов с изменяющимися по времени амплитудами определяется соотношениемThe coefficient M of the exact transposition of the time-discrete signal x (n) in the form of the sum of cosines with time-varying amplitudes is determined by the relation

Figure 00000002
Figure 00000002

Figure 00000003
Figure 00000003

где N - количество синусоид, здесь в дальнейшем определяемые как частичные тона, fi, еi (n), α i - индивидуальные входные частоты, временные огибающие и фазовые константы, соответственно, β i - произвольные выходные фазовые константы, а fs - частота дискретизации, и О≤ Мfi ≤ fs/2.where N is the number of sinusoids, hereinafter defined as partial tones, f i , e i (n), α i are individual input frequencies, temporal envelopes and phase constants, respectively, β i are arbitrary output phase constants, and f s are sampling rate, and O≤ Mf i ≤ f s / 2.

Фиг.2 иллюстрирует генерацию гармоник М-го порядка, где М это целое число ≥ 2. Термин "гармоники М-го порядка" использован для упрощения, хотя этот процесс генерирует гармоники М-го порядка для всех сигналов в определенном диапазоне частот, которые в большинстве случаев сами являются гармониками неизвестного порядка. Входной сигнал, представленный в частотной области Х(f) ограничен полосой 201 до диапазона от 0 до fmax. Содержимое сигналов в диапазоне от fmax/М до Qfmax/M, где Q является желаемым коэффициентом расширения ширины полосы 1<Q≤ М, выделяется посредством полосового фильтра с формированием полосового сигнала 203 со спектром Хвр(f). Этот полосовой сигнал транспонируется с коэффициентом М, формируя второй полосовой сигнал 205 со спектром Хт(f), перекрывающим диапазон от fmax до Qfmax. Огибающая спектра этого сигнала регулируется с помощью программно-упраляемого эквалайзера, формируя сигнал 207 со спектром ХE(f). Этот сигнал затем комбинируется с задержанной версией входного сигнала, чтобы компенсировать задержку, вызванную полосовым фильтром и устройством транспонирования, посредством чего формируется выходной сигнал 209 со спектром Y(f), покрывающий диапазон от 0 до Qfmax. Как вариант, выделение полосы частот может быть выполнено после транспозиции М с использованием частот отсечки fmах и Оfmax. При использовании множества устройств транспозиции возможна, конечно, одновременная генерация различных гармонических рядов. Вышеприведенная схема также может быть использована для "заполнения" полос заграждения во входном сигнале, как показано на фиг.3, где входной сигнал имеет полосу заграждения 301 от f0 до Qf0. Полоса частот [f0/М, Qf0/M], затем выделяется (303), транспонируется с коэффициентом М до [f0, Qf0] (305), подстраивается по огибающей (307) и объединяется с задержанным входным сигналом, формируя выходной сигнал 309 со спектром Y(f).Figure 2 illustrates the generation of Mth order harmonics, where M is an integer ≥ 2. The term "Mth order harmonics" is used to simplify, although this process generates Mth order harmonics for all signals in a certain frequency range, which in most cases they themselves are harmonics of an unknown order. The input signal presented in the frequency domain X (f) is limited to band 201 to a range from 0 to f max . The content of the signals in the range from f max / M to Qf max / M, where Q is the desired coefficient of expansion of the bandwidth 1 <Q≤ M, is extracted by a band-pass filter with the formation of a band-pass signal 203 with a spectrum of X BP (f). This bandpass signal is transposed with a factor of M, forming a second bandpass signal 205 with a spectrum of X t (f), covering the range from f max to Qf max . The spectrum envelope of this signal is adjusted using a programmable equalizer, forming a signal 207 with a spectrum of X E (f). This signal is then combined with a delayed version of the input signal to compensate for the delay caused by the bandpass filter and the transpose device, whereby an output signal 209 with a spectrum Y (f) is generated, covering a range from 0 to Qf max . Alternatively, the allocation of the frequency band can be performed after transposition M using cutoff frequencies f max and Оf max . When using multiple transposition devices, of course, the simultaneous generation of various harmonic series is possible. The above circuit can also be used to “fill” the obstacle bands in the input signal, as shown in FIG. 3, where the input signal has an obstacle band 301 from f 0 to Qf 0 . The frequency band [f 0 / M, Qf 0 / M], then is highlighted (303), transposed with a factor of M to [f 0 , Qf 0 ] (305), adjusts along the envelope (307) and combines with the delayed input signal, forming output signal 309 with a spectrum of Y (f).

Может быть использована аппроксимация точной транспозиции. Согласно настоящему изобретению качество таких аппроксимаций определяется с использованием теории диссонанса. Критерий для диссонанса представлен в работе "Tonal Consonance and Critical Bandwidth" R.Plomp, W.J.M. Levelt JASA, Vol.38, 1965 г. и заключается в том, что два частичных тона рассматриваются как диссонантные, если разность частот находится в пределах примерно от 5 до 50% ширины полосы критической полосы частот, в которой находятся эти частичные тоны. Критическая ширина полосы для данной частоты может быть приближенно определена соотношениемAn approximation of precise transposition can be used. According to the present invention, the quality of such approximations is determined using the theory of dissonance. The criterion for dissonance is presented in the work "Tonal Consonance and Critical Bandwidth" R.Plomp, W.J.M. Levelt JASA, Vol. 38, 1965 and consists in the fact that two partial tones are considered to be dissonant if the frequency difference is in the range of about 5 to 50% of the bandwidth of the critical frequency band in which these partial tones are located. The critical bandwidth for a given frequency can be approximately determined by the relation

Figure 00000004
Figure 00000004

с f и cb в герцах. Кроме того, в вышеупомянутой работе утверждается, что органы слуха человека не могут разделить два частичных тона, если они отличаются по частоте на величину меньшую, чем приблизительно 5 процентов критической ширины полосы, в которой они находятся. Точная транспозиция в уравнении (2) аппроксимируется с помощьюwith f and cb in hertz. In addition, the aforementioned work claims that the human hearing organs cannot separate two partial tones if they differ in frequency by less than about 5 percent of the critical bandwidth in which they are located. The exact transposition in equation (2) is approximated by

Figure 00000005
Figure 00000005

где f - отклонение от точной транспозиции. Если входные частичные тоны образуют гармонический ряд, гипотеза настоящего изобретения утверждает, что отклонения от гармонического ряда транспонируемых частичных тонов не должны превышать пяти процентов от критической ширины полосы, в которой они находятся. Это могло бы объяснить, почему способы, известные из предшествующего уровня техники, дают неудовлетворительные "грубые" результаты, поскольку широкополосные линейные сдвиги частот создают гораздо большее отклонение, чем допустимо. Когда способы, известные из предшествующего уровня техники, формируют более одного частичного тона для только одного входного частичного тона, эти частичные тона должны, тем не менее, находиться в пределах установленного предела отклонений, чтобы восприниматься как один частичный тон. Это еще раз объясняет неудовлетворительные результаты, получаемые в способах, известных из предшествующего уровня техники, использующих нелинейности и т.п., поскольку они формируют интермодуляционные частичные тона, не входящие в пределы отклонений.where f is the deviation from the exact transposition. If the input partial tones form a harmonic series, the hypothesis of the present invention claims that deviations from the harmonic series of transposed partial tones should not exceed five percent of the critical bandwidth in which they are located. This could explain why the methods known from the prior art give unsatisfactory “rough” results, since wideband linear frequency shifts create a much larger deviation than is permissible. When methods known from the prior art generate more than one partial tone for only one input partial tone, these partial tones must nevertheless be within the set deviation limit in order to be perceived as one partial tone. This once again explains the unsatisfactory results obtained in methods known from the prior art using non-linearities and the like, since they form intermodulation partial tones that are not within the deviation limits.

При использовании вышеприведенного способа дублирования спектра на основе транспозиции согласно настоящему изобретению достигаются следующие важные свойства.Using the above transposition-based spectrum duplication method according to the present invention, the following important properties are achieved.

- Не происходит никакого перекрытия в частотной области между дублированными гармониками и существующими частичными тонами.- There is no overlap in the frequency domain between duplicated harmonics and existing partial tones.

- Дублированные частичные тоны являются гармониками частичных тонов входного сигнала и не приводят к увеличению диссонанса или искажений.- Duplicate partial tones are harmonics of the partial tones of the input signal and do not lead to an increase in dissonance or distortion.

- Огибающая спектра дублированных гармоник образует плавное продолжение огибающей спектра входного сигнала, соответствуя по восприятию исходной огибающей.- The envelope of the spectrum of the duplicated harmonics forms a smooth continuation of the envelope of the spectrum of the input signal, corresponding to the perception of the original envelope.

Транспозиция на основе прогнозирования с изменяющейся по времени схемой поискаPrediction-based transposition with a time-varying search pattern

Существуют различные способы создания требуемых устройств транспозиции. Типовые реализации во временной области расширяют сигнал по времени путем дублирования сегментов сигнала на основании периода основного тона. Этот сигнал последовательно считывается с разными скоростями. К сожалению, такие способы сильно зависят от обнаружения основного тона и требуют точного временного сопряжения сегментов сигнала. Кроме того, необходимость работы с сегментами сигнала на базе периода основного тона делает их чувствительными к переходным процессам. Поскольку обнаруженный период основного тона может быть намного длине, чем действительный переходной процесс, очевиден риск дублирования полного переходного процесса вместо простого расширения его по времени. Другой тип алгоритмов во временной области реализует временное расширение/сжатие речевого сигнала с использованием прогнозирования схемы поиска выходного сигнала (см."Pattern Search Prediction of Speech" R.Bogner, T.Li, Proc.ICASSP’89, Vol.1, May 1989, "Time-Scale Modification of Speech based on a nonlinear Oscillator Model" G.Kubin, W.B.Kleijn, IEEE, 1994). Это является формой гранулярного синтеза, в котором входной сигнал делится на маленькие части, гранулы, используемые для синтезирования выходного сигнала. Этот синтез обычно производится путем выполнения корреляции сегментов сигнала, чтобы определить лучшие точки стыковки. Это означает, что сегменты, используемые для формирования выходного сигнала, не зависят от периода основного тона и таким образом, не требуется решать нетривиальную задачу обнаружения основного высоты тона. Тем не менее, в этих способах остаются проблемы с быстро меняющимися амплитудами сигнала, и при необходимости обеспечения высококачественной транспозиции растут требования к вычислениям. Изобретение представляет усовершенствованное устройство сдвига основного тона и транспонирования во временной области, где использование обнаружения переходного процесса и динамических параметров системы создают более точную транспозицию для высоких коэффициентов транспозиции как для стационарных (тональных и нетональных), так и переходных звуков при низких вычислительных затратах.There are various ways to create the required transposition devices. Typical implementations in the time domain extend the signal over time by duplicating signal segments based on the pitch period. This signal is sequentially read at different speeds. Unfortunately, such methods are highly dependent on the detection of the fundamental tone and require accurate temporal conjugation of the signal segments. In addition, the need to work with signal segments based on the period of the fundamental tone makes them sensitive to transients. Since the detected pitch period can be much longer than the actual transient, the obvious risk of duplication of the full transient instead of simply expanding it in time. Another type of time-domain algorithm implements temporal expansion / contraction of a speech signal using prediction of the output signal search scheme (see "Pattern Search Prediction of Speech" R. Bogner, T. Li, Proc.ICASSP'89, Vol.1, May 1989 , "Time-Scale Modification of Speech based on a nonlinear Oscillator Model" (G. Kubin, WBKleijn, IEEE, 1994). This is a form of granular synthesis in which the input signal is divided into small parts, granules used to synthesize the output signal. This synthesis is usually done by correlating signal segments to determine the best joining points. This means that the segments used to form the output signal are independent of the period of the fundamental tone and thus, it is not necessary to solve the non-trivial task of detecting the fundamental pitch. However, in these methods, problems remain with rapidly changing signal amplitudes, and, if necessary, to ensure high-quality transposition, computing requirements increase. The invention provides an improved pitch shifting and transposition device in the time domain, where the use of transient detection and system dynamic parameters create more accurate transposition for high transposition coefficients for both stationary (tonal and non-tonal) and transition sounds at low computational costs.

На фиг.4 показаны следующие модули: детектор переходных процессов 401, регулятор положения окна 403, генератор набора 405, селектор сигналов синхронизации 407, память положения синхронизации 409, устройство оценки минимальной разности 411, память выходного сегмента 413, блок смешивания 415 и устройство дискретизации с пониженной частотой 417. Входной сигнал подается как на генератор набора 405, так и на детектор переходных процессов 401. Если переходной процесс обнаружен, то информация о его положении посылается в модуль положения окна 403. Этот модуль устанавливает размер и положение окна, которое умножается на входной сигнал при создании набора кодов. Генератор набора кодов 495 приминает данные положения синхронизации от модуля выделения данных синхронизации 407, при условии что он соединен с другим устройством транспозиции. Если данные положения синхронизации имеются в наборе кодов, то они используются и вырабатывается выходной сегмент. В противном случае набор кодов посылается в устройство оценки минимальной разности 411, который выдает новое положение синхронизации. Новый выходной сегмент присоединяется к окну вместе с предшествующим выходным сегментом в модуле смешивания 415 и затем дискретизируется в модуле 417.Figure 4 shows the following modules: transient detector 401, window position controller 403, set generator 405, clock signal selector 407, clock position memory 409, minimum difference estimator 411, output segment memory 413, mixing unit 415, and sampling device with reduced frequency 417. The input signal is supplied to both the set generator 405 and the transient detector 401. If a transient is detected, information about its position is sent to the window position module 403. This module is installed Puts the size and position of the window, which is multiplied by the input signal when creating a set of codes. A code set generator 495 presses the synchronization position data from the synchronization data extraction module 407, provided that it is connected to another transposition device. If these synchronization positions are in the code set, then they are used and the output segment is generated. Otherwise, the set of codes is sent to the minimum difference estimator 411, which provides a new synchronization position. A new output segment is attached to the window along with the previous output segment in mixing module 415 and then sampled in module 417.

Для пояснения вводится представление области состояний. Здесь векторы состояния или гранулы представляют входной и выходной сигналы. Входной сигнал представлен вектором состояний х(n):For clarification, a representation of the state region is introduced. Here, the state vectors or granules represent the input and output signals. The input signal is represented by the state vector x (n):

Figure 00000006
Figure 00000006

который получен из N задержанных выборок входного сигнала, где N - размерность вектора состояния, a D - задержка между входными выборками, используемыми для построения вектора. Гранулярное отражение дает выборку х(n) соответственно каждому вектору состояния x(n-1). В результате получаем уравнение (6), где а(* ) - отображение:which is obtained from N delayed samples of the input signal, where N is the dimension of the state vector, and D is the delay between the input samples used to construct the vector. Granular reflection gives a sample of x (n), respectively, to each state vector x (n-1). As a result, we obtain equation (6), where a (*) is the map:

Figure 00000007
Figure 00000007

В настоящем способе гранулярное отображение используется для определения следующего выходного результата на основании предыдущего выходного результата, используя набор кодов переходов состояний. Набор кодов длины L постоянно перестраивается, включая векторы состояния и следующую выборку, следующую за каждым вектором состояния. Каждый вектор состояния отделяется от соседнего К выборками; это позволяет системе регулировать временное разрешение в зависимости от характеристик текущего обрабатываемого сигнала, где К, равное единице, представляет наилучшую разрешающую способность. Сегмент входного сигнала, используемый для построения набора кодов, выбирается на основании положения возможного переходного процесса и положения синхронизации в предыдущем наборе кодов.In the present method, granular mapping is used to determine the next output result based on the previous output result using a set of state transition codes. A set of codes of length L is constantly being rebuilt, including state vectors and the next sample following each state vector. Each state vector is separated from the neighboring K by samples; this allows the system to adjust the temporal resolution depending on the characteristics of the current signal being processed, where K, equal to one, represents the best resolution. The input signal segment used to construct the code set is selected based on the position of a possible transient and the synchronization position in the previous code set.

Это означает, что отображение а(* ), теоретически, оценивается для всех переходов, включенных в набор кодовThis means that the mapping a (*) is theoretically evaluated for all transitions included in the set of codes

Figure 00000008
Figure 00000008

C этим набором кодов переходов новый выходной результат у(n) вычисляется поиском вектора состояния в наборе кодов, наиболее сходного с текущим вектором состояния у(n-1). Этот поиск ближайшего соседа выполняется вычислением минимальной разности и дает новую выходную выборкуWith this set of transition codes, the new output result y (n) is calculated by searching for the state vector in the set of codes most similar to the current state vector y (n-1). This nearest neighbor search is performed by calculating the minimum difference and gives a new output sample

Figure 00000009
Figure 00000009

Однако система не ограничивается работой на базе выборок, она предпочтительно работает на базе сегментов. Новый выходной сегмент вводится в окно и суммируется, смешивается с предыдущим выходным сегментом и затем дискретизируется. Коэффициент шага транспозиции определяется отношением длины входного сегмента, представленной набором кодов, и длины выходного сегмента, считанной с набора кодов.However, the system is not limited to working on the basis of samples; it preferably works on the basis of segments. A new output segment is entered into the window and summed, mixed with the previous output segment and then sampled. The transposition step coefficient is determined by the ratio of the length of the input segment represented by the set of codes and the length of the output segment read from the set of codes.

На фиг.5 и 6 представлены блок-схемы, показывающие цикл работы устройства транспонирования. Этап 501 представляет ввод данных; на этапе 503 производится детектирование переходного процесса на сегменте входного сигнала; поиск переходных процессов выполняется на длине сегмента, равной длине выходного сегмента. Если на этапе 505 найден переходный процесс, то на этапе 507 положение переходного процесса записывается и параметры L (представляющий длину набора кодов), К (представляющий расстояние между векторами состояния в квантах) и D (представляющий задержку между квантами в каждом векторе состояния) устанавливаются на этапе 509. Положение переходного процесса сравнивается с положением предыдущего выходного сегмента на этапе 511, чтобы определить, был ли обработан этот переходной процесс. При положительном результате проверки на этапе 513 положение набора кодов (окно L) и параметры К, L и D устанавливаются на этапе 515. После установки необходимых параметров, на основании результата обнаружения переходного процесса, происходит поиск новой синхронизации или точки сопряжения (этап 517). Эта процедура показана на фиг.6. Сначала на этапе 601 новая точка синхронизации вычисляется на основании предыдущей согласно соотношению5 and 6 are flow charts showing the operation cycle of the transpose device. Step 501 represents data entry; at step 503, a transient is detected on the input signal segment; transient search is performed on a segment length equal to the length of the output segment. If a transient is found in step 505, then in step 507 the position of the transient is recorded and the parameters L (representing the length of the set of codes), K (representing the distance between the state vectors in quanta) and D (representing the delay between the quanta in each state vector) are set to step 509. The position of the transient is compared with the position of the previous output segment in step 511 to determine if this transient has been processed. If the verification result is positive at step 513, the position of the set of codes (window L) and the parameters K, L and D are set at step 515. After setting the necessary parameters, based on the result of detecting the transient, a new synchronization or interface point is searched (step 517). This procedure is shown in Fig.6. First, in step 601, a new synchronization point is calculated based on the previous one according to the relation

Figure 00000010
Figure 00000010

где

Figure 00000011
и
Figure 00000012
- есть новое и старое положения синхронизации, соответственно, S - длина обрабатываемого входного сегмента и М - коэффициент транспозиции. Точка синхронизации используется для сравнения точности новой точки сопряжения с точностью старой точки сопряжения на этапе 603. Если на этапе 605 установлено, что соответствие такое же или лучше, чем предыдущее, то эта новая точка синхронизации выдается на этапе 607 при условии, что она находится внутри набора кодов. Если нет, то осуществляется поиск новой точки синхронизации в цикле 609. Это выполняется аналогичным образом, в данном случае с функцией минимальной разности (611), однако, возможно также использовать корреляцию во временной или в частотной области. Если на этапе 613 определено, что это положение дает лучшее соответствие, чем предыдущее найденное положение, то положение синхронизации запоминается на этапе 615. Когда все положения проверены (этап 617), система возвращается (619) к процедуре согласно блок-схеме на фиг.5. Новая полученная точка синхронизации запоминается на этапе 519, и новый сегмент считывается из набора кодов на этапе 521, начинающегося с данной точки синхронизации. Этот сегмент добавляется к окну и прибавляется к предыдущему на этапе 523, квантуется с коэффициентом транспозиции на этапе 525 и запоминается в выходном буфере на этапе 527.Where
Figure 00000011
and
Figure 00000012
- there is a new and old synchronization position, respectively, S is the length of the processed input segment and M is the transposition coefficient. The synchronization point is used to compare the accuracy of the new interface point with the accuracy of the old interface point at step 603. If at step 605 it is determined that the match is the same or better than the previous one, then this new synchronization point is issued at step 607, provided that it is inside set of codes. If not, then a new synchronization point is searched in cycle 609. This is done in a similar way, in this case with the minimum difference function (611), however, it is also possible to use correlation in the time or in the frequency domain. If it is determined in step 613 that this position gives a better match than the previous found position, then the synchronization position is stored in step 615. When all positions are checked (step 617), the system returns (619) to the procedure according to the flowchart in FIG. 5 . The newly acquired synchronization point is stored in step 519, and the new segment is read from the code set in step 521 starting from that synchronization point. This segment is added to the window and added to the previous one at step 523, quantized with the transposition coefficient at step 525, and stored in the output buffer at step 527.

Фиг.7 иллюстрирует режим работы системы в условиях переходного процесса, приминая во внимание положение набора кодов. Перед переходным процессом набор кодов 1, представляющих входной сегмент 1, установлен "слева" от сегмента 1. Сегмент корреляции 1 представляет часть предшествующего выходного результата и исполняется для нахождения точки синхронизации 1 в наборе кодов 1. Когда переходный процесс обнаружен и точка переходного процесса обработана, набор кодов перемещается согласно фиг.7 и остается стационарным, пока текущий обрабатываемый входной сегмент снова не станет "справа" в наборе кодов. Это делает невозможным дублирование переходного процесса, поскольку системе не позволено искать точки синхронизации до переходного процесса.7 illustrates the mode of operation of the system in a transient process, taking into account the position of the set of codes. Before the transient, the set of codes 1 representing the input segment 1 is set to the “left” of the segment 1. Correlation segment 1 represents part of the previous output and is executed to find the synchronization point 1 in the set of codes 1. When the transient is detected and the transition point is processed, the set of codes moves according to Fig. 7 and remains stationary until the current processed input segment again becomes “right” in the set of codes. This makes duplication of the transient impossible because the system is not allowed to look for synchronization points before the transient.

Большинство устройств транспозиции основного тона или устройств расширения по времени, основанных на прогнозе схемы поиска, дают удовлетворительные результаты для речи и однотонных сигналов. Однако их характеристики быстро ухудшаются для сигналов высокой сложности, таких как музыка, особенно при больших коэффициентах транспозиции. Настоящее изобретение предлагает несколько решений для улучшенных характеристик, дающих хорошие результаты для сигналов любого типа. В противоположность другим решениям эта система изменяется по времени и параметры системы основаны на свойствах входного сигнала и параметрах, используемых на предыдущем рабочем цикле. Использование детектора переходного процесса управляющего не только размером набора кодов и положением, но также и свойствами включенных векторов состояния, является надежным и эффективным с точки зрения вычислений способом, чтобы избежать ухудшения звука для быстро изменяющихся сегментов сигнала. Кроме того, не требуется изменение длины обрабатываемого сегмента сигнала, которое потребовало бы дополнительных вычислений. Настоящее изобретение использует усовершенствованный поиск набора кодов, основанный на результатах предшествующего поиска. Это означает, что в отличие от обычной корреляции двух сегментов, как делается обычно в системах обработки во временной области, основанных на прогнозе схемы поиска, сначала проверяются наиболее подходящие положения синхронизации вместо проверки всех положений последовательно. Этот новый способ для сокращения поиска набора кодов значительно снижает вычислительную сложность системы. Кроме того, при использовании нескольких устройств транспозиции информация о положении синхронизации может быть совместно использована этими устройствами транспозиции для дополнительного снижения вычислительной сложности, как показано в последующих применениях.Most pitch transposers or time-extension devices based on the prediction of the search pattern give satisfactory results for speech and solid signals. However, their characteristics quickly deteriorate for signals of high complexity, such as music, especially at high transposition coefficients. The present invention provides several solutions for enhanced performance giving good results for any type of signal. In contrast to other solutions, this system changes over time and the system parameters are based on the properties of the input signal and the parameters used on the previous work cycle. Using a transient detector that controls not only the size of the code set and position, but also the properties of the included state vectors is a reliable and computationally efficient way to avoid sound degradation for rapidly changing signal segments. In addition, it does not require a change in the length of the processed signal segment, which would require additional calculations. The present invention uses an advanced code set search based on the results of a previous search. This means that in contrast to the usual correlation of two segments, as is usually done in time-domain processing systems based on the prediction of the search scheme, the most suitable synchronization positions are checked first instead of checking all the positions in sequence. This new way to reduce the search for a set of codes significantly reduces the computational complexity of the system. In addition, when using multiple transposition devices, synchronization position information can be shared by these transposition devices to further reduce computational complexity, as shown in subsequent applications.

Устройства транспозиции во временной области, как объяснялось выше, используются для реализации систем ДСП-1 и ДСП-2 согласно следующему примеру, иллюстративному, но не ограничивающему. На фиг.8 использованы три модуля расширения по времени, чтобы генерировать гармоники второго, третьего и четвертого порядка. Поскольку в этом примере каждое расширение во временной области/устройство транспозиции работает с использованием широкополосного сигнала, выгодно регулировать огибающую спектра исходного диапазона частот до транспозиции, учитывая, что не будет средства для того, чтобы выполнить это после транспозиций без добавления отдельной системы эквалайзера. Регуляторы огибающей спектра 801, 803 и 805 каждый работает на нескольких каналах набора фильтров. Усиление каждого канала в регуляторах огибающей должно быть установлено так, чтобы сумма, 813, 815, 817 на выходе, после транспозиции, давала бы желаемую огибающую спектра. Устройства транспонирования 807, 809 и 811 взаимно соединены, чтобы совместно использовать информацию о положении данных синхронизации. Это основано на том факте, что при определенных условиях будет иметь место высокая корреляция между положениями синхронизации, найденными в наборе кодов во время корреляции в отдельных блоках транспозиции. Предложим, в качестве примера, без каких-либо ограничений объема этого изобретения, что устройство транспозиции гармоник четвертого порядка работает на основе временного интервала, равного половине интервала устройства транспозиции гармоник второго порядка, но с рабочим циклом в два раза большим. Предположим далее, что наборы кодов, используемые для этих двух устройств расширения, те же самые и что положения синхронизации этих двух устройств расширения во временной области обозначены как

Figure 00000013
и
Figure 00000014
соответственно. Это дает следующее соотношение:Transposition devices in the time domain, as explained above, are used to implement the DSP-1 and DSP-2 systems according to the following example, illustrative, but not limiting. In Fig. 8, three time expansion modules are used to generate second, third and fourth order harmonics. Since in this example, each time-domain extension / transposition device operates using a broadband signal, it is advantageous to adjust the spectrum envelope of the original frequency range before transposition, given that there will be no means to do this after transpositions without adding a separate equalizer system. Spectrum envelope controls 801, 803, and 805 each operate on multiple channels of a filter set. The gain of each channel in the envelope controls must be set so that the sum, 813, 815, 817 at the output, after transposition, gives the desired envelope of the spectrum. Transpose devices 807, 809, and 811 are mutually connected to share position information of synchronization data. This is based on the fact that under certain conditions there will be a high correlation between the synchronization positions found in the code set during correlation in individual transposition blocks. We will offer, as an example, without any limitation on the scope of this invention, that a fourth-order harmonic transposition device operates on the basis of a time interval equal to half the interval of a second-order harmonic transposition device, but with a duty cycle of two times greater. Suppose further that the code sets used for these two expansion devices are the same and that the synchronization positions of these two expansion devices in the time domain are denoted as
Figure 00000013
and
Figure 00000014
respectively. This gives the following relationship:

Figure 00000015
Figure 00000015

гдеWhere

Figure 00000016
Figure 00000016

a S - это длина входного сегмента, представленного набором кодов. Это действительно до тех пор, пока ни один из указателей положения синхронизации не достигнет конца набора кодов. При нормальной работе n возрастает на единицу для каждого временного кадра, обработанного устройством транспозиции гармоник второго порядка, и когда неизбежно будет достигнут конец набора кодов любым из указателей, счетчик n устанавливается на n=0, и

Figure 00000017
и
Figure 00000018
вычисляются индивидуально. Подобные результаты получаются для устройства транспозиции гармоник третьего порядка при присоединении к устройству транспозиции гармоник четвертого порядка.a S is the length of the input segment represented by a set of codes. This is valid until none of the synchronization position indicators reaches the end of the code set. During normal operation, n increases by one for each time frame processed by a second-order harmonic transposition device, and when the end of the set of codes by any of the pointers is inevitable, the counter n is set to n = 0, and
Figure 00000017
and
Figure 00000018
are calculated individually. Similar results are obtained for a third-order harmonics transposition device when fourth-order harmonics are connected to a transposition device.

Представленное выше использование нескольких взаимно соединенных устройств транспозиции во временной области, для создания гармоник высшего порядка, приводит к существенному уменьшению объема вычислений. Кроме того, предложенное использование устройств транспозиции во временной области в соединении с соответствующим набором фильтров предоставляет возможность регулировки огибающей создаваемого спектра при обеспечении простоты и низких вычислительных затрат устройств транспозиции во временной области, поскольку эти устройства, более или менее, могут быть выполнены с использованием арифметики с фиксированной точкой и исключительно операций сложения/вычитания.The above use of several mutually connected transposition devices in the time domain to create higher-order harmonics leads to a significant reduction in the amount of computation. In addition, the proposed use of transposition devices in the time domain in conjunction with an appropriate set of filters makes it possible to adjust the envelope of the created spectrum while ensuring simplicity and low computational costs of transposition devices in the time domain, since these devices can more or less be performed using arithmetic with fixed point and exclusively addition / subtraction operations.

Другие, иллюстративные, но не ограничивающие, примеры, соответствующие настоящему изобретению, таковы:Other illustrative, but not limiting, examples of the present invention are as follows:

- использование устройства транспозиции во временной области в каждом поддиапазоне в наборе фильтров поддиапазона, уменьшая, таким образом, сложность сигнала для каждого устройства транспозиции;- the use of a transposition device in the time domain in each subband in the set of subband filters, thereby reducing signal complexity for each transposition device;

- использование устройства транспозиции во временной области в соединении с устройством транспозиции в частотной области, позволяя, таким образом, системе использовать разные способы для транспозиции в зависимости от характеристик обрабатываемого входного сигнала;- the use of a transposition device in the time domain in conjunction with a transposition device in the frequency domain, thus allowing the system to use different methods for transposition, depending on the characteristics of the input signal being processed;

- использование устройства транспозиции во временной области в широкополосном речевом кодеке, работающем, например, на остаточном сигнале, полученном после линейной экстраполяции.- the use of a transposition device in the time domain in a broadband speech codec operating, for example, on a residual signal obtained after linear extrapolation.

Следует иметь в виду, что описанный выше в общих чертах способ может быть выгодно использован только для модификаций временного масштаба простым исключением преобразования скорости стробирования. Кроме того, понятно, что хотя этот описанный в общих чертах способ фокусируется на транспозиции основного тона в сторону более высокого основного тона, т.е. на расширении по времени, одни и те же принципы применяются при транспозиции в сторону более низкого основного тона, т.е. сжатии по времени, как очевидно для специалистов в данной области техники.It should be borne in mind that the method described above in general terms can be advantageously used only for time-scale modifications by the simple exception of the conversion of the gating speed. In addition, it is understood that although this general outline of the method focuses on transposing the pitch to a higher pitch, i.e. on time extension, the same principles apply when transposing toward a lower pitch, i.e. time compression, as is apparent to those skilled in the art.

Транспозиция на основе набора фильтровFilter Set Transposition

Ниже описаны различные новые способы транспозиции на основе набора фильтров. Сигнал, подлежащий транспозиции, делится на ряд полосовых сигналов или поддиапазонов. Сигналы субполос затем транспонируются, точно или приближенно, что реализуется путем соединения субполос анализа и синтеза, здесь в дальнейшем называемого "Склеиванием". Этот способ сначала демонстрируется с использованием КратноВременного Преобразования Фурье (КВПФ).Various new transposition methods based on a set of filters are described below. The signal to be transposed is divided into a series of band signals or subbands. Subband signals are then transposed, accurately or approximately, which is realized by combining the analysis and synthesis subbands, hereinafter referred to as “Gluing”. This method is first demonstrated using the Multiple Time Fourier Transform (FFT).

КВПФ для N точек дискретного по времени сигнала х(n) определяется равенствомFFT for N points of a time-discrete signal x (n) is determined by the equality

Figure 00000019
Figure 00000019

где k=0, 1,... , N-1 и ω k=2π k/N и h(n) есть окно. Если это окно удовлетворяет следующим условиям:where k = 0, 1, ..., N-1 and ω k = 2π k / N and h (n) is a window. If this window satisfies the following conditions:

Figure 00000020
Figure 00000020

существует обратное преобразование, и оно задается равенствомthere is an inverse transformation, and it is given by the equality

Figure 00000021
Figure 00000021

Прямое преобразование может быть интерпретировано как анализатор, см. фиг.9а, состоящий из набора N полосовых фильтров с импульсными выходными сигналами h(n)exp(jω kn) 901 с последующим набором из N умножителей с несущими exp(-jω kn) 903 со сдвигом полосовых сигналов в области вокруг 0 Гц, формируя N сигналов Хк(n) анализа. Это окно действует подобно фильтру нижних частот. Хк(n) имеют малую ширину полосы и дискретизируются с пониженной частотой (блок 905). Уравнение (12), таким образом, оценивается только при n=rR, где R - это коэффициент прореживания, а r - новая временная переменная. Хк(n) может быть восстановлено из Хк(rR) путем дискретизации с повышением частоты, смотри фиг.9b, т.е. вводом нулей (блок 907) после фильтрации фильтром нижних частот 909. Обратное преобразование может быть интерпретировано как синтезатор, состоящий из набора N умножителей 911 с несущими (1/N exp(jω кn), который сдвигает сигналы Хк(n) вверх на первоначальные частоты, за которым следуют расходы 913 (фиг.9с), которые добавляют составляющие Ук(n) из всех каналов. КВПФ и обратное КВПФ (ОКВПФ) могут быть переупорядочены, чтобы использовать дискретное преобразование Фурье (ДПФ) и обратное ДПФ (ОДПФ), что позволяет использовать алгоритм быстрого преобразования Фурье (БПФ) (см. "Implementation of the Phase Vocoder using the Fast Fourier Transform" M.R.Portnoff, IEEE ASSP, Vol.24, No.3, 1976).The direct conversion can be interpreted as an analyzer, see Fig. 9a, consisting of a set of N bandpass filters with pulse output signals h (n) exp (jω k n) 901 followed by a set of N multipliers with carriers exp (-jω k n) 903 with a shift of the band signals in the region around 0 Hz, forming N signals X to the (n) analysis. This window acts like a low pass filter. X k (n) have a small bandwidth and are sampled at a reduced frequency (block 905). Equation (12) is thus estimated only for n = rR, where R is the decimation coefficient and r is the new time variable. X k (n) can be recovered from X k (rR) by upsampling, see fig. 9b, i.e. by entering zeros (block 907) after filtering with a low-pass filter 909. The inverse transform can be interpreted as a synthesizer consisting of a set of N 911 multipliers with carriers (1 / N exp (jω to n), which shifts the signals X to (n) up by initial frequencies, followed by costs 913 (FIG. 9c), which add the Y components to (n) from all channels. The FFT and inverse FFT (FFT) can be reordered to use discrete Fourier transform (DFT) and inverse DFT (FFT) ), which allows you to use the fast conversion algorithm Fourier (FFT) (see "Implementation of the Phase Vocoder using the Fast Fourier Transform" MRPortnoff, IEEE ASSP, Vol.24, No.3, 1976).

Фиг.9с показывает соединение 915 для генерации вторых гармоник, М=2, при N=32. Для упрощения показаны только каналы от 0 до 16. Центральная частота полосы 16 равна частоте Найквиста, каналы от 17 до 31 соответствуют отрицательным частотам. Блоки, обозначенные Р 917, и блоки усиления 919 будут описаны позднее, а сейчас должны рассматриваться как сокращенные. Входной сигнал в этом примере ограничен по полосе, так что только каналы от 0 до 7 содержат сигналы. Каналы анализатора с 8 до 16, таким образом, пусты и не требуют отображения в синтезатор. Каналы анализатора от 0 до 7 соединены с каналами синтезатора от 0 до 7, соответствующими тракту задержки входного сигнала. Каналы анализа k, где 4≤ k≤ 7 соединены с каналами синтеза Mk, M=2, которые сдвигают эти сигналы в области частот с центральными частотами, двукратными относительно полосовых фильтров k. Таким образом, сигналы сдвигаются вверх к своим первоначальным диапазонам, а также транспонируются на одну октаву вверх. Чтобы исследовать генерацию гармоник в смысле реальных выходных откликов фильтров и модуляторов, должны также рассматриваться отрицательные частоты, смотри нижнюю ветвь на фиг.10а. Следовательно, комбинированный выходной результат обратного преобразования соответствует отображению k→ Mk 1001 и N-k→ N-Mk 1003, где 4≤ k≤ 7.Fig. 9c shows a connection 915 for generating second harmonics, M = 2, at N = 32. For simplicity, only channels from 0 to 16 are shown. The center frequency of band 16 is equal to the Nyquist frequency, channels 17 to 31 correspond to negative frequencies. The blocks indicated by P 917 and amplification blocks 919 will be described later, and now should be considered as abbreviated. The input signal in this example is limited in band, so only channels 0 through 7 contain signals. The analyzer channels 8 to 16 are therefore empty and do not require mapping to the synthesizer. The analyzer channels from 0 to 7 are connected to the synthesizer channels from 0 to 7, corresponding to the input signal delay path. The analysis channels k, where 4≤ k≤ 7 are connected to the synthesis channels Mk, M = 2, which shift these signals in the frequency domain with center frequencies doubled relative to the bandpass filters k. Thus, the signals are shifted up to their original ranges, and are also transposed one octave up. In order to investigate the generation of harmonics in the sense of the real output responses of filters and modulators, negative frequencies must also be considered, see the lower branch in figa. Therefore, the combined output of the inverse transform corresponds to the mapping k → Mk 1001 and N-k → N-Mk 1003, where 4≤ k≤ 7.

Это даетThis gives

Figure 00000022
Figure 00000022

где М=2. Уравнение (15) может быть интерпретировано как полосовая фильтрация входного сигнала с последующим линейным сдвигом частот или модуляцией Верхней Боковой Полосой, т.е. модуляцией с одной боковой полосой с использованием верхней боковой полосы (см. фиг.10b), где 1005 и 1007 образуют преобразователь Гильберта, 1009 и 1011 представляют собой умножители с косинусоидальными м синусоидальными несущими, а 1013 - каскад дифференцирования, которая выделяет верхнюю боковую полосу. Ясно, что такой способ многодиапазонной полосовой фильтрации одной боковой полосы может быть применен в явном виде, т.е. без связывания набора фильтров, во временной или в частотной области, что позволяет осуществить произвольную выборку индивидуальных полос пропускания и частот генераторов.where M = 2. Equation (15) can be interpreted as bandpass filtering of the input signal followed by a linear frequency shift or modulation of the Upper Sideband, i.e. modulation with one sideband using the upper sideband (see Fig. 10b), where 1005 and 1007 form a Hilbert transducer, 1009 and 1011 are multipliers with cosine and sinusoidal carriers, and 1013 is a differentiation cascade that selects the upper sideband. It is clear that this method of multi-band pass filtering of one side band can be applied explicitly, i.e. without linking a set of filters, in the time or in the frequency domain, which allows arbitrary sampling of individual passband and generator frequencies.

Согласно уравнению (15) синусоида с частотой ω i в полосе частот канала k анализа дает гармонику на частоте Mω k+(ω ik). Отсюда этот способ, называемый базовой многополосной транспозицией, генерирует только точные гармоники для входных сигналов с частотами ω ik, где 4≤ k≤ 7. Однако, если количество фильтров достаточно велико, отклонение от точной транспозиции незначительно (см. уравнение (4)). Кроме того, транспозиция выполняется точно для квазистационарных тональных сигналов произвольных частот, путем ввода блоков, обозначенных Р 917 (фиг.9с), при условии, что каждый канал анализа содержит не более одного частичного тона. В этом случае Хк(rR) являются комплексными экспонентами с частотами, равными разностям между частотами частичных тонов ω i и центральными частотами ω k фильтров анализа. Для получения точной транспозиции эти частоты должны быть увеличены на коэффициент М, модифицируя вышеприведенное отношение частот к виду ω i→ Mω k+M(ω ik)=Mω i. Частоты Хк(rR) равны производным по времени от их соответствующих развернутых фазовых углов и могут быть оценены с использованием разностей первого порядка последовательных фазовых углов. Оценки частот умножаются на М, и фазовые углы синтеза вычисляются с использованием этих новых частот. Однако такой же результат, за исключением фазовой постоянной, получается упрощенным способом, путем умножения аргументов анализа на М непосредственно, исключая потребность в оценке частоты. Это описано на фиг.11, представляющей блоки 917. Таким образом Хк(rR), где 4≤ k≤ 7 в этом примере, преобразуется из прямоугольных в полярные координаты, что показано блоками R→ P (блок 1101). Аргументы умножаются на М=2 (блок 1103), а амплитуды не изменяются. Сигналы затем преобразуются обратно в прямоугольные координаты (P→ R) в блоке 1105, формируя сигналы YMk(rR), и подаются к каналам синтезатора согласно фиг.9с. Этот усовершенствованный способ многополосной транспозиции, таким образом, имеет две ступени: связывание обеспечивает грубую транспозицию, как в базовом способе, а фазоумножители обеспечивают точные корректировки частоты. Вышеприведенные способы многополосной транспозиции отличаются от традиционной технологии сдвига основного тона с использованием КВПФ, где для синтеза используются генераторы на основе таблиц преобразования, или, когда используется ОКВПФ для синтеза сигнала, который растянут по времени и прорежен, т.е. связывание не используется.According to equation (15), a sinusoid with a frequency ω i in the frequency band of the analysis channel k gives a harmonic at a frequency Mω k + (ω ik ). Hence, this method, called basic multiband transposition, generates only exact harmonics for input signals with frequencies ω i = ω k , where 4≤ k≤ 7. However, if the number of filters is large enough, the deviation from the exact transposition is insignificant (see equation (4 )). In addition, the transposition is performed exactly for quasi-stationary tones of arbitrary frequencies by entering the blocks indicated by P 917 (Fig. 9c), provided that each analysis channel contains no more than one partial tone. In this case, X k (rR) are complex exponentials with frequencies equal to the differences between the frequencies of the partial tones ω i and the center frequencies ω k of the analysis filters. To obtain an accurate transposition, these frequencies must be increased by a factor M, modifying the above ratio of frequencies to the form ω i → Mω k + M (ω ik ) = Mω i . The frequencies X k (rR) are equal to the time derivatives of their respective unfolded phase angles and can be estimated using first-order differences of consecutive phase angles. Frequency estimates are multiplied by M, and the phase angles of synthesis are calculated using these new frequencies. However, the same result, with the exception of the phase constant, is obtained in a simplified way, by multiplying the analysis arguments by M directly, eliminating the need for frequency estimation. This is described in FIG. 11, representing blocks 917. Thus, X k (rR), where 4≤ k≤ 7 in this example, is converted from rectangular to polar coordinates, as shown by R → P blocks (block 1101). The arguments are multiplied by M = 2 (block 1103), and the amplitudes are not changed. The signals are then converted back to rectangular coordinates (P → R) in block 1105, generating signals Y Mk (rR), and fed to the synthesizer channels according to FIG. 9c. This improved method of multiband transposition, therefore, has two steps: binding provides coarse transposition, as in the basic method, and phase multipliers provide accurate frequency adjustments. The above methods of multiband transposition are different from traditional pitch shifting technology using FFTs, where generators are used for synthesis based on conversion tables, or when FFTs are used to synthesize a signal that is time-stretched and thinned, i.e. binding is not used.

Связывание гармоник по фиг.9с легко модифицируется для других коэффициентов транспозиции, отличных от 2. Фиг.12 иллюстрирует связывание 1203 для генерации гармоник 3-го порядка, где 1201 - каналы анализа, а 1205 - каналы синтеза. Различные порядки гармоник могут создаваться одновременно, как показано на фиг.13, где используются гармоники 2-го и 3-го порядков. Фиг.14 иллюстрирует неперекрывающуюся комбинацию гармоник 2-го, 3-го и 4-го порядков. Самый низкий возможный номер гармоники используется в качестве максимально возможной высокой частоты. Выше верхней границы назначенного диапазона гармоник M используется гармоника М+1. Фиг.15 иллюстрирует способ отображения всех каналов синтезатора (N=64, показаны каналы O-32). Все каналы верхних частот с номерами индексов, не относящимися к простым числам, отображаются согласно следующему соотношению между номерами исходных каналов и номерами каналов назначения: k=назн=Mkиcт, где М есть наименьшее целое число ≥ 2, которое удовлетворяет условию, что kист лежит в диапазоне нижних частот, а kназн - в диапазоне верхних частот. Следовательно, ни один канал синтезатора не принимает сигнал более чем от одного канала анализа. Каналы верхних частот с номерами в виде простых чисел могут отображаться в kист=1 или в каналы нижних частот kист>1, что дает хорошие приближения вышеприведенного отношения (только соединений с номерами не в виде простых чисел с М=2, 3, 4, 5 показаны на фиг.15).The harmonic binding of FIG. 9c is easily modified for other transposition coefficients other than 2. FIG. 12 illustrates the coupling of 1203 to generate 3rd order harmonics, where 1201 are the analysis channels and 1205 are the synthesis channels. Various orders of harmonics can be created simultaneously, as shown in FIG. 13, where 2nd and 3rd order harmonics are used. Fig. 14 illustrates a non-overlapping combination of 2nd, 3rd and 4th order harmonics. The lowest possible harmonic number is used as the highest possible frequency. Above the upper limit of the assigned harmonic range M, harmonic M + 1 is used. Fig. 15 illustrates a method for displaying all synthesizer channels (N = 64, O-32 channels shown). All high-frequency channels with non-prime index numbers are mapped according to the following relationship between source channel numbers and destination channel numbers: k = desig = Mk source , where M is the smallest integer ≥ 2, which satisfies the condition that k source lies in the low frequency range, and k desig - in the high frequency range. Therefore, no synthesizer channel receives a signal from more than one analysis channel. High-frequency channels with numbers in the form of prime numbers can be mapped to k source = 1 or to the low-frequency channels k source > 1, which gives good approximations of the above ratio (only connections with numbers not in the form of prime numbers with M = 2, 3, 4 5 are shown in FIG. 15).

Возможно также комбинировать амплитудную и фазовую информацию от различных каналов анализатора. Амплитудные сигналы [Хк(rR)] могут быть связаны согласно фиг.16, тогда как фазовые сигналы аrg{Хк(rR)} соединяются согласно правилу по фиг.16. Таким образом, нижние частоты будут еще транспортированы, посредством чего генерируется периодическое повторение огибающей исходной области, вместо расширенной огибающей, которая является результатом транспозиции согласно уравнению (2). Стробирование или другие средства могут использоваться, чтобы избежать усиления "пустых" исходных каналов. Фиг.17 иллюстрирует другое применение, генерацию субгармоник относительно отфильтрованных верхних частот или басово-ограниченного сигнала с использованием соединений от верхних к нижним субполос. При использовании вышеупомянутых транспозиций может быть выгодно применять регулируемое переключение связей, основанное на характеристиках сигнала.It is also possible to combine amplitude and phase information from various analyzer channels. The amplitude signals [X to (rR)] can be connected according to FIG. 16, while the phase signals arg {X to (rR)} are connected according to the rule of FIG. 16. Thus, the lower frequencies will still be transported, whereby a periodic repetition of the envelope of the original region is generated, instead of the expanded envelope, which is the result of transposition according to equation (2). Gating or other means may be used to avoid amplification of the "empty" source channels. 17 illustrates another application, the generation of subharmonics with respect to filtered high frequencies or a bass-limited signal using connections from the upper to lower subbands. When using the aforementioned transpositions, it may be advantageous to apply controlled link switching based on signal characteristics.

В вышеприведенном описании предполагается, что самая высокая частота, содержащаяся во входном сигнале, значительно ниже, чем частота Найквиста. Таким образом, возможно выполнить расширение полосы пропускания без увеличения частоты дискретизации. Это, однако, не всегда имеет место, вследствие чего может быть необходимо предварительно повысить частоту дискретизации. При использовании способов на основе набора фильтров для транспозиции возможно включить в процедуру обработки дискретизацию с повышенной частотой.In the above description, it is assumed that the highest frequency contained in the input signal is significantly lower than the Nyquist frequency. Thus, it is possible to perform bandwidth expansion without increasing the sampling frequency. This, however, is not always the case, as a result of which it may be necessary to first increase the sampling rate. When using methods based on a set of filters for transposition, it is possible to include sampling with increased frequency in the processing procedure.

Наиболее перцептуальные кодеки применяют наборы фильтров с максимальным прореживанием при отображении времени в частоту ["Introduction to Perceptual Coding" K.Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996]. Фиг.18а показывает основную структуру системы перцептуального кодирования. Набор фильтров анализа 1801 расщепляет входной сигнал на несколько сигналов субполос. Эти выборки субполос индивидуально квантуются (1803), используя уменьшенное количество бит, где число уровней квантования определяется из перцептуальной модели (1807), которая оценивает минимальный порог маскирования. Эти субполосы нормализуются, кодируются способами кодирования с необязательной избыточностью и объединяются с дополнительной информацией, состоящей из коэффициентов нормализации, информации о распределении битов и других специфических данных кодека (1805), чтобы сформировать последовательный поток битов. Этот поток битов затем запоминается или передается. В декодере (фиг.18b) кодированный поток битов демультиплексируется (1809), декодируется, и выборки субполос повторно квантируются до равного количества битов (1811). Набор фильтров синтеза объединяет выборки субполос, чтобы восстановить исходный сигнал (1813). Варианты реализации, использующие наборы фильтров с максимальным прореживанием значительно уменьшают вычислительные затраты. В последующем описании сделан упор на косинусоидально модулированных наборах фильтров. Следует, однако, иметь в виду, что настоящее изобретение может быть реализовано с использованием других типов наборов фильтров или преобразователей, включая интерпретации набора фильтров с преобразованием волны малой интенсивности, другие наборы фильтров или преобразователи с неравными полосами пропускания и многомерные наборы фильтров или преобразователей.Most perceptual codecs use filtering sets with maximum decimation when mapping time to frequency ["Introduction to Perceptual Coding" K. Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996]. Fig. 18a shows the basic structure of a perceptual coding system. The 1801 analysis filterbank splits the input signal into multiple subband signals. These subband samples are individually quantized (1803) using a reduced number of bits, where the number of quantization levels is determined from the perceptual model (1807), which estimates the minimum masking threshold. These subbands are normalized, encoded with optional redundancy coding methods, and combined with additional information consisting of normalization coefficients, bit allocation information, and other specific codec data (1805) to form a sequential bit stream. This bitstream is then stored or transmitted. At the decoder (FIG. 18b), the encoded bitstream is demultiplexed (1809), decoded, and subband samples are re-quantized to an equal number of bits (1811). A set of synthesis filters combines subband samples to restore the original signal (1813). Implementation options using filter sets with maximum decimation significantly reduce computational costs. In the following description, emphasis is placed on cosine modulated filter sets. However, it should be borne in mind that the present invention can be implemented using other types of filter sets or converters, including interpretations of a filter set with low-intensity waveform conversion, other filter sets or converters with unequal bandwidths, and multidimensional filter sets or converters.

В иллюстративном, но не ограничивающем описании, ниже предполагается, что L-канальный косинусоидально модулированный набор фильтров расщепляет входной сигнал х(n) на L субполос. Общая структура набора фильтров с максимальным прореживанием показана на фиг.19. Фильтры анализа обозначены Нк(z) 1901, где k=0, 1,... , L-1. Сигналы субполос ν к(n) максимально прореживаются (1903) каждой из частот дискретизации fs/L, где fs - частота дискретизации х(n). Блок синтеза воссоединяет обратно сигналы субполос после интерполяции (1905) и фильтрации (1907), для формирования х(n). Фильтры синтеза обозначены Fк(z). Кроме того, настоящее изобретение выполняет дублирование спектра на х(n), формируя в результате сигнал у(n).In an illustrative, but non-limiting description, it is assumed below that the L-channel cosine modulated filterbank splits the input signal x (n) into L subbands. The general structure of a filter set with maximum decimation is shown in FIG. Analysis filters are designated H to (z) 1901, where k = 0, 1, ..., L-1. The signals of the subbands ν to (n) are thinned out as much as possible (1903) by each of the sampling frequencies f s / L, where f s is the sampling frequency x (n). The synthesis unit reconnects the subband signals after interpolation (1905) and filtering (1907) to form x (n). Synthesis filters are designated F to (z). In addition, the present invention performs spectrum duplication on x (n), resulting in a signal y (n).

Синтезирование сигналов субполос с помощью QL-канального набора фильтров, где используются только L каналов нижних частот, а коэффициент расширения полосы Q выбран так, что QL - целое число, дает в результате выходной поток битов с частотой дискретизации Qfs. Следовательно, расширенный набор фильтров будет действовать так, как если бы он был L-канальным набором фильтров с последующим устройством дискретизации с повышенной частотой. Поскольку в этом случае L(Q-1) фильтров верхних частот не используются (на них подаются нули), ширина полосы аудиосигнала не изменится - набор фильтров просто воспроизведет версию х(n) с повышенной частотной дискретизации. Если, однако, сигналы субполос связываются с фильтрами верхних частот, то ширина полосы

Figure 00000023
возрастает на коэффициент Q, формируя у(n), это является версией набора фильтров с максимальным прореживанием многополосного устройства транспозиции согласно изобретению. Используя эту схему, процесс дискретизации с повышением частоты дискретизации интегрируется в процесс фильтрования процесса синтеза, как объяснялось ранее. Следует отметить, что может быть использован набор фильтров синтеза любого размера, что приводит к различным частотам дискретизации выходного сигнала, и, следовательно, к разным коэффициентам расширения полосы частот. Выполнение дублирования спектра на
Figure 00000024
согласно настоящему изобретению, соответствующему базовому многополосному способу транспозиции с целочисленным коэффициентом транспозиции М, выполняется связыванием сигналов поддиапазонов какSynthesizing the subband signals using a QL-channel filter set, where only L low-frequency channels are used, and the band expansion coefficient Q is chosen so that QL is an integer, resulting in an output bit stream with a sampling frequency of Qf s . Therefore, the expanded filter set will act as if it were an L-channel filter set followed by a higher frequency sampling device. Since in this case L (Q-1) high-pass filters are not used (zeros are fed to them), the audio signal bandwidth will not change - the set of filters will simply reproduce the version of x (n) with increased frequency sampling. If, however, subband signals are associated with high-pass filters, then the bandwidth
Figure 00000023
increases by a factor of Q, forming y (n), this is a version of a set of filters with maximum thinning multiband transposition device according to the invention. Using this scheme, the sampling process with increasing sampling frequency is integrated into the filtering process of the synthesis process, as explained earlier. It should be noted that a set of synthesis filters of any size can be used, which leads to different sampling frequencies of the output signal, and, therefore, to different expansion coefficients of the frequency band. Perform spectrum duplication on
Figure 00000024
according to the present invention, the corresponding basic multiband transposition method with an integer transposition coefficient M, is performed by coupling the signals of the subbands as

Figure 00000025
Figure 00000025

где k∈ [0,L-1] и выбрано так, что Mk∈ [L,QL-1], емk(n) - коррекция огибающей, а (-1)(м-1)kn - коэффициент коррекции для спектрально инвертированных субполос. Спектральная инверсия вытекает из прореживания сигналов субполос, и инвертированные сигналы могут быть повторно инвертированы изменением знака каждой второй выборки в этих каналах. Со ссылкой на фиг.20, рассмотрим 16-канальный набор фильтров синтеза, связанный (2009) для коэффициента транспозиции М=2, с Q=2. Блоки 2001 и 2003 обозначают фильтры анализа НK(z) и блоки прореживания по фиг.19 соответственно. Подобным образом, 2005 и 2007 являются интерполяторами и фильтрами синтеза Fk(z). Уравнение (16) затем упрощается соответственно связыванию сигналов четырех верхних частотных субполос полученных данных в каждую вторую группе из восьми самых верхних каналов в наборе фильтров синтеза. Благодаря спектральной инверсии, каждый второй соединенный сигнал поддиапазона должен быть частотно инвертирован до синтеза. Кроме того, амплитуды соединенных сигналов должны быть отрегулированы (2011) согласно правилам ДСП-1 или ДСП-2.where k∈ [0, L-1] and is chosen so that Mk∈ [L, QL-1], e mk (n) is the envelope correction, and (-1) (m-1) kn is the correction coefficient for spectrally inverted subbands. Spectral inversion results from decimation of subband signals, and inverted signals can be re-inverted by changing the sign of every second sample in these channels. With reference to FIG. 20, consider a 16-channel synthesis filterbank associated (2009) for the transposition coefficient M = 2, with Q = 2. Blocks 2001 and 2003 denote analysis filters H K (z) and decimation blocks of FIG. 19, respectively. Similarly, 2005 and 2007 are interpolators and synthesis filters F k (z). Equation (16) is then simplified according to the coupling of the signals of the four upper frequency subbands of the received data into each second group of the eight highest channels in the set of synthesis filters. Due to spectral inversion, every second connected subband signal must be frequency inverted before synthesis. In addition, the amplitudes of the connected signals must be adjusted (2011) according to the rules of chipboard-1 or chipboard-2.

При использовании базового многополосного способа транспозиции согласно настоящему изобретению генерируемые гармоники в общем не являются точно кратными основным частотам. Все частоты, кроме самых низких в каждой субполосе, отличаются в некоторой степени от точной транспозиции. Кроме того, дублированный спектр содержит нули, поскольку интервал результирующего диапазона покрывает более широкий диапазон частот, чем интервал исходного диапазона. Более того, свойства подавления паразитного сигнала косинусоидально модулированного набора фильтров исчезает, поскольку сигналы субполос разделены по частоте в выходном интервале. То есть сигналы соседних субполос не перекрываются в высокочастотной области. Однако, способы уменьшения паразитных сигналов, известные специалистам, в данной области техники, могут быть использованы для уменьшения этого типа помех. Преимущества этого способа транспозиции состоят в простоте реализации и очень низких вычислительных затратах.When using the basic multiband transposition method according to the present invention, the generated harmonics are generally not exactly multiples of the fundamental frequencies. All frequencies except the lowest in each subband differ to some extent from the exact transposition. In addition, the duplicated spectrum contains zeros, since the interval of the resulting range covers a wider range of frequencies than the interval of the original range. Moreover, the suppression properties of the spurious signal of the cosine modulated filter set disappears, since the subband signals are frequency-separated in the output interval. That is, the signals of adjacent subbands do not overlap in the high frequency region. However, methods for reducing spurious signals known to those skilled in the art can be used to reduce this type of interference. The advantages of this transposition method are its ease of implementation and very low computational cost.

Чтобы обеспечить высокую точность транспозиции синусоид, представлено решение на основе набора фильтров эффективного максимального прореживания усовершенствованного способа многополосной транспозиции. Система использует дополнительный модифицированный набор фильтров анализа, в то время как набор фильтров синтеза является косинусоидально-модулированным, как описано в работе "Multi-rate Systems and Filter Banks", P.P.Vaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0-13-605718-7. Этапы способа многополосной транспозиции согласно настоящему изобретению на основе наборов фильтров с максимальным прореживанием схематически показаны на фиг.21 и на блок-схеме фиг.22 и являются следующими:To ensure high accuracy of sinusoidal transposition, a solution is presented based on a set of filters for efficient maximum decimation of an improved method of multiband transposition. The system uses an additional modified set of analysis filters, while the synthesis filter set is cosine modulated, as described in Multi-rate Systems and Filter Banks, PPVaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0 -13-605718-7. The steps of the multi-band transposition method according to the present invention based on filter sets with maximum decimation are shown schematically in FIG. 21 and in a flow chart of FIG. 22 and are as follows:

1. L принятых сигналов субполос синтезируются с помощью QL-канального набора фильтров 2101, 2201, 2203, где в L(Q-1) верхних каналов подаются нули, чтобы сформировать сигнал х(n), который таким образом избыточно дискретизируется с коэффициентом расширения ширины полосы Q.1. L received subband signals are synthesized using a QL channel filter bank 2101, 2201, 2203, where zeros are applied to the L (Q-1) of the upper channels to form an x (n) signal, which is thus oversampled with a spreading factor of width stripes Q.

2. x1(n) подвергается дискретизации с пониженной частотой с коэффициентом Q, чтобы сформировать сигнал x2(n’) 2103, 2205, т.е. x2(n’)=x1(Qn’).2. x 1 (n) is sampled at a reduced frequency with a factor of Q to form a signal x 2 (n ') 2103, 2205, i.e. x 2 (n ') = x 1 (Qn').

3. Выбирается целочисленная величина К как размер набора фильтров синтеза, ограниченная таким образом, что T=KM/Q - целое число, где Т - размер модифицированного набора фильтров анализа, а М - коэффициент транспозиции 2207, 2209, 2211. К предпочтительно должна быть выбрана большой для стационарных (тональных) сигналов и меньшей для динамических (переходных) сигналов.3. An integer value K is selected as the size of the synthesis filter set, so limited that T = KM / Q is an integer, where T is the size of the modified analysis filter set, and M is the transposition coefficient 2207, 2209, 2211. K should preferably be selected large for stationary (tonal) signals and smaller for dynamic (transient) signals.

4. x(n’) фильтруется посредством фильтров Т-канального модифицированного набора фильтров анализа 2107, 2213, где Т фильтров анализа экспоненциально модулированы, формируя набор комплексных сигналов субполос. Эти сигналы субполос дискретизуруются с пониженной частотой с коэффициентом Т/М, давая сигналы субполос ν k(M)(n’’), k=0, 1,... Т-1. Отсюда, набор фильтров будет избыточно дискретизирован с коэффициентом М.4. x (n ') is filtered by T-channel filters of the modified analysis filter set 2107, 2213, where T analysis filters are exponentially modulated to form a set of complex subband signals. These subband signals are sampled at a reduced frequency with a T / M coefficient, giving subband signals ν k (M) (n ''), k = 0, 1, ... T-1. From here, the filter set will be excessively sampled with coefficient M.

5. Сигналы ν k(M)(n’’) преобразуются в полярное представление (амплитуда и фазовый угол). Фазовые углы умножаются на коэффициент М, и эти сигналы преобразуются обратно в представление в прямоугольных координатах согласно схеме фиг.11. Берутся действительные составляющие комплексных сигналов, в результате чего получаются сигналы sk(M)(n’’) 2109, 2215. После этой операции сигналы sk(M)(n’’) критически дискретизируются.5. The signals ν k (M) (n ″) are converted to the polar representation (amplitude and phase angle). The phase angles are multiplied by the coefficient M, and these signals are converted back into a representation in rectangular coordinates according to the scheme of Fig.11. The real components of the complex signals are taken, as a result of which the signals s k (M) (n ″) 2109, 2215 are obtained. After this operation, the signals s k (M) (n ″) are critically sampled.

6. Коэффициенты усиления сигналов sk(M)(n’’) регулируются согласно правил ДСП-1 или ДСП-2 (2111, 2217).6. Signal amplification factors s k (M) (n ") are regulated according to the rules of chipboard-1 or chipboard-2 (2111, 2217).

7. Сигналы субполос sк(M)(n’’), где k∈ [T/M, min (К, Т)-1], синтезируются с помощью обычного косинусоидально-модулированного К-канального набора фильтров, где на каналы от 0 до Т/М-1 подаются нули. В результате формируется сигнал х3(M)(n).7. The signals of the subbands s to (M) (n ''), where k∈ [T / M, min (К, Т) -1], are synthesized using a conventional cosine-modulated K-channel filter set, where the channels from 0 to T / M-1 zeros are given. As a result, a signal x 3 (M) (n) is generated.

8. x3(M)(n) окончательно добавляется к x1(n), чтобы дать у(n) 2223, который является желаемым сигналом дублированного спектра.8. x 3 (M) (n) is finally added to x 1 (n) to give y (n) 2223, which is the desired signal of the duplicated spectrum.

Этапы с 3 по 6 могут быть повторены для различных значений коэффициента транспозиции М, добавляя таким образом множество гармоник к x1(n). Этот режим работы иллюстрируется пунктирными линиями на фиг.21 и фиг.22, повторением цикла, включающего блоки 2211-2219. В этом случае, К выбирается так, чтобы сделать Т целочисленным для всех значений выбранных М - для целочисленных M:s; предпочтительно К выбирается так, чтобы K/Q было положительным целым числом. Все сигналы субполос sk(Mi)(m’’), где i=1, 2,... , m, a m есть число коэффициентов транспозиции, суммируются согласно равенствуSteps 3 through 6 can be repeated for different values of the transposition coefficient M, thus adding a lot of harmonics to x 1 (n). This mode of operation is illustrated by dashed lines in FIG. 21 and FIG. 22, repeating a cycle including blocks 2211-2219. In this case, K is chosen to make T integer for all values of the selected M - for integer M: s; preferably, K is selected so that K / Q is a positive integer. All signals of the subbands s k (Mi) (m ''), where i = 1, 2, ..., m, am are the number of transposition coefficients, are summed according to the equality

Figure 00000026
Figure 00000026

для всех используемых k. В первой итерации цикла по фиг.22 сигналы sк(n’’) могут рассматриваться только как нулевые сигналы поддиапазонов, где k=0, 1,... , К-1. В каждом цикле новые сигналы добавляются (2219) к sк(n’’) следующим образом:for all used k. In the first iteration of the loop of FIG. 22, the signals s to (n '') can only be considered as zero signals of the subbands, where k = 0, 1, ..., K-1. In each cycle, new signals are added (2219) to s to (n '') as follows:

Figure 00000027
Figure 00000027

где k=K/Q, K/Q+1,... , min(K,Ti)-1. Сигналы поддиапазонов sk(n’’) синтезируются однократно с помощью К-канального набора фильтров согласно этапу (7).where k = K / Q, K / Q + 1, ..., min (K, T i ) -1. The subband signals s k (n ″) are synthesized once using the K-channel filter set according to step (7).

Модифицированный набор фильтров анализа для этапа (4) получается согласно теории косинусоидально-модулированных наборов фильтров, где модулированное преобразование с перекрытием (cм. "Lapped Transforms for Efficient Transform/Subband Coding" H.S.Malvar, IEEE Trans ASSP, vol.38, no.6, 1990) является частным случаем. Импульсные отклики hk(n) фильтров в Т-канальном косинусоидально-модулированном наборе фильтров могут быть записаны в видеThe modified analysis filter set for step (4) is obtained according to the theory of cosine modulated filter sets, where the modulated transform with overlap (see "Lapped Transforms for Efficient Transform / Subband Coding" HSMalvar, IEEE Trans ASSP, vol. 38, no.6, 1990) is a special case. The impulse responses of h k (n) filters in a T-channel cosine modulated filter set can be written as

Figure 00000028
Figure 00000028

где k=0, 1,... ,T-1, N - длина прототипа фильтра нижних частот рo(n), С - константа, а Фк - фазовый угол, который обеспечивает исключение помех между соседними каналами. Ограничения на Фк следующие:where k = 0, 1, ..., T-1, N is the prototype length of the low-pass filter p o (n), C is a constant, and Ф к is the phase angle, which ensures the exclusion of interference between adjacent channels. The restrictions on f to the following:

Figure 00000029
Figure 00000029

которые могут быть упрощены до выражения в замкнутой формеwhich can be simplified to express in closed form

Figure 00000030
Figure 00000030

При таком выборе Фк с использованием набора фильтров синтеза могут быть получены системы точной реконструкции или системы приближенной реконструкции (системы псевдоQMF) с импульсными откликами в видеWith such a choice of Ф к using a set of synthesis filters, systems of exact reconstruction or systems of approximate reconstruction (pseudoQMF system) with impulse responses in the form

Figure 00000031
Figure 00000031

Рассмотрим фильтрыConsider filters

Figure 00000032
Figure 00000032

где hк’ (n) - синусоидально-модулированная версия фильтра рo(n). Фильтры Hk’ (z) Hk(z) имеют идентичные поддержки полосы пропускания, но отличающиеся фазовые отклики. Полосы пропускания фильтров в действительности являются преобразованиями Гильберта друг друга (это не действительно для частот близких к w=0 и w=π ). Объединение уравнений (19) и (23) согласноwhere h k '(n) is a sinusoidally modulated version of the filter p o (n). Filters H k '(z) H k (z) have identical bandwidth supports, but differing phase responses. The filter passbands are actually Hilbert transforms of each other (this is not true for frequencies close to w = 0 and w = π). Combining equations (19) and (23) according to

Figure 00000033
Figure 00000033

дает фильтры, которые имеют ту же форму амплитудных откликов как Нк(z) для положительных частот, но являются нулями для отрицательных частот, использование набора фильтров с импульсными откликами как в уравнении (24) дает набор сигналов субполос, которые могут быть интерпретированы как сигналы анализа (комплексные), соответствующие сигналам субполос, полученным из набора фильтров с импульсными откликами, как в уравнении (19). Сигналы анализа пригодны для манипуляции, поскольку выборки в виде комплесных значений могут быть записаны в полярной форме, т.е.gives filters that have the same shape of amplitude responses as H to (z) for positive frequencies, but are zeros for negative frequencies, using a set of filters with impulse responses as in equation (24) gives a set of subband signals that can be interpreted as signals analysis (complex) corresponding to subband signals obtained from a set of filters with impulse responses, as in equation (19). Analysis signals are suitable for manipulation, since samples in the form of complex values can be recorded in polar form, i.e.

z(n)=r(n)+ji(n)=|z(n)|exp{j arg(z(n))}.z (n) = r (n) + ji (n) = | z (n) | exp {j arg (z (n))}.

Однако при использовании набора комплексных фильтров для транспозиции ограничения для Фк должны быть обобщены, чтобы поддержать свойство исключения помех. Новое ограничение для Фк для обеспечения исключения помех совместно с набором фильтров синтеза с импульсными откликами как в уравнении (22) имеет вид:However, when using a set of complex filters for transposition, the constraints for Φ k must be generalized in order to maintain the property of eliminating interference. A new restriction for Ф к to ensure the elimination of interference together with a set of synthesis filters with impulse responses as in equation (22) has the form:

Figure 00000034
Figure 00000034

что упрощается до уравнения (21), когда М=1. При таком выборе транспонированные частичные тона будут иметь те же относительные фазы, какие они имели бы при М=1 (нет транспозиции).which simplifies to equation (21) when M = 1. With this choice, the transposed partial tones will have the same relative phases as they would have at M = 1 (no transposition).

Объединение равенства 24 и равенства 25 даетThe combination of equality 24 and equality 25 gives

Figure 00000035
Figure 00000035

что является фильтрами, используемыми в модифицированном наборе фильтров для этапа (4) согласно настоящему изобретению.what are the filters used in the modified filter set for step (4) according to the present invention.

Ниже приведены некоторые пояснения касательно этапа (5). Дискретизация с пониженной частотой комплексных сигналов субполос приводит к избыточной дискретизацией на М, что является существенным критерием, когда впоследствии фазовые углы умножаются на коэффициент транспозиции М. Избыточная дискретизация приводит к тому, что количество выборок субполос на ширину полосы после транспонирования в диапазон назначения, становиться равным количеству выборок субполос исходного диапазона. Индивидуальные полосы пропускания транспонированных сигналов субполос в М раз больше, чем полосы пропускания исходного диапазона, вследствие действия фазоумножителя. Это приводит к тому, что сигналы субполос становятся критически дискретизированными после этапа (5), и кроме того, в спектре не будет нулей при транспозиции тональных сигналов.Below are some explanations regarding step (5). Discretization with a reduced frequency of complex subband signals leads to oversampling by M, which is an essential criterion when subsequently the phase angles are multiplied by the transposition coefficient M. Oversampling results in the number of subband samples per bandwidth after being transposed to the destination range becomes the number of subband samples of the original range. The individual passband of the transposed subband signals is M times greater than the passband of the original range due to the action of the phase multiplier. This leads to the fact that the signals of the subbands become critically sampled after step (5), and in addition, there will be no zeros in the spectrum during the transposition of tonal signals.

Чтобы избежать тригонометрических вычислений, т.е. при необходимости вычисления новых сигналов субполос какTo avoid trigonometric calculations, i.e. if necessary, calculate new subband signals as

Figure 00000036
Figure 00000036

где |ν K(M)(n’’)| абсолютная величина ν K(M)(n’’), используется следующее тригонометрическое соотношение:where | ν K (M) (n``) | absolute value ν K (M) (n``), the following trigonometric relation is used:

Figure 00000037
Figure 00000037

При условииOn condition

Figure 00000038
Figure 00000038

Figure 00000039
Figure 00000039

иand

Figure 00000040
Figure 00000040

вычисления для этапа (5) можно выполнить без тригонометрических вычислений, уменьшив сложность вычислений.the calculations for step (5) can be performed without trigonometric calculations, reducing the complexity of the calculations.

При использовании транспозиции с четным М могут возникнуть проблемы для фазо-умножителя, в зависимости от характеристик фильтра нижних частот po(n). Все применимые фильтры имеют нули на единичной окружности в плоскости Z. Нуль на единичной окружности создает сдвиг на 180 градусов в фазовом отклике фильтра. Для четных М фазоумножитель переводит эти сдвиги в сдвиги на 360 градусов, т.е. сдвиги по фазе исчезают. Частичные тоны, расположенные таким образом по частоте, что такие фазовые сдвиги исчезают, приведут к помехе в синтезируемом сигнале. Наихудший случай в этой ситуации имеет место тогда, когда частичный тон соответствует точке по частоте, соответствующей вершине первого бокового лепестка характеристики фильтра анализа. В зависимости от ослабления этого лепестка в амплитудном отклике эти помехи будут более или менее слышимыми. Как пример, первый боковой лепесток фильтра, используемого для уровня 1 и 2 стандартом ISO/MPEG, ослабляется на 96 дБ, в то время как ослабление первого бокового лепестка для синусоидального окна, используемого в схеме MDCT уровня 3 стандарта ISO/MPEG только 23 дБ. Ясно, что помеха этого типа, при использовании синусоидального окна, будет прослушиваться. Ниже представлено решение этой проблемы, определяемое как относительная фазовая синхронизация.When using transposition with even M, problems may arise for the phase multiplier, depending on the characteristics of the low-pass filter p o (n). All applicable filters have zeros on the unit circle in the Z plane. Zero on the unit circle creates a 180 degree shift in the phase response of the filter. For even M, the phase multiplier translates these shifts into 360-degree shifts, i.e. phase shifts disappear. Partial tones so arranged in frequency that such phase shifts disappear will lead to interference in the synthesized signal. The worst case in this situation occurs when the partial tone corresponds to a point in frequency corresponding to the top of the first side lobe of the analysis filter characteristic. Depending on the attenuation of this lobe in the amplitude response, these interferences will be more or less audible. As an example, the first side lobe of the filter used for levels 1 and 2 of the ISO / MPEG standard is attenuated by 96 dB, while the attenuation of the first side lobe of the sine window used in the ISO / MPEG level 3 MDCT scheme is only 23 dB. It is clear that this type of interference, when using a sinusoidal window, will be tapped. The following is a solution to this problem, defined as relative phase synchronization.

Фильтры haк(n) имеют линейные фазовые отклики. Фазовые углы Фк вводят относительные фазовые разности между соседними каналами, а нули на единичной окружности вводят сдвиг по фазе в 180 градусов в позициях по частоте, которые могут отличаться для различных каналов. Путем контроля разности фаз между сигналами соседних субполос, перед запуском фазоумножителя, легко выделить каналы, которые содержат информацию с инвертированной фазой. Для тональных сигналов разность фазы равна примерно π /2М согласно уравнению (25) для неинвертированных сигналов и, соответственно, равна примерно π (1-1/2М) для сигналов, если какой-либо из сигналов инвертирован. Выделение инвертированных сигналов может быть выполнено вычислением скалярного произведения сигналов в соседних субполосах в видеFilters h a to (n) have linear phase responses. Phase angles Φ k introduce the relative phase differences between adjacent channels, and zeros on the unit circle introduce a phase shift of 180 degrees in frequency positions that may differ for different channels. By controlling the phase difference between the signals of adjacent subbands, before starting the phase multiplier, it is easy to isolate channels that contain information with inverted phase. For tonal signals, the phase difference is approximately π / 2M according to equation (25) for non-inverted signals and, accordingly, is approximately π (1-1 / 2M) for signals if any of the signals is inverted. The selection of inverted signals can be performed by calculating the scalar product of the signals in adjacent subbands in the form

Figure 00000041
Figure 00000041

Если произведение в уравнении (32) отрицательно, разность фаз больше 90 градусов, и присутствует условие фазовой инверсии. Фазовые углы комплексных сигналов субполос умножаются на М согласно схеме для этапа (5) и, наконец, сигналы, помеченные как инверсные, вычитаются. Способ относительной фазовой синхронизации, таким образом, заставляет сдвинутые на 180 градусов сигналы субполос сохранять этот сдвиг после умножения фазы и тем самым поддерживать свойство подавления помех.If the product in equation (32) is negative, the phase difference is greater than 90 degrees, and the condition of phase inversion is present. The phase angles of the complex signals of the subbands are multiplied by M according to the scheme for step (5) and, finally, the signals marked as inverse are subtracted. The method of relative phase synchronization, thus, causes the subband signals shifted by 180 degrees to maintain this shift after phase multiplication and thereby maintain the property of suppressing interference.

Регулировка огибающей спектра.Spectrum envelope adjustment.

Большинство звуков, таких как речь и музыка, характеризуются произведениями медленно изменяющихся огибающих и быстро изменяющихся несущих частот с постоянной амплитудой, как описано в работе "The Application of Generalized Linearity to Automatic Gain Control" T.G.Stockham, Jr, IEEE Tans on Audio and Electroacoustics, Vol.AU-16, No.2, June 1968 и в уравнении (1).Most sounds, such as speech and music, are characterized by products of slowly varying envelopes and rapidly changing carrier frequencies with constant amplitude, as described in "The Application of Generalized Linearity to Automatic Gain Control" by TGStockham, Jr, IEEE Tans on Audio and Electroacoustics, Vol.AU-16, No.2, June 1968 and in equation (1).

В перцептуальных аудиокодерах с расщепленной полосой аудиосигнал сегментирован на блоки и расщеплен на множество частотных полос с использованием фильтров субполос или преобразования из временной области частотную область. В большинстве типов кодеков сигнал последовательно разделяется на две главных сигнальных составляющих для передачи или запоминания, представления огибающей спектра и нормированных выборок субполос или коэффициентов. В последующем описании термин "выборки субполос" или "коэффициенты" относится к значениям выборок, полученным из фильтров субполос, а также к коэффициентам, полученным для преобразования из временной области в частотную область. Термин "огибающая спектра" или "коэффициенты масштабирования" представляют собой величины для субполос на основе временного кадра, такие как средняя или максимальная амплитуда в каждой субполосе, используемые для нормировки выборок субполос. Однако огибающая спектра может быть также получена с использованием линейного прогнозирования (патент США 5684920). В типовом кодеке нормированные выборки субполос требуют кодирования при высокой скорости передачи (используя примерно 90% доступной скорости передачи) по сравнению с огибающими, медленно изменяющимися во времени, и, тем самым, огибающими спектра, которые могут кодироваться при значительно меньших скоростях (используя примерно 10% доступной скорости передачи).In split-band perceptual audio encoders, the audio signal is segmented into blocks and split into a plurality of frequency bands using subband filters or time-domain transform frequency domain. In most types of codecs, the signal is sequentially divided into two main signal components for transmission or storage, presentation of the envelope of the spectrum and normalized samples of subbands or coefficients. In the following description, the term “subband samples” or “coefficients” refers to sample values obtained from subband filters, as well as coefficients obtained for conversion from the time domain to the frequency domain. The term “spectral envelope” or “scaling factors” are values for subbands based on a time frame, such as the average or maximum amplitude in each subband, used to normalize samples of subbands. However, the spectral envelope can also be obtained using linear prediction (US patent 5684920). In a typical codec, normalized subband samples require coding at high bit rates (using about 90% of the available bit rate) compared to envelopes that slowly change over time, and thus spectrum envelopes that can be encoded at much lower speeds (using about 10 % available baud rate).

Точная огибающая спектра дублированной ширины полосы важна, если должны быть сохранены качества тембра исходного сигнала. Воспринимаемый тембр музыкального инструмента или голоса определяется, главным образом, спектральным распределением ниже частоты flim (граничной), расположенной в самых высоких октавах слышимого диапазона. Части спектра выше flim, таким образом, имеют меньшее значение и, соответственно, тонкие структуры верхней полосы, полученные вышеописанными способами транспозиции, не требуют регулировки, в то время как грубые структуры, в общем случае требуют. Для обеспечения такой регулировки полезно отфильтровать спектральное представление сигнала, чтобы отделить грубую структуру огибающей от тонкой структуры.The exact spectral envelope of the duplicated bandwidth is important if the quality of the timbre of the original signal must be preserved. The perceived timbre of a musical instrument or voice is determined mainly by the spectral distribution below the frequency f lim (boundary), located in the highest octaves of the audible range. Parts of the spectrum above f lim are thus less important and, accordingly, the fine structures of the upper band obtained by the above transposition methods do not require adjustment, while the coarse structures generally require. To provide such adjustment, it is useful to filter out the spectral representation of the signal to separate the coarse envelope structure from the fine structure.

В варианте с использованием ДСП-1 согласно настоящему изобретению грубая огибающая спектра верхней полосы оценивается по информации нижней полосы, имеющейся в декодере. Эта оценка выполняется непрерывным контролем огибающей нижней полосы и регулировкой огибающей спектра верхней полосы в соответствии со специальными правилами. Новый способ осуществления вычисления огибающей использует асимптоты в логарифмической частотно-амплитудной области, что эквивалентно аппроксимации кривой с помощью полиномов переменного порядка в линейной области. Вычисляется уровень и наклон верхней части спектра нижней полосы, и оценки используются для определения уровня и наклона одного или нескольких сегментов, представляющих новую огибающую верхней полосы. Точки пересечения ассимптот фиксируются по частоте и действуют как опорные точки. Однако не всегда необходимо, хотя и выгодно, устанавливать ограничения, чтобы сохранять отклонения огибающей верхней полосы в реальных границах. Альтернативным подходом к оценке огибающей спектра является использование векторного квантований, VQ, большего количества характерных огибающих спектра и запоминания их в таблице преобразования или наборе кодов. Векторное квантование выполняется путем обучения желаемого количества векторов на большом объеме данных обучения в данном случае огибающих спектра аудиосигнала. Обучение обычно выполняется с помощью Обобщенного алгоритма Ллойда (см. работу "Vector Quantization and Signal Compression" A.Gersho, R.M.Gray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0) и дает векторы, которые оптимально схватывают содержимое данных обучения. Рассматривая набор кодов VQ, состоящих из А огибающих спектров, обученный на В огибающих (В>>А), затем А огибающих представляют А наиболее вероятных переходов от огибающей нижней полосы к огибающей верхней полосы на основании В наблюдений широкого разнообразия звуковых сигналов. Это, теоретически, представляет собой А правил для прогнозирования огибающей на основании В наблюдений. При оценке новой огибающей спектра верхней полосы исходная огибающая нижней полосы используется для поиска набора кодов, и часть верхней полосы наиболее точно совпадающей записи набора кодов используется для создания нового спектра верхней полосы.In the embodiment using DSP-1 according to the present invention, the coarse spectral envelope of the upper band is estimated from the information of the lower band available in the decoder. This assessment is performed by continuously monitoring the envelope of the lower band and adjusting the spectral envelope of the upper band in accordance with special rules. A new way of calculating the envelope uses asymptotes in the logarithmic frequency-amplitude region, which is equivalent to approximating the curve using variable-order polynomials in the linear region. The level and slope of the upper part of the spectrum of the lower band is calculated, and estimates are used to determine the level and slope of one or more segments representing the new envelope of the upper band. The intersection points of the asymptotes are fixed in frequency and act as reference points. However, it is not always necessary, although beneficial, to establish restrictions in order to keep the deviations of the envelope of the upper band at real boundaries. An alternative approach to estimating the spectral envelope is to use vector quantization, VQ, more characteristic spectral envelopes and store them in a conversion table or a set of codes. Vector quantization is performed by training the desired number of vectors on a large amount of training data in this case, the envelopes of the spectrum of the audio signal. Learning is usually done using the Generalized Lloyd Algorithm (see "Vector Quantization and Signal Compression" by A. Gersho, RMGray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0) and provides vectors that optimally capture content training data. Considering a set of VQ codes consisting of A envelopes of spectra, trained on B envelopes (B >> A), then A envelopes represent A of the most probable transitions from the envelope of the lower band to the envelope of the upper band based on B observations of a wide variety of sound signals. This, in theory, represents A rules for predicting an envelope based on B observations. When evaluating the new envelope of the upper band spectrum, the original envelope of the lower band is used to search for a set of codes, and part of the upper band of the most exactly matching code set record is used to create a new spectrum of the upper band.

На фиг.23 нормирование выборки субполос обозначено позицией 2301, а огибающие спектров представлены коэффициентами масштабирования 2305. Для целей иллюстрации, передача к декодеру 2303 показана в параллельной форме. В способе ДСП-2 (фиг.24) информация огибающей спектра генерируется и передается согласно фиг.23, при этом передаются только выборки субполос нижней полосы. Передаваемые коэффициенты масштабирования, таким образом, охватывают полный диапазон частот, в то время как выборки субполос охватывают только ограниченный диапазон частот, исключающий верхнюю полосу. В декодере выборки субполос 2401 нижней полосы транспонируются (2403) и комбинируются с принятой информацией огибающей спектра 2405 верхней полосы. Таким образом, синтезированная огибающая спектра верхней полосы идентична исходной огибающей, поддерживая в то же время значительное уменьшение скорости передачи данных.23, the normalization of the subband sample is indicated by 2301, and the spectral envelopes are represented by scaling factors 2305. For purposes of illustration, the transmission to decoder 2303 is shown in parallel form. In the DSP-2 method (FIG. 24), spectrum envelope information is generated and transmitted according to FIG. 23, and only samples of subbands of the lower band are transmitted. The transmitted scaling factors thus cover the full frequency range, while subband samples cover only a limited frequency range excluding the upper band. At the decoder, the samples of the lowband subbands 2401 are transposed (2403) and combined with the received envelope information of the highband spectrum 2405. Thus, the synthesized envelope of the upper band spectrum is identical to the original envelope, while supporting a significant decrease in the data rate.

В некоторых кодеках возможно передавать масштабные коэффициенты для полной огибающей спектра, опуская в то же время выборки субполос верхней полосы, как показано на фиг.24. Другие стандарты кодеков устанавливают, что масштабные коэффициенты и выборки субполос должны перекрывать одинаковый диапазон частот, т.е. масштабные коэффициенты не могут быть переданы, если выборки субполос опущены. В таких случаях имеется несколько решений: информация об огибающей спектра верхней полосы может быть передана в отдельных кадрах, причем эти кадры имеют свои заголовки и дополнительную защиту от ошибок, за которыми следуют данные.In some codecs, it is possible to transmit scale factors for the full spectral envelope, while omitting the samples of the upper band subbands, as shown in FIG. Other codec standards establish that scale factors and subband samples should cover the same frequency range, i.e. scale factors cannot be transmitted if subband samples are omitted. In such cases, there are several solutions: information about the spectrum envelope of the upper band can be transmitted in separate frames, and these frames have their own headers and additional protection against errors, followed by data.

Обычные декодеры, не использующие преимущества настоящего изобретения, не распознают эти заголовки и поэтому отбросят эти дополнительные кадры. Согласно второму решению информация об огибающей спектра верхней полосы передается как дополнительные данные в кодированном потоке битов. Однако доступное поле дополнительных данных должно быть достаточно большим, чтобы вместить информацию огибающей. В случаях, когда ни одно из двух первых решений не применимо, может быть использовано третье решение, согласно которому информация огибающей спектра верхней полосы скрыта в виде выборок субполос. Масштабные коэффициенты выбора субполос перекрывают большой динамический диапазон, обычно превышающий 100 дБ. Таким образом, возможно установить произвольное количество масштабных коэффициентов выборок субполос (2505 на фиг.25) на очень малые значения и передавать масштабные коэффициенты верхней полосы "замаскированными" в виде выборок субполос 2501. Этот способ передачи масштабных коэффициентов верхней полосы в декодер 2503 обеспечивает совместимость с синтаксом потока битов. Следовательно, в этом режиме могут передаваться произвольные данные. Известен сходный способ, в котором информация кодируется в потоке выборок субполос (патент США 5687191). Четвертое решение (фиг.26) может быть применено, когда система кодирования использует кодирование Хафмана или другое кодирование с избыточностью (2603). Выборку субполос для верхней полосы затем устанавливаются в нуль (2601) или в постоянное значение для достижения высокой избыточности.Conventional decoders that do not take advantage of the present invention will not recognize these headers and will therefore discard these additional frames. According to the second decision, the information on the spectral envelope of the upper band is transmitted as additional data in the encoded bit stream. However, the available additional data field should be large enough to contain envelope information. In cases where none of the first two solutions is applicable, a third solution can be used, according to which the information of the spectrum envelope of the upper band is hidden in the form of subband samples. Large-scale subband selection factors cover a large dynamic range, usually in excess of 100 dB. Thus, it is possible to set an arbitrary number of scaling factors of subband samples (2505 in FIG. 25) to very small values and transmit scaling factors of the upper band “masked” as subband samples 2501. This method of transmitting scaling factors of the upper band to decoder 2503 provides compatibility with bitstream syntax. Therefore, in this mode arbitrary data can be transmitted. A similar method is known in which information is encoded in a stream of subband samples (US Pat. No. 5,687,191). A fourth solution (FIG. 26) can be applied when the coding system uses Huffman coding or other coding with redundancy (2603). The subband sample for the upper band is then set to zero (2601) or a constant value to achieve high redundancy.

Улучшение отклика переходного процессаTransient Response Improvement

Искажения, связанные с переходными процессами, являются общей проблемой в кодеках аудиосигналов, и подобные искажения имеют место и для настоящего изобретения. В принципе, связывание создает спектральные "нули" или провалы, соответствующие предварительным и последующим эхо-сигналам во временной области, т.е. ложным переходным процессом до и после "истинных" переходных процессов. Хотя Р-блоки "заполняют нули" для медленно изменяющихся тональных сигналов, однако предварительные и последующие эхо-сигналы остаются. Усовершенствованный многополосный способ предназначен для работы на дискретных синусоидах, причем количество синусоид ограничено одной на субполосу. Переходные процессы или шум в субполосе могут рассматриваться как большое количество дискретных синусоид в такой субполосе. Это создает интермодуляционное искажение. Такие искажения рассматриваются как дополнительные источники шумов квантования, связанные с дублированными каналами верхней полосы на интервалах переходных процессов. Для усовершенствования субъективного качества усовершенствованного многополосового способа могут быть использованы традиционные способы устранения предварительных и последующих эхо-сигналов в перцептуальных кодерах аудиосигналов, например, адаптивное переключение окна. Использование детектирования переходных процессов, обеспечиваемого кодеком или отдельным детектором, и уменьшение количества каналов, находящихся в условиях переходных процессов, приводит к тому, что шумы квантования не превышают зависящего от времени порога маскирования. Меньшее количество каналов используется при прохождении переходных процессов, в то время как большее количество используется при прохождении тональных сигналов. Такое адаптивное переключение окна обычно применяется в кодеках для использования компромисса между частотной разрешающей способностью временной разрешающей способностью. Различные способы могут быть использованы в задачах, где размер набора фильтров является фиксированным. Одним их подходов является преобразование шумов квантования во времени путем линейного прогнозирования в спектральной области. Транспозиция затем выполняется на остаточном сигнале, который является выходным результатом фильтра линейного предсказания. После этого фильтр инверсного предсказания применяется одновременно к исходному и спектрально-дублированному каналам. Другой подход использует систему компандера (компрессор + экспандер), т.е. динамическое сжатие переходного сигнала перед транспозицией или кодированием, и дополнительное расширение после транспозиции. Возможно также попеременное использование способов транспозиции в зависимости от сигнала, например способ транспозиции с набором фильтров высокой разрешающей способности используется для стационарных сигналов, а способ прогнозирования изменяющейся по времени схемы поиска используется для переходных сигналов.Transient distortions are a common problem in audio codecs, and similar distortions exist for the present invention. In principle, coupling creates spectral “zeros” or dips corresponding to preliminary and subsequent echoes in the time domain, i.e. false transient before and after “true” transients. Although the P-blocks “fill in zeros” for slowly changing tones, the preliminary and subsequent echoes remain. An improved multiband method is designed to operate on discrete sinusoids, and the number of sinusoids is limited to one per subband. Transients or noise in a subband can be considered as a large number of discrete sinusoids in such a subband. This creates intermodulation distortion. Such distortions are considered as additional sources of quantization noise associated with duplicated channels of the upper band at transient intervals. To improve the subjective quality of the improved multiband method, traditional methods of eliminating preliminary and subsequent echo signals in perceptual audio encoders, for example, adaptive window switching, can be used. Using transient detection provided by a codec or a separate detector and reducing the number of channels under transient conditions leads to the fact that the quantization noise does not exceed the time-dependent masking threshold. Fewer channels are used for transients, while more are used for tones. Such adaptive window switching is typically used in codecs to exploit the trade-off between frequency resolution and time resolution. Various methods can be used in tasks where the size of the filter set is fixed. One approach is to transform the quantization noise over time by linearly predicting in the spectral region. The transposition is then performed on the residual signal, which is the output of the linear prediction filter. After that, the inverse prediction filter is applied simultaneously to the original and spectrally duplicated channels. Another approach uses a compander system (compressor + expander), i.e. dynamic compression of the transition signal before transposition or coding, and additional expansion after transposition. It is also possible to alternately use transposition methods depending on the signal, for example, a transposition method with a set of high-resolution filters is used for stationary signals, and a method for predicting a time-varying search scheme is used for transition signals.

Практическое осуществлениеPractical implementation

При использовании стандартных процессоров сигнала или персональных компьютеров с большими вычислительными возможностями возможна работа кодека на основе ДСП в режиме реального времени. Такой кодек может быть выполнен в виде аппаратных средств на обычной микросхеме. Он может быть также выполнен в различных видах систем для хранения или передачи сигналов, аналоговых или цифровых, с использованием произвольных кодеков (фиг.27 и фиг.28). Способ ДСП-1 может быть интегрирован в декодер или обеспечиваться как дополнительный модуль постобработки, аппаратный или программный. Способ ДСП-2 требует дополнительной модификации кодера. Как показано на фиг.21, аналоговой входной сигнал подается на аналого-цифровой преобразователь 2701, формирующий цифровой сигнал, который подается на произвольный кодер 2703, на котором выполняется исходное кодирование. Сигнал, подаваемый в систему, может быть сигналом нижних частот того типа, спектральные полосы которого уже были отброшены в пределах звукового диапазона или спектральные полосы которого отбрасываются в произвольном кодере. Результирующие сигналы нижней полосы подаются на мультиплексор 2705, формирующий последовательный поток битов, который передается или запоминается (2707). Демультиплексор 2709 восстанавливает эти сигналы и подает их на произвольный дешифратор 2711. Информация огибающей спектра 2715 оценивается в дешифраторе 2711 и подается на блок ДСП-1 2713, который транспортирует сигнал нижней полосы в сигнал верхней полосы и создает широкополосный сигнал с подстраиваемой огибающей спектра. Наконец, цифровой широкополосный сигнал преобразуется (2717) в аналоговый выходной сигнал.When using standard signal processors or personal computers with great computing capabilities, it is possible to operate a codec based on chipboard in real time. Such a codec can be made in the form of hardware on a conventional chip. It can also be implemented in various types of systems for storing or transmitting signals, analog or digital, using arbitrary codecs (Fig. 27 and Fig. 28). The DSP-1 method can be integrated into a decoder or provided as an additional post-processing module, hardware or software. The DSP-2 method requires additional modification of the encoder. As shown in FIG. 21, an analog input signal is supplied to an analog-to-digital converter 2701, which generates a digital signal, which is supplied to an arbitrary encoder 2703, on which the source encoding is performed. The signal supplied to the system may be a low-frequency signal of the type whose spectral bands have already been discarded within the audio range or whose spectral bands are discarded in an arbitrary encoder. The resulting lower-band signals are fed to a multiplexer 2705, forming a sequential bit stream that is transmitted or stored (2707). The demultiplexer 2709 reconstructs these signals and feeds them to an arbitrary decoder 2711. The information of the envelope of the spectrum 2715 is evaluated in the decoder 2711 and fed to the DSP-1 unit 2713, which transports the signal of the lower band to the signal of the upper band and creates a broadband signal with a tunable envelope of the spectrum. Finally, the digital broadband signal is converted (2717) into an analog output signal.

Способ ДСП-2 требует дополнительной модификации кодера. Согласно фиг.28, аналоговый входной сигнал подается на аналого-цифровой преобразователь 2801, формируя цифровой сигнал, который подается на произвольный кодер 2803, в котором выполняется исходное кодирование. Информация огибающей спектра выделяется 2805. Результирующие сигналы, выборки субполос нижней полосы или коэффициенты и информация широкополосной огибающей подаются на мультиплексор 2807, формируя последовательный поток битов, который передается или запоминается (2809). Демультиплексор 2811 восстанавливает эти сигналы, выборки субполос нижней полосы или коэффициенты и информацию широкополосной огибающей и подает их на произвольный декодер 2815. Информация огибающей спектра 2813 подается с демультиплексора 2811 на блок ДСП-2 2817, который транспонирует сигнал нижней полосы в сигнал верхней полосы и создает широкополосный сигнал С подстраиваемой огибающей спектра. Наконец, цифровой широкополосный сигнал преобразуется (2819) в аналоговый выходной сигнал.The DSP-2 method requires additional modification of the encoder. According to FIG. 28, an analog input signal is supplied to an analog-to-digital converter 2801, generating a digital signal that is supplied to an arbitrary encoder 2803 in which the source encoding is performed. Spectral envelope information is extracted 2805. The resulting signals, lower band subband samples, or coefficients and broadband envelope information are supplied to multiplexer 2807, forming a sequential bit stream that is transmitted or stored (2809). Demultiplexer 2811 reconstructs these signals, samples of subbands of the lower band or coefficients and information of the broadband envelope and feeds them to an arbitrary decoder 2815. Information from envelope of spectrum 2813 is supplied from demultiplexer 2811 to block DSP-2 2817, which transposes the signal of the lower band into the signal of the upper band and Broadband signal With adjustable spectrum envelope. Finally, the digital broadband signal is converted (2819) to an analog output signal.

Когда доступны только очень низкие скорости передачи (интернет и низкоскоростные телефонные модемы, АМ-радиовещение и т.п.) неизбежно монокодирование материала аудиопрограмм. Чтобы улучшить качество восприятия и сделать звучание программ более приятным, создается простой "псевдостерео" генератор (фиг.29) путем введения линии задержки с отводами 2901. Это позволяет подавать сигналы с задержкой 10 мсек и 15 мсек с уровнем примерно 06 дБ (2903) на каждый выходной канал в дополнение к исходному моно-сигналу 2905. Этот псевдостереогенератор обеспечивает значительное улучшение восприятия при низких вычислительных затратах.When only very low transfer rates (the Internet and low-speed telephone modems, AM broadcasting, etc.) are available, monocoding of audio program material is inevitable. To improve the quality of perception and make the sound of the programs more pleasant, a simple “pseudo stereo” generator is created (Fig. 29) by introducing a delay line with taps 2901. This allows you to send signals with a delay of 10 ms and 15 ms with a level of about 06 dB (2903) to each output channel in addition to the original mono signal 2905. This pseudo-stereo generator provides a significant improvement in perception at low computational cost.

Вышеописанные варианты осуществления иллюстрируют принципы настоящего изобретения, направленного на усовершенствования кодирования источников аудиосигнала. Ясно, что модификации и варианты описанных устройств и деталей их осуществления будут очевидны для специалистов в данной области техники. Поэтому объем изобретения ограничивается только последующей формулы изобретения, а не конкретными деталями, представленными при описании вариантов его осуществления.The above embodiments illustrate the principles of the present invention, aimed at improving the coding of audio sources. It is clear that modifications and variations of the described devices and details of their implementation will be obvious to specialists in this field of technology. Therefore, the scope of the invention is limited only by the following claims, and not by the specific details presented in the description of its embodiments.

Claims (22)

1. Способ декодирования кодированного сигнала (201, 301), причем кодированный сигнал получен из исходного сигнала и представляет только часть полос частот, включенных в исходный сигнал, частотное содержимое кодированного сигнала (201, 301) представлено выборками субполос для множества субполос или представлено множеством спектральных коэффициентов, заключающийся в том, что выделяют первый полосовой сигнал (203, 303), причем первый полосовой сигнал имеет выборки субполос из предварительно определенного количества анализируемых субполос или имеет предварительно определенное количество анализируемых спектральных коэффициентов, при этом первый полосовой сигнал имеет полосу частот меньшую полосы частот кодированного сигнала (201, 301), осуществляют транспозицию (205, 305) выборок субполос из субполос анализа или спектральных коэффициентов анализа, включенных в полосовой сигнал (203, 303), во второй полосовой сигнал (205, 305), имеющий частотное содержимое, которое включено в исходный сигнал и которое не включено в кодированный сигнал, причем второй полосовой сигнал имеет субполосы синтеза или спектральные коэффициенты синтеза, а при осуществлении транспозиции присоединяют субполосы анализа к субполосам синтеза или присоединяют спектральные коэффициенты анализа к спектральным коэффициентам синтеза, при этом выбранные выборки субполос или спектральные коэффициенты, включенные во второй полосовой сигнал (203, 303), перед или после осуществления транспозиции подстраивают по огибающей спектра с использованием информации огибающей спектра, полученной из исходного сигнала или кодированного сигнала, для получения подстроенных по огибающей спектра транспонированных выборок субполос или подстроенных по огибающей спектра транспонированных спектральных коэффициентов, и объединяют выборки субполос и подстроенные транспонированные выборки субполос или спектральные коэффициенты и подстроенные транспонированные спектральные коэффициенты для получения выходного сигнала (209, 309), причем выходной сигнал имеет частотное содержимое, включающее в себя частотное содержимое кодированного сигнала и частотное содержимое второго полосового сигнала.1. A method for decoding an encoded signal (201, 301), wherein the encoded signal is obtained from the original signal and represents only part of the frequency bands included in the original signal, the frequency content of the encoded signal (201, 301) is represented by samples of subbands for multiple subbands or represented by multiple spectral coefficients, namely, that allocate the first bandpass signal (203, 303), and the first bandpass signal has samples of subbands from a predetermined number of analyzed subbands or has a predetermined number of analyzed spectral coefficients, while the first band signal has a frequency band smaller than the frequency band of the encoded signal (201, 301), transpose (205, 305) samples of subbands from analysis subbands or spectral analysis coefficients included in the band signal (203, 303), into a second band signal (205, 305) having frequency content that is included in the original signal and which is not included in the encoded signal, the second band signal having synthesis subbands or spectral synthesis coefficients, and during the transposition, add analysis subbands to synthesis subbands or add analysis spectral coefficients to synthesis spectral coefficients, while the selected samples of subbands or spectral coefficients included in the second band signal (203, 303) are tuned before or after transposition along the spectrum envelope using information from the spectrum envelope obtained from the original signal or the encoded signal to obtain a dividing spectrum of transposed samples of subbands or tuned spectral coefficients of the spectrum envelope, and combining samples of subbands and adjusted transposed samples of subbands or spectral coefficients and adjusted transposed spectral coefficients to obtain an output signal (209, 309), the output signal having a frequency content including themselves the frequency content of the encoded signal and the frequency content of the second band signal. 2. Способ по п.1, отличающийся тем, что полосу (полосы) пропускания подстроенных транспонированных выборок субполос или подстроенных транспонированных спектральных коэффициентов устанавливают так, чтобы не перекрывать или только частично перекрывать полосу (полосы) пропускания выборок субполос или спектральных коэффициентов, представляющих частотное содержимое кодированного сигнала.2. The method according to claim 1, characterized in that the passband (s) of the tuned transposed samples of subbands or tuned transposed spectral coefficients is set so as not to overlap or only partially overlap the passband (s) of the samples of subbands or spectral coefficients representing the frequency content encoded signal. 3. Способ по п.1, отличающийся тем, что дополнительно оценивают информацию огибающей спектра второго полосового сигнала с использованием кодированного сигнала.3. The method according to claim 1, characterized in that it further evaluates the information of the spectrum envelope of the second strip signal using the encoded signal. 4. Способ по п.1, отличающийся тем, что кодированный сигнал дополнительно включает в себя переданную информацию огибающей спектра в восстановленной полосе частот, которая была отброшена при кодировании исходного сигнала, при этом дополнительно демультиплексируют (2811) переданную информацию огибающей отброшенной полосы (полос) частот исходного сигнала из кодированного сигнала.4. The method according to claim 1, characterized in that the encoded signal further includes transmitted information of the envelope of the spectrum in the reconstructed frequency band, which was discarded during the encoding of the original signal, further demultiplexing (2811) the transmitted information of the envelope of the discarded band (s) frequencies of the original signal from the encoded signal. 5. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде выборок субполос в произвольном количестве каналов субполос кодированного сигнала, причем усиления упомянутых каналов субполос устанавливают на низкий уровень.5. The method according to claim 4, characterized in that the information of the envelope of the spectrum is transmitted in the form of samples of subbands in an arbitrary number of channels of the subbands of the encoded signal, and the amplifications of the mentioned channels of the subbands are set to a low level. 6. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде масштабных коэффициентов без передачи соответствующих выборок субполос в кодированном сигнале.6. The method according to claim 4, characterized in that the information of the envelope of the spectrum is transmitted in the form of scale factors without transmitting the corresponding samples of the subbands in the encoded signal. 7. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде масштабных коэффициентов и соответствующие выборки субполос устанавливают в кодированном сигнале на нуль или на постоянную величину.7. The method according to claim 4, characterized in that the information of the envelope of the spectrum is transmitted in the form of scale factors and the corresponding samples of the subbands are set to zero or a constant value in the encoded signal. 8. Способ по п.1, отличающийся тем, что декодированный выходной сигнал представляет собой монофонический аудиосигнал, при этом дополнительно расщепляют декодированный выходной сигнал на два сигнала, каждый из которых состоит из упомянутого выходного сигнала и задержанных его версий для получения псевдостереосигнала.8. The method according to claim 1, characterized in that the decoded output signal is a monaural audio signal, while further splitting the decoded output signal into two signals, each of which consists of said output signal and its delayed versions to obtain a pseudo stereo signal. 9. Способ по п.1, отличающийся тем, что осуществляют фильтрацию сигнала посредством набора из N≥2 полосовых фильтров, причем упомянутые фильтры имеют полосы пропускания, содержащие соответственно частоты [f1,...,fN], для формирования N сигналов субполос, при этом при транспозиции осуществляют сдвиг сигналов субполос по частоте в области, содержащей частоты M[f1,...,fN], где M≠1 - коэффициент транспозиции.9. The method according to claim 1, characterized in that the signal is filtered by a set of N≥2 bandpass filters, said filters having passbands containing frequencies [f 1 , ..., f N ], respectively, for generating N signals sub-bands, while transposition shift the signals of the sub-bands in frequency in the region containing the frequencies M [f 1 , ..., f N ], where M ≠ 1 is the transposition coefficient. 10. Способ по п.9, отличающийся тем, что сдвиг по частоте получают путем модуляции верхней боковой полосы (ВВП).10. The method according to claim 9, characterized in that the frequency shift is obtained by modulating the upper sideband (GDP). 11. Способ по п.1, отличающийся тем, что осуществляют полосовую фильтрацию сигнала с использованием набора фильтров анализа или преобразования такого характера, что генерируют действительные или комплексные сигналы субполос анализа типа нижних частот, причем при упомянутой транспозиции осуществляют связывание произвольного количества каналов k упомянутого набора фильтров анализа или преобразования с каналами Mk, М≠1, в наборе фильтров синтеза или преобразования, где М - коэффициент транспозиции, при этом набор фильтров или преобразование используют при фильтрации или выполнении инверсного преобразования.11. The method according to claim 1, characterized in that the signal is band-filtered using a set of analysis or conversion filters of such a nature that generate real or complex analysis subband signals of the low-frequency type, and with said transposition, an arbitrary number of channels k of the said set are linked analysis or conversion filters with channels Mk, M ≠ 1, in the set of synthesis or conversion filters, where M is the transposition coefficient, while the set of filters or transformation Do not use when filtering or performing inverse conversion. 12. Способ по п.11, отличающийся тем, что набор фильтров характеризуется максимальным прореживанием, при этом связывание выполняют в соответствии с соотношением:12. The method according to claim 11, characterized in that the set of filters is characterized by maximum decimation, while the binding is performed in accordance with the ratio: VMk(n)=(-1)(M-1)knVk(n),V Mk (n) = (- 1) (M-1) kn V k (n), где (-1)(M-1)kn - коэффициент коррекции; Vk(n) - сигнал субполосы канала k; VMk(n) - сигнал субполосы канала Mk, при этом обеспечивают компенсацию спектрально инвертированных сигналов субполос.where (-1) (M-1) kn is the correction factor; V k (n) is the signal of the subband of channel k; V Mk (n) is the signal of the subband of the channel Mk, while providing compensation for the spectrally inverted signals of the subbands. 13. Способ по п.1, отличающийся тем, что при транспозиции осуществляют связывание фаз выборок субполос анализа или частотных коэффициентов анализа из каналов k набора фильтров анализа или преобразования в качестве фаз выборок субполос, связанных с каналами Mk синтеза, где М - коэффициент транспозиции, являющийся целым числом, не равным 1, и k - номер канала, и осуществляют связывание амплитуд выборок субполос анализа или спектральных коэффициентов анализа из последовательных каналов l набора фильтров анализа или преобразования в качестве амплитуд выборок субполос или спектральных коэффициентов, связанных с последовательными каналами синтеза l+S, где S - целое число, не равное 1, и l - номер канала.13. The method according to claim 1, characterized in that during transposition, the phases of the analysis subband samples or the analysis frequency coefficients from the channels k of the analysis or conversion filter set are connected as the phases of the subband samples associated with the synthesis channels Mk, where M is the transposition coefficient, which is an integer not equal to 1, and k is the channel number, and the amplitudes of the samples of the analysis sub-bands or spectral coefficients of the analysis are linked from the serial channels l of the analysis or conversion filter set as an amp and thereafter, samples of subbands or spectral coefficients associated with successive synthesis channels l + S, where S is an integer not equal to 1, and l is the channel number. 14. Способ по п.13, отличающийся тем, что при транспозиции фазы выборок субполос анализа каналов k умножают на коэффициент М перед использованием упомянутого набора фильтров синтеза или преобразования.14. The method according to p. 13, characterized in that when the transposition phase of the samples of the sub-analysis channels k is multiplied by a coefficient M before using the said set of synthesis or conversion filters. 15. Способ по п.13, отличающийся тем, что M=K±1, где К - целое число большее, чем 1.15. The method according to item 13, wherein M = K ± 1 , where K is an integer greater than 1. 16. Способ по п.11, отличающийся тем, что при упомянутом связывании используют множество значений коэффициента М транспозиции.16. The method according to claim 11, characterized in that with the said binding, a plurality of values of the transposition coefficient M are used. 17. Способ обеспечения транспонированного сигнала, который транспонирован с коэффициентом М, из входного сигнала, из которого отброшена по меньшей мере одна полоса частот, заключающийся в том, что осуществляют фильтрацию входного сигнала с использованием параллельного набора из L фильтров с импульсными характеристиками вида17. A method of providing a transposed signal, which is transposed with a coefficient M, from an input signal from which at least one frequency band is dropped, which consists in filtering the input signal using a parallel set of L filters with impulse responses of the form
Figure 00000042
Figure 00000042
где k=0,1,...,L-1, К - константа, р0(n) - модель фильтра нижних частот длины N, формирующего набор из L комплексных сигналов, осуществляют дискретизацию с пониженной частотой упомянутого набора из L сигналов с коэффициентом L/M для формирования набора из L комплексных сигналов субполос, осуществляют умножение фазовых углов упомянутого набора из L комплексных сигналов субполос на М для формирования нового набора сигналов субполос, осуществляют выделение действительных частей упомянутого нового набора сигналов субполос для формирования набора из L действительных сигналов субполос, осуществляют дискретизацию с повышенной частотой упомянутого набора из L действительных сигналов субполос с коэффициентом L’ для формирования набора действительных сигналов, осуществляют фильтрацию упомянутого набора действительных сигналов посредством параллельного набора из L’ фильтров с импульсными откликами видаwhere k = 0,1, ..., L-1, K is a constant, p 0 (n) is a model of a low-pass filter of length N, forming a set of L complex signals, sampling with a reduced frequency of the said set of L signals with coefficient L / M to form a set of L complex signals of subbands, multiply the phase angles of the set of L complex signals of subbands by M to generate a new set of signals of subbands, extract the real parts of the said new set of signals of subbands to form a set of L Valid The subband signals, perform oversampling said set of L real subband signals with coefficient L 'to generate the set of valid signals carried filtering said set of valid signals via parallel sets of L' filters with impulse responses of the form
Figure 00000043
Figure 00000043
где k=0,1,...,L’-1, К’ - константа, р’0(n) - модель фильтра нижних частот длины N’, формирующего набор из L’ отфильтрованных сигналов, и осуществляют суммирование упомянутого набора из L’ отфильтрованных сигналов и входного сигнала для формирования транспонированного сигнала.where k = 0,1, ..., L'-1, K 'is a constant, p' 0 (n) is a low-pass filter model of length N ', forming a set of L' filtered signals, and summing up the said set of L 'filtered signals and input signal to form a transposed signal.
18. Способ по п.17, отличающийся тем, что умножение упомянутых фазовых углов и выделение действительной части для получения набора из L действительных сигналов субполос выполняют посредством вычислений при определении упомянутого набора комплексных сигналов субполос в виде18. The method according to 17, characterized in that the multiplication of the mentioned phase angles and the allocation of the real part to obtain a set of L valid subband signals is performed by calculations when determining the said set of complex subband signals in the form Zk(n)=Rk(n)+jIk(n),Z k (n) = R k (n) + jI k (n), где Rk(n) и Ik(n) - действительная и мнимая части Zk(n) соответственно,where R k (n) and I k (n) are the real and imaginary parts of Z k (n), respectively, вычислении упомянутого набора действительных сигналов субполос Wk(n) в видеcomputing said set of valid subband signals W k (n) in the form
Figure 00000044
Figure 00000044
где
Figure 00000045
и М - положительный целочисленный коэффициент транспозиции, с использованием следующего тригонометрического тождества:
Where
Figure 00000045
and M is a positive integer transposition coefficient using the following trigonometric identity:
cos(Ma)=cosM(a)-(M/2)sin2(a)cosM-2(a)+(M/4)sin4(a)cosM-4(a)...,cos (Ma) = cos M (a) - (M / 2) sin 2 (a) cos M-2 (a) + (M / 4) sin 4 (a) cos M-4 (a) ..., где a=arctg{Ik(n)/Rk(n)}, и следующих соотношений:where a = arctan {I k (n) / R k (n)}, and the following relations:
Figure 00000046
и
Figure 00000047
Figure 00000046
and
Figure 00000047
19. Декодер для декодирования кодированного сигнала (201, 301), причем кодированный сигнал получен из исходного сигнала или кодированного сигнала и представляет только часть полос частот, включенных в исходный сигнал, частотное содержимое кодированного сигнала (201, 301) представлено выборками субполос для множества субполос или представлено множеством спектральных коэффициентов, содержащий устройство выделения для выделения первого полосового сигнала (203, 303), причем первый полосовой сигнал имеет выборки субполос из предварительно определенного количества субполос анализа или имеет предварительно определенное количество спектральных коэффициентов анализа, при этом первый полосовой сигнал имеет полосу частот меньшую, чем частотное содержимое кодированного сигнала (201, 301), устройство транспозиции для транспозиции (205, 305) выбранных выборок субполос из субполос анализа или спектральных коэффициентов анализа, включенных в первый полосовой сигнал (203, 303), во второй полосовой сигнал (205, 305), имеющий частотное содержимое, которое включено в исходный сигнал и которое не включено в кодированный сигнал, причем второй полосовой сигнал имеет субполосы синтеза или спектральные коэффициенты синтеза, а транспозиция включает в себя присоединение субполос анализа к субполосам синтеза или присоединение спектральных коэффициентов анализа к спектральным коэффициентам синтеза, при этом выбранные выборки субполос или спектральные коэффициенты, включенные во второй полосовой сигнал (203, 303), перед или после выполнения транспозиции подстраивают (207, 307) по огибающей спектра с использованием информации огибающей спектра, полученной из исходного сигнала или кодированного сигнала, для получения подстроенных по огибающей спектра транспонированных выборок субполос или подстроенных по огибающей спектра транспонированных спектральных коэффициентов и устройство объединения для объединения выборок субполос и подстроенных транспонированных выборок субполос или спектральных коэффициентов и подстроенных транспонированных спектральных коэффициентов для получения выходного сигнала (209, 309), причем выходной сигнал имеет частотное содержимое, включающее в себя частотное содержимое кодированного сигнала и частотное содержимое второго полосового сигнала.19. A decoder for decoding an encoded signal (201, 301), wherein the encoded signal is obtained from the original signal or encoded signal and represents only part of the frequency bands included in the original signal, the frequency content of the encoded signal (201, 301) is represented by samples of subbands for multiple subbands or represented by a plurality of spectral coefficients, comprising a selection device for extracting a first band signal (203, 303), wherein the first band signal has subband samples of predetermined the number of analysis subbands or has a predetermined number of spectral analysis coefficients, the first bandpass signal having a frequency band smaller than the frequency content of the encoded signal (201, 301), a transposition device for transposing (205, 305) selected subband samples from the analysis subbands or spectral analysis coefficients included in the first strip signal (203, 303), in the second strip signal (205, 305) having a frequency content that is included in the original signal and which is not included in the a doped signal, wherein the second bandpass signal has synthesis subbands or spectral synthesis coefficients, and the transposition includes attaching analysis subbands to synthesis subbands or attaching analysis spectral coefficients to synthesis spectral coefficients, wherein selected samples of subbands or spectral coefficients included in the second bandpass signal (203, 303), before or after performing the transposition, adjust (207, 307) according to the spectral envelope using the information of the spectral envelope obtained one of the original signal or the encoded signal, to obtain transposed samples of the subband adapted to the spectrum envelope, or transposed spectral coefficients adjusted to the spectral envelope, and a combiner for combining the subband samples and the adjusted transposed samples of the subbands or spectral coefficients and the adjusted transposed spectral coefficients to obtain the output signal ( 209, 309), wherein the output signal has a frequency content including frequencies th content of the encoded signal and the second frequency band signal contents. 20. Устройство для обеспечения транспонированного сигнала, который транспонирован с коэффициентом М, из входного сигнала, из которого отброшена по меньшей мере одна полоса частот, содержащее фильтр для фильтрации входного сигнала с использованием параллельного набора из L фильтров с импульсными откликами вида20. Device for providing a transposed signal, which is transposed with a coefficient M, from an input signal from which at least one frequency band is dropped, containing a filter for filtering the input signal using a parallel set of L filters with impulse responses of the form
Figure 00000048
Figure 00000048
где k=0,1,...,L-1, К – константа; р0(n) - модель фильтра нижних частот длины N; М - коэффициент, формирующий набор из L комплексных сигналов, устройство дискретизации с пониженной частотой для дискретизации с пониженной частотой упомянутого набора из L сигналов с коэффициентом L/M для формирования набора из L комплексных сигналов субполос, умножитель для умножения фазовых углов упомянутого набора комплексных сигналов субполос на М для формирования нового набора сигналов субполос, устройство выделения для выделения действительных частей упомянутого нового набора сигналов субполос для формирования набора из L действительных сигналов субполос, устройство дискретизации с повышенной частотой для дискретизации с повышенной частотой упомянутого набора из L действительных сигналов субполос с коэффициентом L’ для формирования набора действительных сигналов, фильтр для фильтрации упомянутого набора действительных сигналов посредством параллельного набора из L’ фильтров с импульсными откликами видаwhere k = 0,1, ..., L-1, K is a constant; p 0 (n) is a low-pass filter model of length N; M is a coefficient forming a set of L complex signals, a sampling device with a reduced frequency for sampling with a reduced frequency of said set of L signals with an L / M coefficient for generating a set of L complex signals of subbands, a multiplier for multiplying phase angles of said set of complex signals of subbands on M to form a new set of subband signals, a selection device for extracting the real parts of said new set of subband signals to form a set of L actions itelnyh subband signals, the sampling device with high frequency for oversampling said set of L real subband signals with coefficient L 'to generate the set of valid signals, a filter for filtering said set of valid signals via parallel sets of L' filters with impulse responses of the form
Figure 00000049
Figure 00000049
где k=0,1,...,L’-1, К’ - константа, p’0(n) - модель фильтра нижних частот длины N’, формирующего набор из L’ отфильтрованных сигналов, и сумматор для суммирования упомянутого набора из L’ отфильтрованных сигналов и входного сигнала для формирования транспонированного сигнала.where k = 0,1, ..., L'-1, K 'is a constant, p' 0 (n) is a low-pass filter model of length N ', forming a set of L' filtered signals, and an adder to summarize the said set from L 'filtered signals and an input signal to form a transposed signal. Приоритеты:Priorities:
10.06.1997 - пп.1-16 и 19;06/10/1997 - paragraphs 1-16 and 19; 30.01.1998 - пп.17, 18 и 20.01/30/1998 - pp. 17, 18 and 20.
RU99104814/09A 1997-06-10 1998-06-09 Improving initial coding using duplicating band RU2256293C2 (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
SE9702213-1 1997-06-10
SE9702213A SE9702213D0 (en) 1997-06-10 1997-06-10 A method and a device for bit-rate reduction using synthetic bandwidth expansion
SE9704634-6 1997-12-12
SE9800268-6 1998-01-30
SE9800268A SE512719C2 (en) 1997-06-10 1998-01-30 A method and apparatus for reducing data flow based on harmonic bandwidth expansion

Publications (2)

Publication Number Publication Date
RU99104814A RU99104814A (en) 2001-01-27
RU2256293C2 true RU2256293C2 (en) 2005-07-10

Family

ID=35838713

Family Applications (1)

Application Number Title Priority Date Filing Date
RU99104814/09A RU2256293C2 (en) 1997-06-10 1998-06-09 Improving initial coding using duplicating band

Country Status (1)

Country Link
RU (1) RU2256293C2 (en)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2487428C2 (en) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Apparatus and method for calculating number of spectral envelopes
RU2490728C2 (en) * 2009-05-27 2013-08-20 Долби Интернешнл Аб Efficient combined harmonic transposition
RU2493618C2 (en) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Improved harmonic conversion
RU2494478C1 (en) * 2009-10-21 2013-09-27 Долби Интернешнл Аб Oversampling in combined transposer filter bank
RU2495505C2 (en) * 2009-01-16 2013-10-10 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
RU2498422C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2507572C2 (en) * 2008-07-11 2014-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoding device and decoder for encoding/decoding quantised audio signal frames
RU2512090C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Apparatus and method of generating wide bandwidth signal
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
RU2596594C2 (en) * 2009-10-20 2016-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Audio signal encoder, audio signal decoder, method for encoded representation of audio content, method for decoded representation of audio and computer program for applications with small delay
RU2598035C1 (en) * 2013-01-08 2016-09-20 ИНТЕЛ АйПи КОРПОРЕЙШН Methods and apparatus for reducing conflicts in radio communication networks
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US11562755B2 (en) 2009-01-28 2023-01-24 Dolby International Ab Harmonic transposition in an audio coding method and system
RU2800676C1 (en) * 2010-01-19 2023-07-26 Долби Интернешнл Аб Improved harmonic transformation based on a block of sub-bands
US11837246B2 (en) 2009-09-18 2023-12-05 Dolby International Ab Harmonic transposition in an audio coding method and system
US11935555B2 (en) 2010-01-19 2024-03-19 Dolby International Ab Subband block based harmonic transposition

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ШЛЯПОБЕРСКИЙ В.И. Основы техники передачи дискретных сообщений. - М.: Связь, 1973, с.300-306. *

Cited By (47)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8880410B2 (en) 2008-07-11 2014-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
USRE49801E1 (en) 2008-07-11 2024-01-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
RU2507572C2 (en) * 2008-07-11 2014-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoding device and decoder for encoding/decoding quantised audio signal frames
RU2512090C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Apparatus and method of generating wide bandwidth signal
US8612214B2 (en) 2008-07-11 2013-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for generating bandwidth extension output data
USRE47180E1 (en) 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
RU2487428C2 (en) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Apparatus and method for calculating number of spectral envelopes
US11031025B2 (en) 2009-01-16 2021-06-08 Dolby International Ab Cross product enhanced harmonic transposition
RU2638748C2 (en) * 2009-01-16 2017-12-15 Долби Интернешнл Аб Harmonic transformation improved by cross-product
US10586550B2 (en) 2009-01-16 2020-03-10 Dolby International Ab Cross product enhanced harmonic transposition
US11682410B2 (en) 2009-01-16 2023-06-20 Dolby International Ab Cross product enhanced harmonic transposition
US8818541B2 (en) 2009-01-16 2014-08-26 Dolby International Ab Cross product enhanced harmonic transposition
US9799346B2 (en) 2009-01-16 2017-10-24 Dolby International Ab Cross product enhanced harmonic transposition
US10192565B2 (en) 2009-01-16 2019-01-29 Dolby International Ab Cross product enhanced harmonic transposition
US11935551B2 (en) 2009-01-16 2024-03-19 Dolby International Ab Cross product enhanced harmonic transposition
RU2667629C1 (en) * 2009-01-16 2018-09-21 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
RU2646314C1 (en) * 2009-01-16 2018-03-02 Долби Интернешнл Аб Harmonic transformation improved by cross-product
RU2495505C2 (en) * 2009-01-16 2013-10-10 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
US10600427B2 (en) 2009-01-28 2020-03-24 Dolby International Ab Harmonic transposition in an audio coding method and system
US10043526B2 (en) 2009-01-28 2018-08-07 Dolby International Ab Harmonic transposition in an audio coding method and system
US11100937B2 (en) 2009-01-28 2021-08-24 Dolby International Ab Harmonic transposition in an audio coding method and system
US11562755B2 (en) 2009-01-28 2023-01-24 Dolby International Ab Harmonic transposition in an audio coding method and system
RU2493618C2 (en) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Improved harmonic conversion
US9236061B2 (en) 2009-01-28 2016-01-12 Dolby International Ab Harmonic transposition in an audio coding method and system
RU2595914C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2498420C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2595951C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2595915C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2498422C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2498421C2 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2490728C2 (en) * 2009-05-27 2013-08-20 Долби Интернешнл Аб Efficient combined harmonic transposition
US11837246B2 (en) 2009-09-18 2023-12-05 Dolby International Ab Harmonic transposition in an audio coding method and system
RU2596594C2 (en) * 2009-10-20 2016-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Audio signal encoder, audio signal decoder, method for encoded representation of audio content, method for decoded representation of audio and computer program for applications with small delay
US9384750B2 (en) 2009-10-21 2016-07-05 Dolby International Ab Oversampling in a combined transposer filterbank
US9830928B2 (en) 2009-10-21 2017-11-28 Dolby International Ab Oversampling in a combined transposer filterbank
US10584386B2 (en) 2009-10-21 2020-03-10 Dolby International Ab Oversampling in a combined transposer filterbank
US11993817B2 (en) 2009-10-21 2024-05-28 Dolby International Ab Oversampling in a combined transposer filterbank
US8886346B2 (en) 2009-10-21 2014-11-11 Dolby International Ab Oversampling in a combined transposer filter bank
US11591657B2 (en) 2009-10-21 2023-02-28 Dolby International Ab Oversampling in a combined transposer filter bank
RU2494478C1 (en) * 2009-10-21 2013-09-27 Долби Интернешнл Аб Oversampling in combined transposer filter bank
US10947594B2 (en) 2009-10-21 2021-03-16 Dolby International Ab Oversampling in a combined transposer filter bank
US10186280B2 (en) 2009-10-21 2019-01-22 Dolby International Ab Oversampling in a combined transposer filterbank
RU2800676C1 (en) * 2010-01-19 2023-07-26 Долби Интернешнл Аб Improved harmonic transformation based on a block of sub-bands
US11935555B2 (en) 2010-01-19 2024-03-19 Dolby International Ab Subband block based harmonic transposition
RU2598035C1 (en) * 2013-01-08 2016-09-20 ИНТЕЛ АйПи КОРПОРЕЙШН Methods and apparatus for reducing conflicts in radio communication networks
US10200974B2 (en) 2013-01-08 2019-02-05 Intel IP Corporation Methods and arrangements to mitigate collisions in wireless networks
RU2813317C1 (en) * 2023-07-20 2024-02-12 Долби Интернешнл Аб Improved harmonic transformation based on block of sub-bands

Similar Documents

Publication Publication Date Title
US6925116B2 (en) Source coding enhancement using spectral-band replication
US9818418B2 (en) High frequency regeneration of an audio signal with synthetic sinusoid addition
JP4289815B2 (en) Improved spectral transfer / folding in the subband region
US7574313B2 (en) Information signal processing by modification in the spectral/modulation spectral range representation
RU2256293C2 (en) Improving initial coding using duplicating band
EP2255357A2 (en) Apparatus and method for converting an audio signal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthensizing a parameterized representation of an audio signal
US20100250260A1 (en) Encoder
JP2004053940A (en) Audio decoding device and method
Zölzer et al. Audio Coding

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner