RU2256293C2 - Improving initial coding using duplicating band - Google Patents

Improving initial coding using duplicating band

Info

Publication number
RU2256293C2
RU2256293C2 RU99104814A RU99104814A RU2256293C2 RU 2256293 C2 RU2256293 C2 RU 2256293C2 RU 99104814 A RU99104814 A RU 99104814A RU 99104814 A RU99104814 A RU 99104814A RU 2256293 C2 RU2256293 C2 RU 2256293C2
Authority
RU
Grant status
Grant
Patent type
Prior art keywords
signal
subband
set
transposition
spectral
Prior art date
Application number
RU99104814A
Other languages
Russian (ru)
Other versions
RU99104814A (en )
Inventor
Ларс Густаф ЛИЛЬЕРЮД (SE)
Ларс Густаф ЛИЛЬЕРЮД
Пер Руне Альбин ЭКСТРАНД (SE)
Пер Руне Альбин ЭКСТРАНД
Ларс Фредрик ХЕНН (SE)
Ларс Фредрик ХЕНН
Ханс Магнус Кристофер ЧЕРЛИНГ (SE)
Ханс Магнус Кристофер ЧЕРЛИНГ
Original Assignee
Коудинг Технолоджиз Аб
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Grant date

Links

Images

Abstract

FIELD: radio engineering; initial coding systems.
SUBSTANCE: band width is reduced in front of coder or within coder followed by duplicating spectrum band in decoder. This is made by using new methods of transposition jointly with spectrum envelope. Proposed invention can be implemented in hardware or software codec, or can be used as self-contained processor in combination with codec. Improvement is ensured irrespective of type of codec and state-of-the-art.
EFFECT: reduced bit transfer speed at desired perception quality or enhanced perception quality at desired bit transfer speed.
20 cl, 34 dwg

Description

Область техники TECHNICAL FIELD

В системах исходного кодирования цифровые данные сжимаются до передачи или записи, чтобы уменьшить требуемую скорость передачи данных или объем памяти. The source coding systems, digital data is compressed before transmission or recording, to reduce the required data rate or storage capacity. Настоящее изобретение относиться к новому способу и устройству для усовершенствования систем исходного кодирования посредством дублирования спектральной полосы (ДСП). The present invention relates to a novel method and apparatus for improving the original coding systems by overlapping spectral bands (DSP). Достигается существенное снижение скорости передачи данных без ухудшения качества восприятия или, наоборот, достигается улучшение качества восприятия при заданной скорости передачи. Achieved a substantial reduction of data rate without deteriorating the perceptual quality or conversely, improvement in perceptual quality is achieved at a given transmission rate. Это обеспечивается за счет уменьшения ширины полосы спектра на стороне кодирования и последующего дублирования полосы спектра в декодере, т.е. This is achieved by reducing the width of the spectral band on the encoding side and subsequent spectral band overlap in the decoder, i.e. изобретение использует новые концепции избыточности сигнала в спектральной области. The invention exploits new concepts of signal redundancy in the spectral domain.

Предшествующий уровень техники BACKGROUND ART

Методы исходного кодирования звука могут быть разделены на два класса: кодирование натурального аудиосигнала и кодирование речевого сигнала. sound source coding techniques can be divided into two classes: natural audio coding and speech coding. Кодирование натурального аудиосигнала широко используется для музыкальных или произвольных сигналов при средних скоростях передачи данных и в принципе предусматривает широкую полосу аудиочастот. Natural audio coding is commonly used for music or arbitrary signals at medium bit rates and, in principle, provides a wide band audio frequencies. Кодеры речевого сигнала в основном ограничены воспроизведением речевого сигнала, но, с другой стороны, могут быть использованы при очень низких скоростях передачи, хотя и при узкой полосе аудиочастот. Speech coders are basically limited to speech reproduction, but, on the other hand, can be used at very low bitrates, albeit with a narrow band of audio frequencies. Широкополосный речевой сигнал обеспечивает весьма существенное повышение качества по сравнению с узкополосным речевым сигналом. A wideband speech signal provides a very significant increase in quality compared to narrow band speech signal. Расширение полосы частот не только повышает разборчивость и натуральность речи, но также облегчает распознавание говорящего. The expansion of the bandwidth not only improves intelligibility and naturalness of speech, but also facilitates speaker recognition. Широкополосное кодирование речевого сигнала представляет собой важную проблему, стоящую перед телефонными системами следующего поколения. Wideband speech coding is an important problem facing the next generation telephone systems. Кроме того, в связи с ростом областей применения мультимедиа передача музыки и других неречевых сигналов в телефонных системах является желательным качеством. In addition, in connection with the growth of multimedia applications transfer music and other non-voice signals in telephone systems it is a desirable quality.

Линейный сигнал с импульсно-кодовой модуляцией (ИКМ), характеризуемый высокой достоверностью, неэффективен по скорости передачи в зависимости от энтропии восприятия. Linear signal with pulse code modulation (PCM), characterized by high reliability, is not effective for the transmission rate depending on the perceptual entropy. Стандарт компакт-дисков (СД) предписывает частоту дискретизации 44,1 кГц, разрешение 16 бит на выборку и стереорежим. CD standard (SD) prescribes sampling frequency of 44.1 kHz, resolution of 16 bits per sample and stereo. Это соответствует скорости передачи 1411 кбит/сек. This corresponds to the transmission rate 1411 kbit / s. Для существенного снижения скорости передачи исходное кодирование может быть выполнено с использованием перцептуальных кодеков аудиосигнала с расщеплением спектра. To substantially reduce the transmission rate of the original encoding may be performed using a perceptual audio codec with splitting the spectrum. Эти кодеки натурального аудиосигнала используют нерелевантность восприятия и статистическую избыточность в сигнале. These natural audio codecs use perceptual irrelevancy and statistical redundancy in the signal. При использовании наилучшей технологии кодирования-декодирования может быть достигнуто уменьшение объема данных примерно на 90% для сигнала стандартного CD-формата без какого-либо ухудшения разборчивости. When using the best codec technology can be achieved reduction of data volume by about 90% for the standard CD-format signal with no deterioration of legibility. Таким образом, возможно очень высокое качество звука в стереорежиме при скорости примерно 96 Кбит/сек, т.е. It is thus possible very high sound quality in stereo at a rate of about 96 kbit / s, i.e. коэффициент сжатия равен примерно 15:1. compression ratio is about 15: 1. Некоторые перцептуальные кодеки предусматривают даже более высокие степени сжатия. Some perceptual codecs provide even higher compression ratios. Чтобы достичь этого, в общем случае необходимо снизить частоту дискретизации и, тем самым, ширину полосы аудиочастот. To achieve this, it is generally necessary to reduce the sampling frequency and thus the width of the band of audio frequencies. Общепринятым является уменьшение количества уровней квантования, что допускает случайное искажение звука вследствие квантования, а также использование деградации области стерео, за счет интенсивного кодирования. It is generally accepted reduction in the number of quantization levels that allows random distortion sound due to the quantization, and the use of the degradation of the stereo field, through intensive coding. Широкое использование таких способов приводит к ухудшению восприятия. The widespread use of such methods result in poor perception. Существующая технология кодирования-декодирования себя почти исчерпала и дальнейший прогресс в получении выигрыша от кодирования не ожидается. Existing technology codec itself is almost exhausted, and further progress in obtaining coding gain is not expected. Для дополнительного улучшения характеристик кодирования необходим новый подход. To further improve the coding performance needed new approach.

Человеческая речь и большинство музыкальных инструментов формируют квазистационарные сигналы, получаемые на выходе систем генерации. The human voice and most musical instruments form a quasistationary signals obtained at the output of the generation system. Согласно теории Фурье, любой периодический сигнал может быть выражен как сумма синусоидальных сигналов с частотами f, 2f, 3f, 4f, 5f и т.д., где f - основная частота. According to Fourier theory, any periodic signal may be expressed as a sum of sinusoidal signals with frequencies f, 2f, 3f, 4f, 5f etc. where f - the fundamental frequency. Эти частоты образуют последовательность гармоник. These frequencies form a sequence of harmonics. Ограничение полосы частот такого сигнала эквивалентно усечению f последовательности гармоник. Limiting such equivalent baseband signal f truncated harmonic sequence. Такое усечение изменяет воспринимаемый тембр, окраску тона музыкального инструмента или голоса и приводит к получению аудиосигнала, который будет звучать "приглушенно" или "монотонно", и разборчивость может снизиться. Such a truncation alters the perceived timbre, tone color of a musical instrument or voice, and yields an audio signal that will sound "muffled" or "monotonic", and intelligibility may be reduced. Высокие частоты, таким образом, важны для субъективного ощущения качества звука. High frequencies thus important for the subjective quality of sound sensation.

Способы, известные из предшествующего уровня техники, в основном предназначались для усовершенствования характеристик кодека, и, в частности, предназначались для регенерации высоких частот (РВЧ), являющейся проблемой при кодировании речевого сигнала. Methods known from the prior art, mainly intended to improve the codec performance and in particular intended for High Frequency Regeneration (RVCH), which is a problem when coding speech signal. Такие способы используют широкополосные линейные сдвиги частот, нелинейности или наложение спектров (патент США 5.127.054), приводящие к генерации продуктов интермодуляции или других негармонических частотных составляющих, которые создают сильный диссонанс в применении к музыкальным сигналам. Such methods employ broadband linear frequency shifts, non-linearity or aliasing (U.S. Patent 5.127.054) which lead to the generation of intermodulation products or other non-harmonic frequency components which create strong dissonance when applied to music signals. Такой диссонанс описывается в литературе по кодированию речи как "резкое" и "грубое" звучание. Such dissonance is described in the literature on speech coding as "dramatic" and "rough" sounding. Другие способы синтезирования речевого сигнала генерируют синусоидальные гармоники, которые основаны на оценке фундаментального тона, и таким образом, ограничены тональными, стационарными звуковыми сигналами (патент США 4.771.465). Other methods for synthesizing a speech signal is generated sinusoidal harmonics that are based on fundamental pitch estimation and thus limited tonal, stationary sound signals (US Patent 4,771,465). Такие способы, известные из предшествующего уровня техники, будучи полезными для низкокачественных речевых применений, не применимы для высококачественного речевого сигнала или музыкальных сигналов. Such methods are known from the prior art, while useful for low-quality speech applications, do not applicable for high quality speech or music signals. Ряд способов направлены на усовершенствование характеристик кодеков высококачественных источников звукового сигнала. Several methods are aimed at improving the characteristics of the source codec quality audio signal. Один из них использует синтезированные шумовые сигналы, генерируемые в декодере, чтобы заменить шумоподобные сигналы в речи или музыке, ранее исключавшиеся кодером (см. "Improving Audio Codecs by Noise Substitution" D.Schultz, JAES, Vol.44, № 7/8, 1996). One uses synthetic noise signals generated at the decoder to substitute noise-like signals in speech or music previously excluded by the encoder (see. "Improving Audio Codecs by Noise Substitution" D.Schultz, JAES, Vol.44, № 7/8, 1996). Это выполняется в пределах полосы высоких частот, в остальном передаваемой нормально, на прерывистой основе при наличии шума. This is done within a band of high frequencies, but otherwise normally transmitted at intermittent basis when noise is present. Другой способ воссоздает некоторые потерянные гармоники высокой частоты, которые были утеряны в процессе кодирования (см. "Audio Spectral Coder" AJS Ferreira, AES Preprint 4201, 100 th Convention, May 11-14 1996, Copenhagen), и также зависит от тональных сигналов и детектирования высоты тона. Another method recreates some lost high frequency harmonics that were lost in the coding process (see. "Audio Spectral Coder" AJS Ferreira , AES Preprint 4201, 100 th Convention, May 11-14 1996, Copenhagen), and is also dependent on tonal signals and detection pitch. Оба способа работают на основе низкого рабочего цикла, обеспечивая сравнительно ограниченный выигрыш от кодирования или по эффективности. Both methods work on the basis of low duty cycle, providing comparatively limited coding gain or efficiency.

Сущность изобретения SUMMARY OF THE iNVENTION

Настоящее изобретение предусматривает новый способ и устройство для существенного усовершенствования систем цифрового исходного кодирования и, более конкретно, для усовершенствования кодеков аудиосигналов. The present invention provides a novel method and apparatus for substantial improvements of digital source coding systems and more particularly to improvements of audio codecs. Изобретение позволяет уменьшить скорость передачи данных или улучшить качество восприятия, или реализовать комбинацию этих свойств. The invention reduces the data rate or to improve the perceptual quality, or to realize a combination of these properties. Изобретение основано на новых способах использования избыточности гармоник, предоставляя возможность отбрасывания полос частот сигнала до передачи или записи. The invention is based on new methods of using the harmonic redundancy, offering the possibility of discarding a signal of frequency bands to transmission or recording. Не ощущается ухудшения восприятия, если декодер выполняет высококачественное повторение (дублирование) спектра согласно изобретению. Perceptual degradation is not felt if the decoder performs high quality repetition (duplication) of the spectrum according to the invention. Отброшенные биты представляют выигрыш от кодирования при фиксированном качестве восприятия. The discarded bits represent the coding gain at a fixed perceptual quality. Альтернативно большее количество битов может быть выделено для кодирования информации полосы нижних частот при фиксированной скорости передачи, достигая, таким образом, более высокого качества восприятия. Alternatively, more bits can be allocated for encoding the lowband information at a fixed rate, thus achieving higher quality perception.

Настоящее изобретение постулирует, что усеченная последовательность гармоник может быть расширена на основании непосредственного соотношения между спектральными составляющими полосы нижних частот и полосы верхних частот. The present invention postulates that a truncated harmonic sequence can be extended based on the direct relation between the spectral components of the lowpass band and highpass band. Эта расширенная последовательность похожа на первоначальную в смысле восприятия, если выполняются определенные правила. This extended sequence similar to the original in terms of perception, if certain rules. Во-первых, экстраполированные спектральные составляющие должны быть гармонически связанными и усеченной последовательностью гармоник, чтобы избежать диссонансных искажений. Firstly, the extrapolated spectral components must be harmonically related to the truncated harmonic sequence and to avoid distortions of dissonance. Настоящее изобретение использует транспозицию как средство для процедуры спектрального дублирования, которая гарантирует удовлетворение этого критерия. The present invention uses transposition as a means for spectral overlap procedure that guarantees the satisfaction of this criterion. Однако для успешной работы нет необходимости, чтобы спектральные составляющие полосы нижних частот образовывали последовательность гармоник, поскольку новые дублированные составляющие, гармонически связанные с составляющими полосы нижних частот, не изменят шумоподобную или нестационарную природу сигнала. However, to be successful it is not necessary that the spectral components of lower frequency bands form a sequence of harmonics, as the new duplicate components, harmonically related to the components of the band of lower frequencies without changing the noise-like or non-stationary nature of the signal. Транспозиция определяется как перенос частичных тонов из одного положения на музыкальной шкале в другое при поддержании частотных отношений для этих частичных тонов. Transposition is defined as a transfer of partials from one position on a musical scale to another while maintaining the frequency ratios for these partials. Во-вторых, спектральная огибающая, т.е. Second, the spectral envelope, i.e. грубое распределение спектра дублированной полосы высоких частот, должна достаточно хорошо повторять такое распределение первоначального сигнала. coarse spectral distribution of the duplicated high frequency band shall well enough to repeat such a distribution of the original signal. Настоящее изобретение обеспечивает два режима работы, ДСП-1 и ДСП-2, которые отличаются способом регулировки огибающей спектра. The present invention provides two modes of operation, DSP-1 and DSP-2, which differ in the way the spectral envelope adjustment.

Первый режим дублирования спектральной полосы (ДСП-1), предназначенный для усовершенствования применений кодека среднего качества, является одноканальным процессом, который использует исключительно информацию, содержащуюся в принятом сигнале полосы нижних частот в декодере. The first mode overlapping spectral bands (DSP-1) adapted to improve the average quality codec applications, is a single-channel process, which uses only information contained in the received signal bandwidth lowpass in the decoder. Спектральная огибающая этого сигнала определяется и экстраполируется, например, с использованием полиномов совместно с набором правил или кодового справочника. The spectral envelope of this signal is determined and extrapolated, for instance using polynomials together with a set of rules or a codebook. Эта информация используется, чтобы непрерывно регулировать и выравнивать дублированную полосу верхних частот. This information is used to continuously adjust and equalize the duplexed highpass band. Способ ДСП-1 обеспечивает преимущество постобработки, т.е. Method DSP-1 provides the advantage of post-processing, i.e., не требуется никаких модификаций на стороне кодирования. It does not require any modifications to the encoding side. Владелец радиопередающей станции получит выигрыш в использовании каналов, или будет иметь возможность улучшения качества восприятия, или обеспечит комбинацию этих качеств. Owner will receive the radio transmitting station using the channel gains, or will be able to improve the perceptual quality, or provide a combination of these qualities. Существующий синтаксис и стандарт потока данных может быть использован без изменения. Existing data stream syntax and standards can be used without change.

Режим ДСП-2, предназначенный для усовершенствования применений кодека высокого качества, является двухканальным процессом, в котором в дополнение к передаваемому сигналу полосы нижних частот согласно режиму ДСП-1 кодируется и передается огибающая спектра полосы верхних частот. DSP-2 mode for improvement of high quality codec applications, is a dual process, in which in addition to the transmitted lowband signal according to the mode 1 CPD-encoded and transmitted spectral envelope of highband. Поскольку изменения огибающей спектра имеют гораздо меньшую скорость, чем изменения составляющих сигнала полосы верхних частот, то требуется передача только ограниченного объема информации, чтобы успешно представлять огибающую спектра. Since the spectral envelope changes are of much lower rate than the change in the signal components of the high band, then the transmission only requires a limited amount of information in order to successfully represent the spectral envelope. Режим ДСП-2 может быть использован для повышения эффективности существующих технологий кодирования-декодирования с минимальным изменением или без изменения существующих синтаксисов или протоколов и как весьма ценное средство для разработки будущих кодеков. DSP-2 mode can be used to enhance the effectiveness of existing encoding-decoding technologies with minimal or without modification of existing syntax or protocols, and as a very valuable tool for the development of future codecs.

Режимы ДСП-1 и ДСП-2 могут быть использованы для дублирования меньших полос пропускания полосы нижних частот, когда такие полосы исключаются кодером, как обусловлено психо-акустической моделью в условиях битовой недостаточности. Modes DSP-1 and DSP-2 can be used to replicate smaller passbands lowband when such bands are eliminated by the encoder as stipulated by the psycho-acoustic model under bit failure. Это приводит к улучшению качества восприятия путем спектрального дублирования в полосе нижних частот в дополнение к спектральному дублированию вне полосы нижних частот. This results in the perception of quality improvement by spectral overlap in the lower frequency band in addition to the spectral overlap is a low-pass band. Кроме того, режимы ДСП-1 и ДСП-2 могут быть также использованы в кодеках, использующих масштабирование скорости передачи, где качество восприятия сигнала в приемнике изменяется в зависимости от условий в канале передачи. Furthermore, modes DSP-1 and DSP-2 may also be used in codecs employing scaling rate where the signal quality of perception at the receiver varies depending on transmission channel conditions. Это обычно включает в себя изменения полосы пропускания аудиосигнала приемника. This usually involves changing audio receiver bandwidth. В этих условиях режимы ДСП могут быть успешно использованы для поддержания постоянной полосы верхних частот, что дополнительно улучшает качество восприятия. Under these conditions, chipboard modes could be successfully used to maintain a constant highband, which further improves the perceptual quality.

Настоящее изобретение работает на непрерывной основе, осуществляя дублирование содержимого сигналов любого типа, т.е. The present invention operates on a continuous basis by carrying out the duplication of content of any type of signals, i.e., тональных или нетональных (шумоподобных и сигналов переходных процессов). tonal or non-tonal (noise-like and transient signals). Кроме того, настоящий способ дублирования спектра создает точную по восприятию копию отброшенных полос из доступных полос частот в декодере. Furthermore, this method creates an exact duplicate of the spectrum on the perception of a copy of the discarded bands from available frequency bands at the decoder.

Следовательно, способ ДСП обеспечивает существенно более высокий уровень выигрыша от кодирования или улучшения качества восприятия по сравнению со способами, известными из предшествующего уровня техники. Consequently, the method provides substantially chipboard higher level of coding gain or perceptual quality improvement compared to methods known in the art. Это изобретение может быть использовано совместно со способами усовершенствования кодека, известного из предшествующего уровня техники; This invention can be used in conjunction with the methods of improving the codec of the prior art; однако от таких комбинаций не следует ожидать какого-либо повышения эффективности. However, from such combinations should not expect any increase in efficiency.

Способ ДСП включает следующие этапы: The method includes the steps of chipboard:

- кодирование сигнала, полученного из исходного сигнала, где частотные полосы сигнала удалены, причем это удаление выполнено до или во время кодирования, при котором формируется первый сигнал, - encoding of a signal obtained from the original signal, where frequency bands of the signal are removed, the removal is performed before or during the encoding, wherein the first signal is generated,

- транспозиция частотных полос первого сигнала во время или после декодирования, с формированием второго сигнала, - transposition of frequency bands of the first signal, during or after decoding, to form a second signal,

- выполнение подстройки огибающей спектра и - Performance tuning spectral envelope and

- комбинирование декодированного сигнала и второго сигнала для формирования выходного сигнала. - combining the decoded signal and the second signal to generate an output signal.

Полоса пропускания второго сигнала может быть установлена так, чтобы не перекрываться или частично пересекаться с полосой частот первого сигнала, и может быть установлена в зависимости от временных характеристик исходного сигнала и/или первого сигнала, или условий в канале передачи. Second signal transmission band can be set so as not to overlap or partly overlap with the first signal frequency band, and can be set depending on the temporal characteristics of the original signal and / or the first signal, or transmission channel conditions. Подстройка огибающей спектра выполняется на основании оценки исходной огибающей спектра упомянутого первого сигнала или передаваемой информации огибающей исходного сигнала. Spectral envelope adjustment is performed based on estimation of the original spectral envelope of said first signal or transmitted envelope information of the original signal.

Настоящее изобретение содержит два основных типа устройств транспозиции: многополосные устройства транспозиции и устройства транспозиции с прогнозированием с изменяющейся во времени схемой поиска, имеющие различные свойства. The present invention comprises two basic types of transposition devices: device multiband transposition and transposition device with prediction with varying time search circuit having different properties. Основная многополосная транспозиция может быть выполнена согласно настоящему изобретению следующим образом: The basic multiband transposition may be performed according to the present invention as follows:

- фильтрация сигнала, подлежащего транспонированию, посредством набора из N≥ 2 полосовых фильтров с полосами пропускания, содержащими частоты (f1,... ,fn), соответственно, для формирования сигналов N полос пропускания, - filtering the signal to be transposed through a set of N≥ 2 bandpass filters with passbands comprising the frequency (f1, ..., fn), respectively, for generating signals N passbands

- сдвиг сигналов полос пропускания по частоте в области, содержащие частоты M(f1,... ,fn), где М≠ 1 представляет коэффициент транспозиции, и - frequency shift signal bandwidths in the frequency regions containing M (f1, ..., fn), where M ≠ 1 is the transposition factor, and

- объединение сдвинутых сигналов полос пропускания с формированием транспонированного сигнала. - association shifted signal bandwidths with the formation of the transposed signal.

Как вариант, эта базовая многополосовая транспозиция может быть выполнена в соответствии с изобретением следующим образом: Alternatively, this basic mnogopolosovaya transposition may be performed in accordance with the invention as follows:

- полосовая фильтрация сигнала, подлежащего транспонированию, с использованием набора анализирующих фильтров или преобразователя, для генерирования низкочастотных сигналов действительных или комплексных субполос, - bandpass filtering the signal to be transposed, using a set of analysis filters or transmitter for generating low-frequency signals of real or complex subband,

- произвольное количество каналов k с упомянутого набора анализирующих фильтров или преобразователя подключаются к каналам Mk, где M≠ 1, в набор синтезирующих фильтров или преобразователе и - an arbitrary number of channels k of said set with analysis filters or the inverter connected to channels Mk, where M ≠ 1, in a set of synthesis filter or converter and the

- формируется транспонированный сигнал с использованием набора синтезирующих фильтров или преобразователя. - transposed signal is formed using a set of synthesis filter or converter.

Усовершенствованная многополосная транспозиция согласно настоящему изобретению включает в себя подстройки фазы, улучшающие характеристику базовой многополосной транспозиции. An improved multiband transposition according to the present invention includes adjusting the phase characteristic improving basic multiband transposition.

Транспозиция с прогнозированием с изменяющейся во времени схемой поиска согласно настоящему изобретению может быть выполнена следующим образом: Transposition with forecasting a time-varying search circuit according to the present invention can be performed as follows:

- обнаружение переходного процесса в первом сигнале, - detection of the transient in the first signal,

- определение, какой сегмент первого сигнала должен быть использован при дублировании частей первого сигнала в зависимости от результата обнаружения переходного процесса, - determining which segment of the first signal to be used when duplicating portions of the first signal depending on the result of detection of the transient,

- подстройка свойств вектора состояния и набора кодов в зависимости от результата обнаружения переходного процесса и - adjustment of the state vector and a set of properties of the codes depending on the detection result of the transition process and

- поиск точек синхронизации в выбранном сегменте первого сигнала на основе точки синхронизации, найденной при предыдущем поиске точки синхронизации. - search for synchronization points in chosen segment of the first signal based on the synchronization point found in the previous synchronization point search.

Способы ДСП и устройства согласно настоящему изобретению обеспечивают следующие качества: Methods chipboard and apparatus of the present invention provide the following traits:

1. Эти способы и устройства используют новые концепции избыточности сигнала в спектральной области. 1. These methods and devices use the new concepts of signal redundancy in the spectral domain.

2. Эти способы и сигналы применимы к произвольным сигналам. 2. These methods and signals applicable to arbitrary signals.

3. Каждый набор гармоник индивидуально создается и регулируется. 3. Each harmonic set is individually created and regulated.

4. Все дублируемые гармоники генерируются таким образом, чтобы сформировать продолжение существующей последовательности гармоник. 4. All duplicate harmonics are generated in such a way as to form a continuation of the existing harmonic sequence.

5. Процесс дублирования спектра основан на транспозиции и не создает никаких помех или создает незначительные помехи. 5. The process of duplication of the spectrum is based on transposition and creates no or interference creates a slight interference.

6. Дублирование спектра может обеспечить перекрытие множества меньших полос и/или широкий диапазон частот. 6. Duplicate the spectrum can provide a plurality of lower bands overlap and / or a wide frequency range.

7. В способе ДСП-1 обработка выполняется только на стороне декодера, т.е. 7. The method of EAF-1 processing is performed on the decoder side only, i.e. все стандарты и протоколы могут использоваться без изменений. all standards and protocols can be used without modification.

8. Способ ДСП-2 может быть использован в соответствии с большинством стандартов и протоколов без изменений или с минимальными изменениями. 8. A method DSP-2 may be used in accordance with most standards and protocols with no or minor modifications.

9. Способ ДСП-2 предоставляет проектировщику кодека новое мощное средство сжатия. 9. DSP-2 method offers the codec designer a new powerful compression tool.

10. Кодирование обеспечивает значительный выигрыш. 10. Coding provides a significant gain. Наиболее эффективное применение относится к совершенствованию различных типов низкоскоростных кодеков, таких как MPEG 1/2 Layer I/II/III (патент США 5.040.217), MPEG 2/4 AAC, Dolby AC-2/3, NTT Twin VQ (патент США 5.684.920), AT&T/Lucent РАС и т.д. The most effective application relates to the improvement of various types of low-rate codecs, such as MPEG 1/2 Layer I / II / III (U.S. Patent 5.040.217), MPEG 2/4 AAC, Dolby AC-2/3, NTT Twin VQ (U.S. 5.684.920), AT & T / Lucent PAC etc. Это изобретение также полезно для высококачественных речевых кодеков, таких как широкополосный CELP и SB-ADPCM G.722 и т.д. This invention is also useful for high-quality speech codecs such as wide band CELP and SB-ADPCM G.722 etc. для повышения качества восприятия. to improve the perception of quality. Вышеупомянутые кодеки широко применяются в мультимедиа, в телефонной промышленности, на Интернете, а также в профессиональных системах. The above codecs are widely used in multimedia, in the telephone industry, on the Internet, as well as in professional systems. Системы T-DAB (Наземная система цифрового звукового вещания) используют низкоскоростные протоколы, которые дают выигрыш в использовании каналов при применении настоящего способа или в повышении качества ЧМ и AM цифрового вещания. System T-DAB (Terrestrial Digital audio broadcasting system) use the low-speed protocols, which provide gain in the use of channels in the application of the present method, or improve the quality of FM and AM digital broadcasting. Спутниковые системы S-DAB могут получить значительный выигрыш ввиду высоких системных затрат от использования настоящего изобретения, чтобы увеличить количество каналов в мультиплексированной системе цифрового звукового вещания. Satellite S-DAB system can obtain a significant gain due to the high costs of using the system of the present invention to increase the number of channels multiplexed in a digital audio broadcasting. Кроме того, впервые поток аудиосигналов реального времени в полном диапазоне через Интернет доступен при использовании низкоскоростных телефонных модемов. In addition, the first real-time audio stream of the full range is available through the Internet using a low-speed telephone modems.

Краткое описание чертежей BRIEF DESCRIPTION OF DRAWINGS

Настоящее изобретение поясняется ниже на примерах его осуществления, не ограничивающих объем или сущность изобретения, со ссылками на чертежи, в которых показано следующее: The present invention is explained below by examples of its implementation, not limiting the scope or spirit of the invention, with reference to the drawings, in which:

Фиг.1 - схематичное представление ДСП в системе кодирования согласно настоящему изобретению; Figure 1 - schematic representation of the particle board in a coding system according to the present invention;

Фиг.2 - представление дублирования спектра верхних гармоник согласно настоящему изобретению; 2 - Introduction spectrum duplication upper harmonics according to the present invention;

Фиг.3 - представление дублирования спектра средних гармоник согласно настоящему изобретению; 3 - Introduction spectrum duplication secondary harmonics according to the present invention;

Фиг.4 - блок-схема варианта реализации во временной области устройства транспозиции согласно настоящему изобретению; 4 - block diagram of an embodiment of a time-domain transposition device according to the present invention;

Фиг.5 - блок-схема последовательности операций в рабочем цикле устройства транспозиции с прогнозированием схемы поиска; 5 - block diagram of a duty cycle in the transposition device predictive search pattern;

Фиг.6 - блок-схема последовательности операций при поиске точки синхронизации согласно настоящему изобретению; Figure 6 - a block diagram of a flowchart when searching a synchronization point according to the present invention;

Фиг.7а-7b - позиционирование кодовых наборов во время переходных процессов согласно настоящему изобретению; 7a-7b - positioning code set during transients according to the present invention;

Фиг.8 - блок-схема, иллюстрирующая применение нескольких устройств транспозиции во временной области во взаимосвязи с подходящим набором фильтров, для операции ДСП согласно настоящему изобретению; Figure 8 - is a block diagram illustrating the use of several devices transposition in the time domain in association with a suitable filterbank, for EAF operation according to the present invention;

Фиг.9а-9с - это блок-схемы, представляющие устройство для анализа и синтеза с использованием преобразования Фурье для короткого интервала времени ПФКВ, выполненное для генерации гармоник 2-го порядка согласно настоящему изобретению; 9a-9c - are block diagrams representing a device for analysis and synthesis using Fourier transform for a short time interval PFKV adapted for generating harmonics of order 2 of the present invention;

Фиг.10а-10b - это блок-схемы для одной субполосы с линейным сдвигом частоты в устройстве ПФКВ согласно настоящему изобретению; 10a-10b - is a block diagram for a subband with a linear frequency shift in PFKV device according to the present invention;

Фиг.11 - схема для одной субполосы с использованием фазоумножителя согласно настоящему изобретению; 11 - diagram for one subband using fazoumnozhitelya according to the present invention;

Фиг.12 - иллюстрация генерирования гармоник 3-го порядка согласно настоящему изобретению; Figure 12 - Vector generating harmonics of order 3 of the present invention;

Фиг.13 - иллюстрация генерирования гармоник 2-го и 3-го порядка согласно настоящему изобретению; Figure 13 - Vector generating harmonics of the 2nd and 3rd order according to the present invention;

Фиг.14 - иллюстрация генерирования неперекрывающейся комбинации нескольких гармонических рядов согласно настоящему изобретению; Figure 14 - Vector for generating non-overlapping combination of several harmonic series according to the present invention;

Фиг.15 - иллюстрация генерирования комбинации с чередованием нескольких гармонических рядов согласно настоящему изобретению; Figure 15 - Vector generating interleaved combination of several harmonic series according to the present invention;

Фиг.16 - иллюстрация генерирования широкополосных линейных сдвигов частот; Figure 16 - Vector generation broadband linear frequency shifts;

Фиг.17 - иллюстрация генерирования субгармоник согласно настоящему изобретению; Figure 17 - Vector generating subharmonics of the present invention;

Фиг.18а-18b - блок-схемы перцептуального кодека; 18a-18b - flowcharts perceptual codec;

Фиг.19 - базовая структура набора фильтров с максимальным прореживанием; 19 - basic structure filterbank with a maximum decimation;

Фиг.20 - иллюстрация генерирования гармоник 2-го порядка в наборе фильтров с максимальным прореживанием согласно настоящему изобретению; Figure 20 - Vector generating harmonics of order 2 in the set with a maximum decimation filter according to the present invention;

Фиг.21 - блок-схема усовершенствованной многополосной транспозиции в наборе фильтров с максимальным прореживанием для сигналов субполос согласно настоящему изобретению; 21 - a block diagram of the improved multiband transposition in a set of filters to a maximum decimation of subband signals according to the present invention;

Фиг.22 - блок-схема последовательности операций, представляющая усовершенствованную многополосную транспозицию в наборе фильтров с максимальным прореживанием для сигналов субполос согласно настоящему изобретению; 22 - a block diagram showing the improved multiband transposition in a set of filters with a maximum decimation of subband signals according to the present invention;

Фиг.23 - представление субполос и коэффициентов масштабирования для типового кодека; 23 - presentation of sub-bands and the scaling factors for a typical codec;

Фиг.24 - представление субполос и информации огибающей для режима ДСП-2 согласно настоящему изобретению; Figure 24 - Introduction subband and envelope information for DSP-2 mode according to the present invention;

Фиг.25 - иллюстрация скрытой передачи информации огибающей в режиме ДСП-2 согласно настоящему изобретению; Figure 25 - Vector secure communication envelope DSP-2 mode according to the present invention;

Фиг.26 - иллюстрация избыточного кодирования в режиме ДСП-2 согласно настоящему изобретению; Figure 26 - Vector excess encoding DSP-2 mode according to the present invention;

Фиг.27 - вариант выполнения кодека с использованием способа ДСП-1 согласно настоящему изобретению; 27 - embodiment of the codec method using DSP-1 according to the present invention;

Фиг.28 - вариант выполнения кодека с использованием способа ДСП-2 согласно настоящему изобретению; Fig.28 - embodiment of a codec using the method DSP-2 according to the present invention;

Фиг.29 - блок-схема "псевдостерео" генератора согласно настоящему изобретению. Figure 29 - a block diagram of a "pseudo" generator according to the present invention.

Описание предпочтительных вариантов осуществления DESCRIPTION OF PREFERRED EMBODIMENTS

При описании вариантов осуществления особый акцент сделан на задачах исходного кодирования естественного аудиосигнала. In describing embodiments of special emphasis on the problems of natural audio source coding. Однако следует иметь в виду, что настоящее изобретение применимо к целому диапазону задач исходного кодирования, отличающихся от задач кодирования и декодирования аудиосигналов. However, it should be borne in mind that the present invention is applicable to a wide range of source coding tasks differing from the tasks of encoding and decoding audio signals.

Основы транспозиции Fundamentals of transposition

Транспозиция, как определено согласно настоящему изобретению, является идеальным способом спектрального дублирования и имеет ряд важных преимуществ по сравнению с предшествующим уровнем техники, в том числе не требуется детектирования основного тона, достигается одинаково высококачественная характеристика для однотонного и полифонического программного материала, и транспозиция реализуется одинаково хорошо для тональных и не тональных сигналов. Transposition as defined according to the present invention, is the ideal method of spectral overlap and has several important advantages over the prior art, including those not required detection pitch is achieved equally high quality characteristic for monophonic and polyphonic program material, and transposition is realized equally well for the tone and tone. В противоположность другим способам транспозиция согласно изобретению может быть использована в системах исходного кодирования произвольных аудиосигналов для сигналов произвольного типа. In contrast to other methods of transposition according to the invention can be used in systems source coding arbitrary audio signals for arbitrary signal types.

Коэффициент М точной транспозиции дискретного по времени сигнала х(n) в форме суммы косинусов с изменяющимися по времени амплитудами определяется соотношением Exact transposition factor M of a discrete time signal x (n) in the form of a sum of cosines with time varying amplitudes determined by the relation

Figure 00000002

Figure 00000003

где N - количество синусоид, здесь в дальнейшем определяемые как частичные тона, f i , е i (n), α i - индивидуальные входные частоты, временные огибающие и фазовые константы, соответственно, β i - произвольные выходные фазовые константы, а f s - частота дискретизации, и О≤ Мf i ≤ f s /2. where N - number of sinusoids is further defined as partial tones, f i, e i (n), α i - individual input frequencies, time envelopes and phase constants respectively, β i - arbitrary output phase constants and f s - sampling frequency and O≤ Mf i ≤ f s / 2.

Фиг.2 иллюстрирует генерацию гармоник М-го порядка, где М это целое число ≥ 2. Термин "гармоники М-го порядка" использован для упрощения, хотя этот процесс генерирует гармоники М-го порядка для всех сигналов в определенном диапазоне частот, которые в большинстве случаев сами являются гармониками неизвестного порядка. 2 illustrates the generation of harmonics of order M, where M is an integer ≥ 2. The term "harmonic M-th order" is used for simplicity, albeit the process generates Mth harmonic order for all signals in a certain frequency range, in which most cases are themselves harmonics of unknown order. Входной сигнал, представленный в частотной области Х(f) ограничен полосой 201 до диапазона от 0 до f max . The input signal represented in the frequency domain X (f) is limited to 201 to strip the range 0 to f max. Содержимое сигналов в диапазоне от f max /М до Qf max /M, где Q является желаемым коэффициентом расширения ширины полосы 1<Q≤ М, выделяется посредством полосового фильтра с формированием полосового сигнала 203 со спектром Х вр (f). The contents of signals in the range f max / M to Qf max / M, where Q is the desired bandwidth expansion factor 1 <Q≤ M is allocated through the band pass filter to form the signal band 203 with spectrum X BP (f). Этот полосовой сигнал транспонируется с коэффициентом М, формируя второй полосовой сигнал 205 со спектром Х т (f), перекрывающим диапазон от f max до Qf max . This bandpass signal is transposed a factor M, forming a second bandpass signal with spectrum X 205 m (f), the overlapping range f max to Qf max. Огибающая спектра этого сигнала регулируется с помощью программно-упраляемого эквалайзера, формируя сигнал 207 со спектром Х E (f). The envelope of the spectrum of this signal is adjusted by means of software with an escape-equalizer, forming a signal with spectrum X 207 E (f). Этот сигнал затем комбинируется с задержанной версией входного сигнала, чтобы компенсировать задержку, вызванную полосовым фильтром и устройством транспонирования, посредством чего формируется выходной сигнал 209 со спектром Y(f), покрывающий диапазон от 0 до Qf max . This signal is then combined with a delayed version of the input signal to compensate for the delay caused by the bandpass filter and the transposition device, whereby an output signal 209 with spectrum Y (f), covering the range 0 to Qf max. Как вариант, выделение полосы частот может быть выполнено после транспозиции М с использованием частот отсечки f mах и Оf max . Alternatively, the bandwidth allocation may be performed after the transposition M, using cut-off frequencies f max and ° F max. При использовании множества устройств транспозиции возможна, конечно, одновременная генерация различных гармонических рядов. When using multiple transposition devices can, of course, simultaneous generation of different harmonic series. Вышеприведенная схема также может быть использована для "заполнения" полос заграждения во входном сигнале, как показано на фиг.3, где входной сигнал имеет полосу заграждения 301 от f 0 до Qf 0 . The above scheme may also be used to "fill in" stop band of the input signal, as shown in Figure 3, where the input signal has a stopband 301 from f 0 to Qf 0. Полоса частот [f 0 /М, Qf 0 /M], затем выделяется (303), транспонируется с коэффициентом М до [f 0 , Qf 0 ] (305), подстраивается по огибающей (307) и объединяется с задержанным входным сигналом, формируя выходной сигнал 309 со спектром Y(f). The frequency band [f 0 / M, Qf 0 / M], is then separated (303), transposed a factor M to [f 0, Qf 0] (305) is arranged on the envelope (307) and combined with the delayed input signal forming output signal 309 with spectrum Y (f).

Может быть использована аппроксимация точной транспозиции. approximation exact transposition may be used. Согласно настоящему изобретению качество таких аппроксимаций определяется с использованием теории диссонанса. According to the present invention, the quality of such approximations is determined using dissonance theory. Критерий для диссонанса представлен в работе "Tonal Consonance and Critical Bandwidth" R.Plomp, WJM Levelt JASA, Vol.38, 1965 г. и заключается в том, что два частичных тона рассматриваются как диссонантные, если разность частот находится в пределах примерно от 5 до 50% ширины полосы критической полосы частот, в которой находятся эти частичные тоны. A criterion for dissonance is presented in "Tonal Consonance and Critical Bandwidth" R.Plomp, WJM Levelt JASA, Vol.38, 1965 G. & lies in the fact that two of the partial tones are considered as dissonant if the frequency difference is within approximately 5 to 50% of the width of the critical band frequency bands in which these partial tones. Критическая ширина полосы для данной частоты может быть приближенно определена соотношением The critical bandwidth for a given frequency can be approximately determined by the relation

Figure 00000004

с f и cb в герцах. with f and cb in Hz. Кроме того, в вышеупомянутой работе утверждается, что органы слуха человека не могут разделить два частичных тона, если они отличаются по частоте на величину меньшую, чем приблизительно 5 процентов критической ширины полосы, в которой они находятся. Furthermore, in the aforementioned paper states that the human auditory organs can not separate the two partial tone if they differ in frequency by less than about 5 percent of the critical bandwidth in which they are located. Точная транспозиция в уравнении (2) аппроксимируется с помощью The exact transposition in Eq (2) can be approximated using

Figure 00000005

где f - отклонение от точной транспозиции. where f - deviation from the exact transposition. Если входные частичные тоны образуют гармонический ряд, гипотеза настоящего изобретения утверждает, что отклонения от гармонического ряда транспонируемых частичных тонов не должны превышать пяти процентов от критической ширины полосы, в которой они находятся. If the input partial tones form a harmonic series, a hypothesis of the invention states that the deviations from the harmonic series transposed partials must not exceed five percent of the critical bandwidth in which they are located. Это могло бы объяснить, почему способы, известные из предшествующего уровня техники, дают неудовлетворительные "грубые" результаты, поскольку широкополосные линейные сдвиги частот создают гораздо большее отклонение, чем допустимо. This could explain why the methods known in the art, give unsatisfactory "harsh" results as broadband linear frequency shifts create a much larger deviation than acceptable. Когда способы, известные из предшествующего уровня техники, формируют более одного частичного тона для только одного входного частичного тона, эти частичные тона должны, тем не менее, находиться в пределах установленного предела отклонений, чтобы восприниматься как один частичный тон. When the methods known in the art, form more than one partial for only one pitch input partial tones, these partial tone must nevertheless be within the set limit deviations to be perceived as one partial tone. Это еще раз объясняет неудовлетворительные результаты, получаемые в способах, известных из предшествующего уровня техники, использующих нелинейности и т.п., поскольку они формируют интермодуляционные частичные тона, не входящие в пределы отклонений. This again explains the poor results obtained in the methods of the prior art using nonlinearities etc, since they form a partial intermodulation tones outside the limits of deviations.

При использовании вышеприведенного способа дублирования спектра на основе транспозиции согласно настоящему изобретению достигаются следующие важные свойства. When using the above method, the duplication of the spectrum on the basis of the transposition according to the present invention the following important properties are achieved.

- Не происходит никакого перекрытия в частотной области между дублированными гармониками и существующими частичными тонами. - there had been no overlap in the frequency domain between the duplicated harmonic and existing partial tones.

- Дублированные частичные тоны являются гармониками частичных тонов входного сигнала и не приводят к увеличению диссонанса или искажений. - Duplicated partial tones are input harmonic partials and do not lead to an increase in distortion or dissonance.

- Огибающая спектра дублированных гармоник образует плавное продолжение огибающей спектра входного сигнала, соответствуя по восприятию исходной огибающей. - spectral envelope duplicate harmonics forms a smooth continuation of the input signal spectral envelope, perceptually matching the original envelope.

Транспозиция на основе прогнозирования с изменяющейся по времени схемой поиска Transposition based on forecasting the changing time search circuit

Существуют различные способы создания требуемых устройств транспозиции. There are various ways to create the required transposition devices. Типовые реализации во временной области расширяют сигнал по времени путем дублирования сегментов сигнала на основании периода основного тона. Typical implementation of the time domain signal is expanded in time by duplicating signal segments based on the pitch period. Этот сигнал последовательно считывается с разными скоростями. This signal is sequentially read at different speeds. К сожалению, такие способы сильно зависят от обнаружения основного тона и требуют точного временного сопряжения сегментов сигнала. Unfortunately, such methods strongly depend on the detection of pitch and require accurate time signal coupling segments. Кроме того, необходимость работы с сегментами сигнала на базе периода основного тона делает их чувствительными к переходным процессам. Furthermore, the need to work with signal segments based on pitch period makes them sensitive to transients. Поскольку обнаруженный период основного тона может быть намного длине, чем действительный переходной процесс, очевиден риск дублирования полного переходного процесса вместо простого расширения его по времени. Since the detected pitch period can be much longer than the actual transient, the risk is obvious duplication full transient process rather than simply extending his time. Другой тип алгоритмов во временной области реализует временное расширение/сжатие речевого сигнала с использованием прогнозирования схемы поиска выходного сигнала (см."Pattern Search Prediction of Speech" R.Bogner, T.Li, Proc.ICASSP'89, Vol.1, May 1989, "Time-Scale Modification of Speech based on a nonlinear Oscillator Model" G.Kubin, WBKleijn, IEEE, 1994). Another type of time domain algorithms to implement temporary expansion / compression of the speech signal using the prediction output signal search circuit (see. "Pattern Search Prediction of Speech" R.Bogner, T.Li, Proc.ICASSP'89, Vol.1, May 1989 , "Time-Scale Modification of Speech based on a nonlinear Oscillator Model" G.Kubin, WBKleijn, IEEE, 1994). Это является формой гранулярного синтеза, в котором входной сигнал делится на маленькие части, гранулы, используемые для синтезирования выходного сигнала. This is a form of granular synthesis, where the input signal is divided into small parts, granules, used for synthesizing the output signal. Этот синтез обычно производится путем выполнения корреляции сегментов сигнала, чтобы определить лучшие точки стыковки. This synthesis is usually done by performing correlation of signal segments in order to identify the best point connections. Это означает, что сегменты, используемые для формирования выходного сигнала, не зависят от периода основного тона и таким образом, не требуется решать нетривиальную задачу обнаружения основного высоты тона. This means that the segments used to form the output signal are not dependent on the pitch period and thus not required to solve non-trivial task of pitch detection height. Тем не менее, в этих способах остаются проблемы с быстро меняющимися амплитудами сигнала, и при необходимости обеспечения высококачественной транспозиции растут требования к вычислениям. However, in these methods, there are problems with rapidly changing signal amplitudes, and the need to ensure high-quality transposition grow to computing requirements. Изобретение представляет усовершенствованное устройство сдвига основного тона и транспонирования во временной области, где использование обнаружения переходного процесса и динамических параметров системы создают более точную транспозицию для высоких коэффициентов транспозиции как для стационарных (тональных и нетональных), так и переходных звуков при низких вычислительных затратах. The invention provides an improved shifter and a pitch transposition in the time domain, where the use of transient detection and dynamic system parameters produces a more accurate transposition for high transposition factors for both stationary (tonal and non-tonal) and transient sounds at low computational cost.

На фиг.4 показаны следующие модули: детектор переходных процессов 401, регулятор положения окна 403, генератор набора 405, селектор сигналов синхронизации 407, память положения синхронизации 409, устройство оценки минимальной разности 411, память выходного сегмента 413, блок смешивания 415 и устройство дискретизации с пониженной частотой 417. Входной сигнал подается как на генератор набора 405, так и на детектор переходных процессов 401. Если переходной процесс обнаружен, то информация о его положении посылается в модуль положения окна 403. Этот модуль уста 4 illustrates the following modules: a transient detector 401, a window position adjuster 403, a set generator 405, a synchronization signal selector 407, a synchronization position memory 409, a minimum difference estimator 411, an output segment memory 413, the mixing unit 415 and the sampling device with low frequency 417. the input signal is applied to both the generator set 405 and the detector 401. If a transient transient is detected, the information about its position is sent to the window position module 403. This module mouth навливает размер и положение окна, которое умножается на входной сигнал при создании набора кодов. navlivaet window size and position, which is multiplied by the input signal to create a set of codes. Генератор набора кодов 495 приминает данные положения синхронизации от модуля выделения данных синхронизации 407, при условии что он соединен с другим устройством транспозиции. The generator set of codes 495 crush position data synchronization from the synchronization module 407 data allocation, with the proviso that it is connected with another device transposition. Если данные положения синхронизации имеются в наборе кодов, то они используются и вырабатывается выходной сегмент. If the synchronization position data are a set of codes, they are used, and produces an output segment. В противном случае набор кодов посылается в устройство оценки минимальной разности 411, который выдает новое положение синхронизации. Otherwise, the set of codes is sent to the minimum difference estimator 411 which outputs a new synchronization position. Новый выходной сегмент присоединяется к окну вместе с предшествующим выходным сегментом в модуле смешивания 415 и затем дискретизируется в модуле 417. The new output segment is attached to the window together with the previous output segment in the mix module 415 and subsequently sampled in module 417.

Для пояснения вводится представление области состояний. To explain the idea introduced state area. Здесь векторы состояния или гранулы представляют входной и выходной сигналы. Here, the state vectors, or granules are input and output signals. Входной сигнал представлен вектором состояний х(n): The input signal is represented by a vector of states x (n):

Figure 00000006

который получен из N задержанных выборок входного сигнала, где N - размерность вектора состояния, a D - задержка между входными выборками, используемыми для построения вектора. which is obtained from N delayed samples of the input signal, where N - the dimension of the state vector, a D - the delay between the input samples used to build the vector. Гранулярное отражение дает выборку х(n) соответственно каждому вектору состояния x(n-1). Granular reflection gives sample x (n) corresponding to each state vector x (n-1). В результате получаем уравнение (6), где а(* ) - отображение: As a result, we obtain the equation (6), where a (x) - Display:

Figure 00000007

В настоящем способе гранулярное отображение используется для определения следующего выходного результата на основании предыдущего выходного результата, используя набор кодов переходов состояний. In the present method, granular mapping is used to determine the next output based on the result of the previous output result, using a set of state transition of codes. Набор кодов длины L постоянно перестраивается, включая векторы состояния и следующую выборку, следующую за каждым вектором состояния. Set of L length codes continuously rearranged, including the state vectors and the next sample following each state vector. Каждый вектор состояния отделяется от соседнего К выборками; Each state vector is separated from the adjacent K samples; это позволяет системе регулировать временное разрешение в зависимости от характеристик текущего обрабатываемого сигнала, где К, равное единице, представляет наилучшую разрешающую способность. This allows the system to adjust the time resolution depending on the current characteristics of the processed signal, where K is equal to one, it is the best possible resolution. Сегмент входного сигнала, используемый для построения набора кодов, выбирается на основании положения возможного переходного процесса и положения синхронизации в предыдущем наборе кодов. input signal segment used to build a set of codes, selected based on the position of a possible transient and the synchronization position in the previous set of codes.

Это означает, что отображение а(* ), теоретически, оценивается для всех переходов, включенных в набор кодов This means that the mapping a (*), theoretically, is evaluated for all transitions included in the set of codes

Figure 00000008

C этим набором кодов переходов новый выходной результат у(n) вычисляется поиском вектора состояния в наборе кодов, наиболее сходного с текущим вектором состояния у(n-1). C this set of code transitions in the output of the new (n) is computed state vector search in a set of codes, most similar to the current state vector y (n-1). Этот поиск ближайшего соседа выполняется вычислением минимальной разности и дает новую выходную выборку This search for the closest neighbor is carried out by calculating the minimum difference and gives the new output sample

Figure 00000009

Однако система не ограничивается работой на базе выборок, она предпочтительно работает на базе сегментов. However, the system is not limited to work on the basis of samples, it is preferably operated on the basis of segments. Новый выходной сегмент вводится в окно и суммируется, смешивается с предыдущим выходным сегментом и затем дискретизируется. The new output segment is introduced into the box and added, mixed with the previous output segment and then sampled. Коэффициент шага транспозиции определяется отношением длины входного сегмента, представленной набором кодов, и длины выходного сегмента, считанной с набора кодов. pitch transposition factor is determined by the ratio of the input segment length represented by a set of codes, and the output segment length read out from the code set.

На фиг.5 и 6 представлены блок-схемы, показывающие цикл работы устройства транспонирования. 5 and 6 are block diagrams showing the transposition device operating cycle. Этап 501 представляет ввод данных; Step 501 is input; на этапе 503 производится детектирование переходного процесса на сегменте входного сигнала; at step 503, detection is made on the transition process of the input signal segment; поиск переходных процессов выполняется на длине сегмента, равной длине выходного сегмента. search for transients is performed on a segment length equal to the length of the output segment. Если на этапе 505 найден переходный процесс, то на этапе 507 положение переходного процесса записывается и параметры L (представляющий длину набора кодов), К (представляющий расстояние между векторами состояния в квантах) и D (представляющий задержку между квантами в каждом векторе состояния) устанавливаются на этапе 509. Положение переходного процесса сравнивается с положением предыдущего выходного сегмента на этапе 511, чтобы определить, был ли обработан этот переходной процесс. If in step 505 found the transition process, then in step 507 the position of the transient is recorded and the parameters L (representing the code sets of length), K (representing the distance between the state vectors in quanta) and D (representing the delay between the quanta in each state vector) are mounted on step 509. the position of the transient is compared with the position of the previous output segment in step 511, to determine the transient whether processed. При положительном результате проверки на этапе 513 положение набора кодов (окно L) и параметры К, L и D устанавливаются на этапе 515. После установки необходимых параметров, на основании результата обнаружения переходного процесса, происходит поиск новой синхронизации или точки сопряжения (этап 517). If a positive result of check at step 513 the position codes set (L window) and parameters K, L and D are set in step 515. After setting the required parameters, based on a detection result of the transition, there is a search of a new pairing or synchronization points (step 517). Эта процедура показана на фиг.6. This procedure is shown in Figure 6. Сначала на этапе 601 новая точка синхронизации вычисляется на основании предыдущей согласно соотношению First, in step 601, a new synchronization point is calculated based on the previous according to the relation

Figure 00000010

где Where

Figure 00000011
и and
Figure 00000012
- есть новое и старое положения синхронизации, соответственно, S - длина обрабатываемого входного сегмента и М - коэффициент транспозиции. - have new and old synchronization positions respectively, S - length of the input segment being processed, and M - a transposition factor. Точка синхронизации используется для сравнения точности новой точки сопряжения с точностью старой точки сопряжения на этапе 603. Если на этапе 605 установлено, что соответствие такое же или лучше, чем предыдущее, то эта новая точка синхронизации выдается на этапе 607 при условии, что она находится внутри набора кодов. the synchronization point is used to compare the accuracy of the new interface to an accuracy of the old point of interface at step 603. If at step 605 determined that the matching is the same or better than the previous one, this new synchronization point is issued at step 607, provided that it is within the dialing codes. Если нет, то осуществляется поиск новой точки синхронизации в цикле 609. Это выполняется аналогичным образом, в данном случае с функцией минимальной разности (611), однако, возможно также использовать корреляцию во временной или в частотной области. If not, then a new search is performed in a cycle synchronization point 609. This is performed in a similar manner, in this case with a minimum difference function (611), however, also possible to use correlation in the time or frequency domain. Если на этапе 613 определено, что это положение дает лучшее соответствие, чем предыдущее найденное положение, то положение синхронизации запоминается на этапе 615. Когда все положения проверены (этап 617), система возвращается (619) к процедуре согласно блок-схеме на фиг.5. If at step 613 it is determined that this position gives a better match than the previous position found, the position of synchronization is memorized at step 615. When all positions are checked (step 617), the system returns (619) according to the procedure of the flowchart of Figure 5 . Новая полученная точка синхронизации запоминается на этапе 519, и новый сегмент считывается из набора кодов на этапе 521, начинающегося с данной точки синхронизации. The new synchronization point obtained is stored at step 519 and a new segment is read from the code set in step 521, starting with the given synchronization point. Этот сегмент добавляется к окну и прибавляется к предыдущему на этапе 523, квантуется с коэффициентом транспозиции на этапе 525 и запоминается в выходном буфере на этапе 527. This segment is added to the window and added to the previous, in step 523, quantized coefficient transposition in step 525 and stored in the output buffer at step 527.

Фиг.7 иллюстрирует режим работы системы в условиях переходного процесса, приминая во внимание положение набора кодов. 7 illustrates the operation of the system during the transition process, flattening into account the position of the set of codes. Перед переходным процессом набор кодов 1, представляющих входной сегмент 1, установлен "слева" от сегмента 1. Сегмент корреляции 1 представляет часть предшествующего выходного результата и исполняется для нахождения точки синхронизации 1 в наборе кодов 1. Когда переходный процесс обнаружен и точка переходного процесса обработана, набор кодов перемещается согласно фиг.7 и остается стационарным, пока текущий обрабатываемый входной сегмент снова не станет "справа" в наборе кодов. Before the transient code set 1 representing the input segment 1 is set to "left" of segment 1. Correlation segment 1 represents a part of an output result of the prior and executed in order to find synchronization point 1 in a set of codes 1. When the transient is detected and the point of the transient is processed, a set of codes is moved according to 7 and remain stationary until the input segment currently being processed again become a "right" in a set of codes. Это делает невозможным дублирование переходного процесса, поскольку системе не позволено искать точки синхронизации до переходного процесса. This makes it impossible to duplicate the transient since the system is not allowed to search for synchronization points prior to the transient.

Большинство устройств транспозиции основного тона или устройств расширения по времени, основанных на прогнозе схемы поиска, дают удовлетворительные результаты для речи и однотонных сигналов. Most devices transposition pitch or expansion devices in time based on the search pattern prediction give satisfactory results for speech and single-tone signals. Однако их характеристики быстро ухудшаются для сигналов высокой сложности, таких как музыка, особенно при больших коэффициентах транспозиции. However, their characteristics are deteriorating rapidly for high complexity signals, like music, especially at high rates of transposition. Настоящее изобретение предлагает несколько решений для улучшенных характеристик, дающих хорошие результаты для сигналов любого типа. The present invention provides several solutions for improved performance, giving good results for the signals of any type. В противоположность другим решениям эта система изменяется по времени и параметры системы основаны на свойствах входного сигнала и параметрах, используемых на предыдущем рабочем цикле. In contrast to other solutions, the system changes over time and the system parameters are based on input signal properties and parameters used in the previous operation cycle. Использование детектора переходного процесса управляющего не только размером набора кодов и положением, но также и свойствами включенных векторов состояния, является надежным и эффективным с точки зрения вычислений способом, чтобы избежать ухудшения звука для быстро изменяющихся сегментов сигнала. Using transient detector controlling not only the size of the process set of codes and the position, but also the properties of the incorporated state vectors, it is reliable and efficient in terms of computation way to avoid deterioration of the sound to rapidly changing signal segments. Кроме того, не требуется изменение длины обрабатываемого сегмента сигнала, которое потребовало бы дополнительных вычислений. Also, do not want to change the length of the signal segment being processed, which would require additional calculations. Настоящее изобретение использует усовершенствованный поиск набора кодов, основанный на результатах предшествующего поиска. The present invention uses an advanced search for a set of codes based on the results of the earlier search. Это означает, что в отличие от обычной корреляции двух сегментов, как делается обычно в системах обработки во временной области, основанных на прогнозе схемы поиска, сначала проверяются наиболее подходящие положения синхронизации вместо проверки всех положений последовательно. This means that unlike ordinary correlation of two segments as is usually done in systems processing in the time domain, based on the forecast of the search pattern, are first checked most appropriate synchronization position instead of checking all positions consecutively. Этот новый способ для сокращения поиска набора кодов значительно снижает вычислительную сложность системы. This new way to reduce the search set of codes significantly reduces the computational complexity of the system. Кроме того, при использовании нескольких устройств транспозиции информация о положении синхронизации может быть совместно использована этими устройствами транспозиции для дополнительного снижения вычислительной сложности, как показано в последующих применениях. Furthermore, when using multiple transposition position information synchronizing device may be shared by these transposition devices to further reduce the computational complexity, as shown in the following applications.

Устройства транспозиции во временной области, как объяснялось выше, используются для реализации систем ДСП-1 и ДСП-2 согласно следующему примеру, иллюстративному, но не ограничивающему. Devices transposition in the time domain, as explained above, used to implement the DSP-1 and DSP-systems 2 according to the following example, an illustrative, but not limiting. На фиг.8 использованы три модуля расширения по времени, чтобы генерировать гармоники второго, третьего и четвертого порядка. 8 uses three expansion unit time to generate the second harmonic, third and fourth order. Поскольку в этом примере каждое расширение во временной области/устройство транспозиции работает с использованием широкополосного сигнала, выгодно регулировать огибающую спектра исходного диапазона частот до транспозиции, учитывая, что не будет средства для того, чтобы выполнить это после транспозиций без добавления отдельной системы эквалайзера. Since, in this example, each time domain expansion / transposition device operates using a wideband signal, it is advantageous to adjust the spectral envelope of the source frequency range prior to transposition, considering that there is no means to accomplish this after the transpositions, without adding a separate equalizer system. Регуляторы огибающей спектра 801, 803 и 805 каждый работает на нескольких каналах набора фильтров. Regulators spectral envelope 801, 803 and 805 each running on several channels the filter set. Усиление каждого канала в регуляторах огибающей должно быть установлено так, чтобы сумма, 813, 815, 817 на выходе, после транспозиции, давала бы желаемую огибающую спектра. Gain of each channel in the envelope adjusters must be set so that the sum, 813, 815, 817 at the output, after transposition, would give the desired spectral envelope. Устройства транспонирования 807, 809 и 811 взаимно соединены, чтобы совместно использовать информацию о положении данных синхронизации. transposition devices 807, 809 and 811 are interconnected to share synchronization position information data. Это основано на том факте, что при определенных условиях будет иметь место высокая корреляция между положениями синхронизации, найденными в наборе кодов во время корреляции в отдельных блоках транспозиции. This is based on the fact that under certain conditions there will be a high correlation between the synchronization positions found in the set of codes during correlation in the separate blocks transposition. Предложим, в качестве примера, без каких-либо ограничений объема этого изобретения, что устройство транспозиции гармоник четвертого порядка работает на основе временного интервала, равного половине интервала устройства транспозиции гармоник второго порядка, но с рабочим циклом в два раза большим. Propose, as an example, without any limitations on the scope of this invention that the device of the fourth order harmonic transposition works based on a time interval equal to half unit interval second-order harmonic transposition, but with a duty cycle twice as large. Предположим далее, что наборы кодов, используемые для этих двух устройств расширения, те же самые и что положения синхронизации этих двух устройств расширения во временной области обозначены как Assume further that the code sets used for these two expansion devices are the same and that the synchronization positions of the two extension units in the time domain indicated as

Figure 00000013
и and
Figure 00000014
соответственно. respectively. Это дает следующее соотношение: This gives the following relationship:

Figure 00000015

где Where

Figure 00000016

a S - это длина входного сегмента, представленного набором кодов. a S - is the input segment length represented by a set of codes. Это действительно до тех пор, пока ни один из указателей положения синхронизации не достигнет конца набора кодов. It really is as long as neither of the synchronization position pointers reaches the end of a set of codes. При нормальной работе n возрастает на единицу для каждого временного кадра, обработанного устройством транспозиции гармоник второго порядка, и когда неизбежно будет достигнут конец набора кодов любым из указателей, счетчик n устанавливается на n=0, и During normal operation n is increased by one for each time-frame processed by the second order transposition device harmonics, and when the end of dialing codes inevitably be achieved by any of the pointers, the counter n is set to n = 0, and

Figure 00000017
и and
Figure 00000018
вычисляются индивидуально. calculated individually. Подобные результаты получаются для устройства транспозиции гармоник третьего порядка при присоединении к устройству транспозиции гармоник четвертого порядка. Similar results are obtained for the device of the third order harmonic transposition when attached to the device of the fourth order harmonic transposition.

Представленное выше использование нескольких взаимно соединенных устройств транспозиции во временной области, для создания гармоник высшего порядка, приводит к существенному уменьшению объема вычислений. The above use of several interconnected devices to create a higher order harmonic transposition in the time domain leads to a substantial reduction in the amount of computation. Кроме того, предложенное использование устройств транспозиции во временной области в соединении с соответствующим набором фильтров предоставляет возможность регулировки огибающей создаваемого спектра при обеспечении простоты и низких вычислительных затрат устройств транспозиции во временной области, поскольку эти устройства, более или менее, могут быть выполнены с использованием арифметики с фиксированной точкой и исключительно операций сложения/вычитания. Furthermore, the proposed use of transposition device in a time domain in conjunction with an appropriate set of filters provides the ability to adjust the envelope of the created spectrum while ensuring simplicity and low computational cost transposition device in a time domain, since these devices are more or less, may be implemented using arithmetic fixed point and only adding / subtracting operations.

Другие, иллюстративные, но не ограничивающие, примеры, соответствующие настоящему изобретению, таковы: Other, illustrative but not limiting, examples of the present invention are:

- использование устройства транспозиции во временной области в каждом поддиапазоне в наборе фильтров поддиапазона, уменьшая, таким образом, сложность сигнала для каждого устройства транспозиции; - use of the device in the time domain transposition in each subband in the set of subband filter bank, thus reducing the signal complexity for each transposition device;

- использование устройства транспозиции во временной области в соединении с устройством транспозиции в частотной области, позволяя, таким образом, системе использовать разные способы для транспозиции в зависимости от характеристик обрабатываемого входного сигнала; - the use of transposition device in a time domain in conjunction with the transposition device in a frequency domain, allowing thus the system to use different methods for transposition depending on the characteristics of the processed input signal;

- использование устройства транспозиции во временной области в широкополосном речевом кодеке, работающем, например, на остаточном сигнале, полученном после линейной экстраполяции. - the use of transposition device in a time domain in a wideband speech codec, operating, for example, the residual signal obtained after linear extrapolation.

Следует иметь в виду, что описанный выше в общих чертах способ может быть выгодно использован только для модификаций временного масштаба простым исключением преобразования скорости стробирования. It should be borne in mind that in the above-described general method can be advantageously used only for simple modifications of the time scale transformation except gating rate. Кроме того, понятно, что хотя этот описанный в общих чертах способ фокусируется на транспозиции основного тона в сторону более высокого основного тона, т.е. Furthermore, it is understood that although described in the general method focuses on pitch transposition to a higher pitch, i.e. на расширении по времени, одни и те же принципы применяются при транспозиции в сторону более низкого основного тона, т.е. for expanding the time, the same principles apply to the transposition to a lower pitch, i.e. сжатии по времени, как очевидно для специалистов в данной области техники. compression of time, as will be apparent to those skilled in the art.

Транспозиция на основе набора фильтров Transposition based on a set of filters

Ниже описаны различные новые способы транспозиции на основе набора фильтров. The following list describes new ways of transposition on the basis of a set of filters. Сигнал, подлежащий транспозиции, делится на ряд полосовых сигналов или поддиапазонов. Signal to be transposition is divided by the number of band signals or subbands. Сигналы субполос затем транспонируются, точно или приближенно, что реализуется путем соединения субполос анализа и синтеза, здесь в дальнейшем называемого "Склеиванием". subband signals are then transposed, exact or approximately, which is realized by combining the subband analysis and synthesis, are hereinafter called "bonding". Этот способ сначала демонстрируется с использованием КратноВременного Преобразования Фурье (КВПФ). This method is first demonstrated using KratnoVremennogo Fourier Transform (STFT).

КВПФ для N точек дискретного по времени сигнала х(n) определяется равенством STFT for N discrete points in time x (n) signal is determined by the equation

Figure 00000019

где k=0, 1,... , N-1 и ω k =2π k/N и h(n) есть окно. where k = 0, 1, ..., N-1 and ω k = 2π k / N and h (n) is a window. Если это окно удовлетворяет следующим условиям: If the window satisfies the following conditions:

Figure 00000020

существует обратное преобразование, и оно задается равенством an inverse transform exists and is given by the equation

Figure 00000021

Прямое преобразование может быть интерпретировано как анализатор, см. фиг.9а, состоящий из набора N полосовых фильтров с импульсными выходными сигналами h(n)exp(jω k n) 901 с последующим набором из N умножителей с несущими exp(-jω k n) 903 со сдвигом полосовых сигналов в области вокруг 0 Гц, формируя N сигналов Х к (n) анализа. The direct transform may be interpreted as an analyzer, see. 9a, consisting of a set of N bandpass filters with impulse output signals h (n) exp (jω k n) 901 followed by a set of N multipliers with carriers exp (-jω k n) 903 shifted bandpass signals in the area around 0 Hz, forming the n signals to the X (n) analysis. Это окно действует подобно фильтру нижних частот. This screen acts as a lowpass filter. Х к (n) имеют малую ширину полосы и дискретизируются с пониженной частотой (блок 905). To X (n) have small bandwidths and are sampled with a lower frequency (block 905). Уравнение (12), таким образом, оценивается только при n=rR, где R - это коэффициент прореживания, а r - новая временная переменная. Equation (12) is thus only evaluated at n = rR, where R - is the decimation factor and r - new time variable. Х к (n) может быть восстановлено из Х к (rR) путем дискретизации с повышением частоты, смотри фиг.9b, т.е. To X (n) can be recovered from X to (rR) by oversampling, see figure 9b, i.e. вводом нулей (блок 907) после фильтрации фильтром нижних частот 909. Обратное преобразование может быть интерпретировано как синтезатор, состоящий из набора N умножителей 911 с несущими (1/N exp(jω к n), который сдвигает сигналы Х к (n) вверх на первоначальные частоты, за которым следуют расходы 913 (фиг.9с), которые добавляют составляющие У к (n) из всех каналов. КВПФ и обратное КВПФ (ОКВПФ) могут быть переупорядочены, чтобы использовать дискретное преобразование Фурье (ДПФ) и обратное ДПФ (ОДПФ), что позволяет использовать алгоритм быстрого преобразования entering zeros (block 907) after filtering the lowpass filter 909. The inverse transform may be interpreted as a synthesizer consisting of a set of N multipliers 911 with carriers (1 / N exp (jω to n), which shifts to the signals X (n) up to the original frequency, followed by expenses 913 (9c), which add to the components I (n) from all channels. STFT and inverse STFT (OKVPF) may be rearranged to use the discrete Fourier transform (DFT) and inverse DFT (IDFT ) that allows quick conversion algorithm Фурье (БПФ) (см. "Implementation of the Phase Vocoder using the Fast Fourier Transform" MRPortnoff, IEEE ASSP, Vol.24, No.3, 1976). Fourier transform (FFT) (see. "Implementation of the Phase Vocoder using the Fast Fourier Transform" MRPortnoff, IEEE ASSP, Vol.24, No.3, 1976).

Фиг.9с показывает соединение 915 для генерации вторых гармоник, М=2, при N=32. 9c shows a connection 915 for generating second harmonics, M = 2, N = 32. Для упрощения показаны только каналы от 0 до 16. Центральная частота полосы 16 равна частоте Найквиста, каналы от 17 до 31 соответствуют отрицательным частотам. For the sake of simplicity only channels 0 to 16. The center frequency of the band 16 is equal to the Nyquist frequency, channels 17 through 31 correspond to negative frequencies. Блоки, обозначенные Р 917, и блоки усиления 919 будут описаны позднее, а сейчас должны рассматриваться как сокращенные. Blocks denoted P 917 and the gain blocks 919 will be described later, but should be regarded as abbreviated. Входной сигнал в этом примере ограничен по полосе, так что только каналы от 0 до 7 содержат сигналы. The input signal in this example is bounded by the band, so that from 0 to 7 contain only channels signals. Каналы анализатора с 8 до 16, таким образом, пусты и не требуют отображения в синтезатор. Analyzer channels 8 to 16 is thus empty and need not be displayed in the synthesizer. Каналы анализатора от 0 до 7 соединены с каналами синтезатора от 0 до 7, соответствующими тракту задержки входного сигнала. Analyzer channels 0 through 7 are connected to synthesizer channels 0 through 7, corresponding to path delay of the input signal. Каналы анализа k, где 4≤ k≤ 7 соединены с каналами синтеза Mk, M=2, которые сдвигают эти сигналы в области частот с центральными частотами, двукратными относительно полосовых фильтров k. Analysis channels k, where 4≤ k≤ 7 are connected to synthesis channels Mk, M = 2, which shift the signals to frequency domain with center frequencies of bandpass filters relative to two-fold k. Таким образом, сигналы сдвигаются вверх к своим первоначальным диапазонам, а также транспонируются на одну октаву вверх. Thus, the signals are shifted up to their original ranges as well as transposed one octave up. Чтобы исследовать генерацию гармоник в смысле реальных выходных откликов фильтров и модуляторов, должны также рассматриваться отрицательные частоты, смотри нижнюю ветвь на фиг.10а. To explore the harmonic generation in terms of real output response of filters and modulators, should also be considered negative frequencies, see the lower branch 10a. Следовательно, комбинированный выходной результат обратного преобразования соответствует отображению k→ Mk 1001 и Nk→ N-Mk 1003, где 4≤ k≤ 7. Hence, the combined output of the inverse transform corresponds to a mapping k → Mk 1001 and Nk → N-Mk 1003 where 4≤ k≤ 7.

Это дает This gives

Figure 00000022

где М=2. wherein M = 2. Уравнение (15) может быть интерпретировано как полосовая фильтрация входного сигнала с последующим линейным сдвигом частот или модуляцией Верхней Боковой Полосой, т.е. Equation (15) can be interpreted as a band-pass filtering the input signal, followed by a linear frequency shift or Upper sideband modulation, i.e. модуляцией с одной боковой полосой с использованием верхней боковой полосы (см. фиг.10b), где 1005 и 1007 образуют преобразователь Гильберта, 1009 и 1011 представляют собой умножители с косинусоидальными м синусоидальными несущими, а 1013 - каскад дифференцирования, которая выделяет верхнюю боковую полосу. modulated with the single sideband with the upper sideband (. See Figure 10b), where 1005 and 1007 form a Hilbert transformer, 1009 and 1011 are multipliers with cosine m sinusoidal carrier, and 1013 - a cascade of differentiation, which highlights the upper sideband. Ясно, что такой способ многодиапазонной полосовой фильтрации одной боковой полосы может быть применен в явном виде, т.е. Clearly, such a multiband method bandpass filtering one sideband can be applied explicitly, i.e. без связывания набора фильтров, во временной или в частотной области, что позволяет осуществить произвольную выборку индивидуальных полос пропускания и частот генераторов. without binding the filter set in the time or frequency domain, allowing arbitrary selection of individual implement passbands and frequency generators.

Согласно уравнению (15) синусоида с частотой ω i в полосе частот канала k анализа дает гармонику на частоте Mω k +(ω ik ). According to equation (15) is a sinusoid with the frequency ω i in the frequency analysis channel k yields a harmonic at the frequency Mω k + (ω ik). Отсюда этот способ, называемый базовой многополосной транспозицией, генерирует только точные гармоники для входных сигналов с частотами ω ik , где 4≤ k≤ 7. Однако, если количество фильтров достаточно велико, отклонение от точной транспозиции незначительно (см. уравнение (4)). Hence this method is called base multiband transposition, only generates exact harmonics for input signals with frequencies ω i = ω k, where 4≤ k≤ 7. However, if the number of filters is sufficiently large, the deviation from an exact transposition slightly (see. Eq (4 )). Кроме того, транспозиция выполняется точно для квазистационарных тональных сигналов произвольных частот, путем ввода блоков, обозначенных Р 917 (фиг.9с), при условии, что каждый канал анализа содержит не более одного частичного тона. Furthermore, the transposition is performed exactly for quasi-stationary tonal signals of arbitrary frequencies by inserting the blocks denoted P 917 (9c), provided every analysis channel contains no more than one partial tone. В этом случае Х к (rR) являются комплексными экспонентами с частотами, равными разностям между частотами частичных тонов ω i и центральными частотами ω k фильтров анализа. In this case, X to (rR) are complex exponentials with frequencies equal to the differences between the frequencies of the partials ω i and the center frequencies ω k of the analysis filter. Для получения точной транспозиции эти частоты должны быть увеличены на коэффициент М, модифицируя вышеприведенное отношение частот к виду ω i → Mω k +M(ω ik )=Mω i . For accurate transposition of these frequencies must be increased by a factor M, modifying the above frequency ratio to the mean ω i → Mω k + M ( ω i -ω k) = Mω i. Частоты Х к (rR) равны производным по времени от их соответствующих развернутых фазовых углов и могут быть оценены с использованием разностей первого порядка последовательных фазовых углов. The frequencies of X to (rR) are equal to the time derivatives of their respective deployed phase angles and may be estimated using first order differences of successive phase angles. Оценки частот умножаются на М, и фазовые углы синтеза вычисляются с использованием этих новых частот. Guest frequency multiplied by M and synthesis phase angles are calculated using those new frequencies. Однако такой же результат, за исключением фазовой постоянной, получается упрощенным способом, путем умножения аргументов анализа на М непосредственно, исключая потребность в оценке частоты. However, the same result, except for the phase constant, is obtained simplified way by multiplying the analysis arguments by M directly, eliminating the need for frequency estimation. Это описано на фиг.11, представляющей блоки 917. Таким образом Х к (rR), где 4≤ k≤ 7 в этом примере, преобразуется из прямоугольных в полярные координаты, что показано блоками R→ P (блок 1101). This is described in Figure 11, representing the blocks 917. Thus X to (rR), where 4≤ k≤ 7 in this example, is converted from rectangular to polar coordinates as indicated by blocks R → P (1101). Аргументы умножаются на М=2 (блок 1103), а амплитуды не изменяются. The arguments are multiplied by M = 2 (1103), and the amplitudes are not changed. Сигналы затем преобразуются обратно в прямоугольные координаты (P→ R) в блоке 1105, формируя сигналы Y Mk (rR), и подаются к каналам синтезатора согласно фиг.9с. The signals are then converted back to rectangular coordinates (P → R) in the block 1105 forming the signals Y Mk (rR), and fed to synthesizer channels according to 9c. Этот усовершенствованный способ многополосной транспозиции, таким образом, имеет две ступени: связывание обеспечивает грубую транспозицию, как в базовом способе, а фазоумножители обеспечивают точные корректировки частоты. This improved multiband transposition method thus has two stages: the binding provides a coarse transposition, as in the basic method, and fazoumnozhiteli provide precise frequency corrections. Вышеприведенные способы многополосной транспозиции отличаются от традиционной технологии сдвига основного тона с использованием КВПФ, где для синтеза используются генераторы на основе таблиц преобразования, или, когда используется ОКВПФ для синтеза сигнала, который растянут по времени и прорежен, т.е. The above multiband transposition methods differ from traditional pitch shifting techniques using the STFT, where the generators are used for synthesis on the basis of the conversion tables, or when OKVPF used to synthesize the signal that the time stretched and decimated, i.e. связывание не используется. binding is not used.

Связывание гармоник по фиг.9с легко модифицируется для других коэффициентов транспозиции, отличных от 2. Фиг.12 иллюстрирует связывание 1203 для генерации гармоник 3-го порядка, где 1201 - каналы анализа, а 1205 - каналы синтеза. Binding of harmonics 9c is easily modified for other transposition factors other than 2. Figure 12 illustrates the binding of 1203 to generate harmonics of the 3rd order, where 1201 - analysis channels and 1205 - synthesis channels. Различные порядки гармоник могут создаваться одновременно, как показано на фиг.13, где используются гармоники 2-го и 3-го порядков. Different harmonic orders may be created simultaneously as shown in Figure 13, which uses the harmonics of the 2nd and 3rd order. Фиг.14 иллюстрирует неперекрывающуюся комбинацию гармоник 2-го, 3-го и 4-го порядков. 14 illustrates a non-overlapping combination of 2nd harmonic, 3rd and 4th orders. Самый низкий возможный номер гармоники используется в качестве максимально возможной высокой частоты. The lowest possible harmonic number is used as high frequency as possible. Выше верхней границы назначенного диапазона гармоник M используется гармоника М+1. Above the upper limit of the range designated harmonics M used harmonic M + 1. Фиг.15 иллюстрирует способ отображения всех каналов синтезатора (N=64, показаны каналы O-32). 15 illustrates a method of mapping all synthesizer channels (N = 64, channels are shown O-32). Все каналы верхних частот с номерами индексов, не относящимися к простым числам, отображаются согласно следующему соотношению между номерами исходных каналов и номерами каналов назначения: k= назн =Mk иcт , где М есть наименьшее целое число ≥ 2, которое удовлетворяет условию, что k ист лежит в диапазоне нижних частот, а k назн - в диапазоне верхних частот. All channels highpass numbered indexes not related to prime numbers are displayed according to the following relationship between the numbers of original channels and the numbers of destination channels: k = desig = Mk ict, where M is the smallest integer ≥ 2, which satisfies the condition that k ist It lies in the lower frequency range, and k desig - in the high band. Следовательно, ни один канал синтезатора не принимает сигнал более чем от одного канала анализа. Consequently, none no synthesizer channel receives signal from more than one analysis channel. Каналы верхних частот с номерами в виде простых чисел могут отображаться в k ист =1 или в каналы нижних частот k ист >1, что дает хорошие приближения вышеприведенного отношения (только соединений с номерами не в виде простых чисел с М=2, 3, 4, 5 показаны на фиг.15). Channels highpass numbers of primes can be displayed k ist = 1 or channels lowpass k ist> 1, which gives good approximations of the above relation (Only compounds numbered not a prime number with M = 2, 3, 4 , 5 shown in Figure 15).

Возможно также комбинировать амплитудную и фазовую информацию от различных каналов анализатора. It is also possible to combine amplitude and phase information from different analyzer channels. Амплитудные сигналы [Х к (rR)] могут быть связаны согласно фиг.16, тогда как фазовые сигналы аrg{Х к (rR)} соединяются согласно правилу по фиг.16. Amplitude signals [X to (rR)] can be linked according to Figure 16, whereas the phase signals arg {X to (rR)} are connected according to the rule of 16. Таким образом, нижние частоты будут еще транспортированы, посредством чего генерируется периодическое повторение огибающей исходной области, вместо расширенной огибающей, которая является результатом транспозиции согласно уравнению (2). Thus, lower frequencies will still be transported, whereby the generated periodic repetition of the source region envelope instead extended envelope that results from a transposition according to equation (2). Стробирование или другие средства могут использоваться, чтобы избежать усиления "пустых" исходных каналов. Gating or other means may be used to avoid amplification of "empty" source channels. Фиг.17 иллюстрирует другое применение, генерацию субгармоник относительно отфильтрованных верхних частот или басово-ограниченного сигнала с использованием соединений от верхних к нижним субполос. 17 illustrates another application, the generation of sub-harmonics with respect to a highpass filtered or bass-limited signal by using connections from higher to lower subbands. При использовании вышеупомянутых транспозиций может быть выгодно применять регулируемое переключение связей, основанное на характеристиках сигнала. When using the above transpositions it may be advantageous to apply an adjustable switching connections based on signal characteristics.

В вышеприведенном описании предполагается, что самая высокая частота, содержащаяся во входном сигнале, значительно ниже, чем частота Найквиста. In the above description, it is assumed that the highest frequency contained in the input signal is considerably lower than the Nyquist frequency. Таким образом, возможно выполнить расширение полосы пропускания без увеличения частоты дискретизации. Thus, it is possible to perform a bandwidth expansion without an increase in the sampling rate. Это, однако, не всегда имеет место, вследствие чего может быть необходимо предварительно повысить частоту дискретизации. This, however, does not always occur, so that it may be necessary to increase the sampling rate previously. При использовании способов на основе набора фильтров для транспозиции возможно включить в процедуру обработки дискретизацию с повышенной частотой. Using methods based on filters set for transposition may be included in the sampling routine with increased frequency.

Наиболее перцептуальные кодеки применяют наборы фильтров с максимальным прореживанием при отображении времени в частоту ["Introduction to Perceptual Coding" K.Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996]. Most perceptual codecs used filter sets with maximum decimation when displaying the time-to-frequency [ "Introduction to Perceptual Coding" K.Brandenburg, AES, Collected Papers on Digital Audio Bitrate Reduction, 1996]. Фиг.18а показывает основную структуру системы перцептуального кодирования. Figure 18a shows the basic structure of a perceptual coding system. Набор фильтров анализа 1801 расщепляет входной сигнал на несколько сигналов субполос. Analysis filterbank 1801 splits the input signal into several subband signals. Эти выборки субполос индивидуально квантуются (1803), используя уменьшенное количество бит, где число уровней квантования определяется из перцептуальной модели (1807), которая оценивает минимальный порог маскирования. These samples are individually quantised subband (1803), using a reduced number of bits, where the number of quantization levels are determined from a perceptual model (1807), which estimates the minimum masking threshold. Эти субполосы нормализуются, кодируются способами кодирования с необязательной избыточностью и объединяются с дополнительной информацией, состоящей из коэффициентов нормализации, информации о распределении битов и других специфических данных кодека (1805), чтобы сформировать последовательный поток битов. These subbands are normalized, coded with optional encoding methods combined with redundancy and additional information consisting of the normalization factors, bit allocation information and other codec specific data (1805) to generate a serial bit stream. Этот поток битов затем запоминается или передается. This bit stream is then stored or transmitted. В декодере (фиг.18b) кодированный поток битов демультиплексируется (1809), декодируется, и выборки субполос повторно квантируются до равного количества битов (1811). The decoder (18b) the coded bitstream is demultiplexed (1809), is decoded and the subband samples repeatedly kvantiruyutsya equal to the number of bits (1811). Набор фильтров синтеза объединяет выборки субполос, чтобы восстановить исходный сигнал (1813). synthesis filterbank combines subband samples to reconstruct the original signal (1813). Варианты реализации, использующие наборы фильтров с максимальным прореживанием значительно уменьшают вычислительные затраты. Embodiments that use filter sets with maximum decimation significantly reduce the computational cost. В последующем описании сделан упор на косинусоидально модулированных наборах фильтров. In the following description focuses on a cosine modulated filterbank. Следует, однако, иметь в виду, что настоящее изобретение может быть реализовано с использованием других типов наборов фильтров или преобразователей, включая интерпретации набора фильтров с преобразованием волны малой интенсивности, другие наборы фильтров или преобразователи с неравными полосами пропускания и многомерные наборы фильтров или преобразователей. It should however be borne in mind that the present invention may be implemented using other types of filter sets or transducers, including the interpretation of a set of filters to the conversion of low intensity waves or other filterbanks converters with unequal bandwidths and multidimensional filter sets or converters.

В иллюстративном, но не ограничивающем описании, ниже предполагается, что L-канальный косинусоидально модулированный набор фильтров расщепляет входной сигнал х(n) на L субполос. In the illustrative, but not limiting description below it is assumed that the L-channel cosine modulated filterbank breaks the input signal x (n) on the L subband. Общая структура набора фильтров с максимальным прореживанием показана на фиг.19. The general structure of a filter set with a maximum decimation is shown in Figure 19. Фильтры анализа обозначены Н к (z) 1901, где k=0, 1,... , L-1. Analysis filters are denoted H c (z) 1901, where k = 0, 1, ..., L-1. Сигналы субполос ν к (n) максимально прореживаются (1903) каждой из частот дискретизации f s /L, где f s - частота дискретизации х(n). Ν subband signals to (n) maximally decimated (1903), each of sampling frequency f s / L, where f s - sampling frequency of x (n). Блок синтеза воссоединяет обратно сигналы субполос после интерполяции (1905) и фильтрации (1907), для формирования х(n). synthesis unit reconnects back the subband signals after interpolation (1905) and filter (1907) for generating x (n). Фильтры синтеза обозначены F к (z). Synthesis filters are denoted F a (z). Кроме того, настоящее изобретение выполняет дублирование спектра на х(n), формируя в результате сигнал у(n). Furthermore, the present invention performs a spectral overlap at x (n), forming the resulting signal y (n).

Синтезирование сигналов субполос с помощью QL-канального набора фильтров, где используются только L каналов нижних частот, а коэффициент расширения полосы Q выбран так, что QL - целое число, дает в результате выходной поток битов с частотой дискретизации Qf s . Synthesis subband signals using the QL-channel filterbank, where only L lowpass channels and bandwidth expansion factor Q is chosen so that QL - integer, resulting in the output bit stream with sampling frequency Qf s. Следовательно, расширенный набор фильтров будет действовать так, как если бы он был L-канальным набором фильтров с последующим устройством дискретизации с повышенной частотой. Consequently, an extended set of filters will operate as if it were a L-channel filter set, followed by a sampling device with an increased frequency. Поскольку в этом случае L(Q-1) фильтров верхних частот не используются (на них подаются нули), ширина полосы аудиосигнала не изменится - набор фильтров просто воспроизведет версию х(n) с повышенной частотной дискретизации. Since in this case the L (Q-1) high-pass filters are used (they are fed zeros), the audio band width will not change - the filter set simply reproduce version of x (n) with higher sampling frequency. Если, однако, сигналы субполос связываются с фильтрами верхних частот, то ширина полосы If, however, the subband signals associated with the high-pass filters, the band width

Figure 00000023
возрастает на коэффициент Q, формируя у(n), это является версией набора фильтров с максимальным прореживанием многополосного устройства транспозиции согласно изобретению. increases by a factor Q, to form y (n), it is a version of a filter set with a maximum decimation multiband transposition device according to the invention. Используя эту схему, процесс дискретизации с повышением частоты дискретизации интегрируется в процесс фильтрования процесса синтеза, как объяснялось ранее. Using this scheme, the sampling process upsampled integrated synthesis process in the filtering process as explained previously. Следует отметить, что может быть использован набор фильтров синтеза любого размера, что приводит к различным частотам дискретизации выходного сигнала, и, следовательно, к разным коэффициентам расширения полосы частот. It should be noted that it may be used a synthesis filterbank to any size, which leads to different output sampling frequencies, and hence different bandwidth expansion factors. Выполнение дублирования спектра на Performing on the duplication of the spectrum
Figure 00000024
согласно настоящему изобретению, соответствующему базовому многополосному способу транспозиции с целочисленным коэффициентом транспозиции М, выполняется связыванием сигналов поддиапазонов как according to the present invention, respective base multi-band transposition method with an integer transposition factor M, is executed as a binding subband signals

Figure 00000025

где k∈ [0,L-1] и выбрано так, что Mk∈ [L,QL-1], е мk (n) - коррекция огибающей, а (-1) (м-1)kn - коэффициент коррекции для спектрально инвертированных субполос. wherein k∈ [0, L-1] and chosen so that Mk∈ [L, QL-1], mk e (n) - the envelope correction and (-1) (M-1) kn - correction factor for spectrally inverted sub-band. Спектральная инверсия вытекает из прореживания сигналов субполос, и инвертированные сигналы могут быть повторно инвертированы изменением знака каждой второй выборки в этих каналах. Spectral inversion results from decimation of subband signals, and the inverted signals may be re-inverted by changing the sign of every second sample in those channels. Со ссылкой на фиг.20, рассмотрим 16-канальный набор фильтров синтеза, связанный (2009) для коэффициента транспозиции М=2, с Q=2. Referring to Figure 20, consider a 16-channel synthesis filterbank coupled (2009) to the transposition factor M = 2, with Q = 2. Блоки 2001 и 2003 обозначают фильтры анализа Н K (z) и блоки прореживания по фиг.19 соответственно. Blocks 2001 and 2003 denote the analysis filters H K (z) and decimation by units 19, respectively. Подобным образом, 2005 и 2007 являются интерполяторами и фильтрами синтеза F k (z). Similarly, 2005 and 2007 are the interpolators and synthesis filters F k (z). Уравнение (16) затем упрощается соответственно связыванию сигналов четырех верхних частотных субполос полученных данных в каждую вторую группе из восьми самых верхних каналов в наборе фильтров синтеза. Equation (16) then simplifies binding signals respectively four upper frequency subband data obtained in each second group of the eight uppermost channels in the synthesis filter set. Благодаря спектральной инверсии, каждый второй соединенный сигнал поддиапазона должен быть частотно инвертирован до синтеза. Due to spectral inversion, every second coupled subband signal must be frequency inverted before the synthesis. Кроме того, амплитуды соединенных сигналов должны быть отрегулированы (2011) согласно правилам ДСП-1 или ДСП-2. Moreover, the amplitudes of signals connected must be adjusted (2011) according to the rules DSP-DSP-1 or 2.

При использовании базового многополосного способа транспозиции согласно настоящему изобретению генерируемые гармоники в общем не являются точно кратными основным частотам. When using basic multiband transposition method according to the present invention the generated harmonics are in general not exact multiples of the fundamental frequency. Все частоты, кроме самых низких в каждой субполосе, отличаются в некоторой степени от точной транспозиции. All frequencies but the lowest in every subband differs in some extent from an exact transposition. Кроме того, дублированный спектр содержит нули, поскольку интервал результирующего диапазона покрывает более широкий диапазон частот, чем интервал исходного диапазона. Furthermore, the duplicated spectrum contains zeros since the resulting band interval covers a wider frequency range than the source interval range. Более того, свойства подавления паразитного сигнала косинусоидально модулированного набора фильтров исчезает, поскольку сигналы субполос разделены по частоте в выходном интервале. Moreover, the properties of the parasitic signal a cosine modulated filterbank suppression disappears as the subband signals are separated in frequency in the output range. То есть сигналы соседних субполос не перекрываются в высокочастотной области. That is, neighboring subband signals do not overlap in the high-frequency region. Однако, способы уменьшения паразитных сигналов, известные специалистам, в данной области техники, могут быть использованы для уменьшения этого типа помех. However, methods for reducing the spurious signals known to those skilled in the art can be used to reduce this type of interference. Преимущества этого способа транспозиции состоят в простоте реализации и очень низких вычислительных затратах. Advantages of this transposition method consist in the simplicity of implementation, and the very low computational cost.

Чтобы обеспечить высокую точность транспозиции синусоид, представлено решение на основе набора фильтров эффективного максимального прореживания усовершенствованного способа многополосной транспозиции. To ensure high accuracy of transposition of sinusoids, it presents a solution based on a filter set the maximum effective method of thinning improved multiband transposition. Система использует дополнительный модифицированный набор фильтров анализа, в то время как набор фильтров синтеза является косинусоидально-модулированным, как описано в работе "Multi-rate Systems and Filter Banks", PPVaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0-13-605718-7. The system uses an additional modified analysis filter set, while the synthesis filterbank is cosine modulated as described in "Multi-rate Systems and Filter Banks", PPVaidyanathan, Prentice Hall, Englewood Cliffs, New Jersey, 1993, ISBN 0- 13-605718-7. Этапы способа многополосной транспозиции согласно настоящему изобретению на основе наборов фильтров с максимальным прореживанием схематически показаны на фиг.21 и на блок-схеме фиг.22 и являются следующими: Stages multiband transposition method according to the present invention based filterbanks with maximum decimation are shown schematically in Figure 21 and Figure 22 is a block diagram and are the following:

1. L принятых сигналов субполос синтезируются с помощью QL-канального набора фильтров 2101, 2201, 2203, где в L(Q-1) верхних каналов подаются нули, чтобы сформировать сигнал х(n), который таким образом избыточно дискретизируется с коэффициентом расширения ширины полосы Q. 1. L received subband signals are synthesized using a QL-channel filterbank 2101, 2201, 2203, where L (Q-1) upper channels are fed zeros, to form signal x (n), which is thus redundantly sampled with the width of the spreading factor Q. strip

2. x 1 (n) подвергается дискретизации с пониженной частотой с коэффициентом Q, чтобы сформировать сигнал x 2 (n') 2103, 2205, т.е. 2. x 1 (n) is subjected to a reduced sampling frequency with a factor Q, to form signal x 2 (n ') 2103, 2205, i.e. x 2 (n')=x 1 (Qn'). x 2 (n ') = x 1 (Qn').

3. Выбирается целочисленная величина К как размер набора фильтров синтеза, ограниченная таким образом, что T=KM/Q - целое число, где Т - размер модифицированного набора фильтров анализа, а М - коэффициент транспозиции 2207, 2209, 2211. К предпочтительно должна быть выбрана большой для стационарных (тональных) сигналов и меньшей для динамических (переходных) сигналов. 3. Selects the integer value of K as the size of a synthesis filterbank, limited so that T = KM / Q - an integer, where T - the size of the modified analysis filterbank, and M - the transposition factor 2207, 2209, 2211. K should preferably be chosen large for stationary (tonal) signals, and smaller for dynamic (transient) signals.

4. x(n') фильтруется посредством фильтров Т-канального модифицированного набора фильтров анализа 2107, 2213, где Т фильтров анализа экспоненциально модулированы, формируя набор комплексных сигналов субполос. 4. x (n ') is filtered through a filter of a modified T-channel analysis filterbank 2107, 2213, where the T analysis filters are exponentially modulated, forming a set of complex subband signals. Эти сигналы субполос дискретизуруются с пониженной частотой с коэффициентом Т/М, давая сигналы субполос ν k (M) (n''), k=0, 1,... Т-1. These subband signals diskretizuruyutsya with low frequency by a factor T / M, giving subband signals ν k (M) (n ' '), k = 0, 1, ... T-1. Отсюда, набор фильтров будет избыточно дискретизирован с коэффициентом М. Hence, a set of filters is oversampled with a factor M.

5. Сигналы ν k (M) (n'') преобразуются в полярное представление (амплитуда и фазовый угол). 5. ν k (M) (n '') signals are converted to a polar representation (magnitude and phase angle). Фазовые углы умножаются на коэффициент М, и эти сигналы преобразуются обратно в представление в прямоугольных координатах согласно схеме фиг.11. The phase angles are multiplied by the factor M, and these signals are converted back into a representation in Cartesian coordinates according to Figure 11 diagram. Берутся действительные составляющие комплексных сигналов, в результате чего получаются сигналы s k (M) (n'') 2109, 2215. После этой операции сигналы s k (M) (n'') критически дискретизируются. Taken real components of complex signals, whereby signals are obtained s k (M) (n ' ') 2109, 2215. After this operation, the signals s k (M) (n ' ') critically sampled.

6. Коэффициенты усиления сигналов s k (M) (n'') регулируются согласно правил ДСП-1 или ДСП-2 (2111, 2217). 6. The gains of the signals s k (M) (n ' ') is governed by the rules of DSP-DSP-1 or 2 (2111, 2217).

7. Сигналы субполос s к (M) (n''), где k∈ [T/M, min (К, Т)-1], синтезируются с помощью обычного косинусоидально-модулированного К-канального набора фильтров, где на каналы от 0 до Т/М-1 подаются нули. 7. The subband signals s to (M) (n '') , wherein k∈ [T / M, min (K, T) -1], are synthesized with an ordinary cosine modulated K-channel filterbank, where channels from 0 to T / M-1 zeros are fed. В результате формируется сигнал х 3 (M) (n). The result is a signal x 3 (M) (n).

8. x 3 (M) (n) окончательно добавляется к x 1 (n), чтобы дать у(n) 2223, который является желаемым сигналом дублированного спектра. 8. x 3 (M) (n) finally added to x 1 (n), to give y (n) 2223, which is the desired signal of the duplicated spectrum.

Этапы с 3 по 6 могут быть повторены для различных значений коэффициента транспозиции М, добавляя таким образом множество гармоник к x 1 (n). Steps 3 to 6 may be repeated for different values of the transposition factor M, thus adding a plurality of harmonics to x 1 (n). Этот режим работы иллюстрируется пунктирными линиями на фиг.21 и фиг.22, повторением цикла, включающего блоки 2211-2219. This mode of operation is illustrated by dashed lines 21 and 22, repeating the cycle comprising blocks 2211-2219. В этом случае, К выбирается так, чтобы сделать Т целочисленным для всех значений выбранных М - для целочисленных M:s; In this case, K is chosen as to make T integer-valued for all values ​​of the selected M - for integer-valued M: s; предпочтительно К выбирается так, чтобы K/Q было положительным целым числом. It is preferably chosen so that K / Q was positive integer. Все сигналы субполос s k (Mi) (m''), где i=1, 2,... , m, am есть число коэффициентов транспозиции, суммируются согласно равенству All subband signals s k (Mi) (m ' '), where i = 1, 2, ..., m, am is the number of transposition factors, are summed according to the equation

Figure 00000026

для всех используемых k. used for all k. В первой итерации цикла по фиг.22 сигналы s к (n'') могут рассматриваться только как нулевые сигналы поддиапазонов, где k=0, 1,... , К-1. In the first iteration of the loop of Figure 22 to the signals s (n '') can only be regarded as zero subband signals, where k = 0, 1, ..., K-1. В каждом цикле новые сигналы добавляются (2219) к s к (n'') следующим образом: In each cycle, the new signals are added (2219) to s to (n '') as follows:

Figure 00000027

где k=K/Q, K/Q+1,... , min(K,T i )-1. where k = K / Q, K / Q + 1, ..., min (K, T i) -1. Сигналы поддиапазонов s k (n'') синтезируются однократно с помощью К-канального набора фильтров согласно этапу (7). The subband signals s k (n '') are synthesized once with a K-channel using filter set according to step (7).

Модифицированный набор фильтров анализа для этапа (4) получается согласно теории косинусоидально-модулированных наборов фильтров, где модулированное преобразование с перекрытием (cм. "Lapped Transforms for Efficient Transform/Subband Coding" HSMalvar, IEEE Trans ASSP, vol.38, no.6, 1990) является частным случаем. Modified analysis filterbank for step (4) is obtained according to the theory of cosine modulated filterbanks, where the modulated lapped transform (cm. "Lapped Transforms for Efficient Transform / Subband Coding" HSMalvar, IEEE Trans ASSP, vol.38, no.6, 1990) is a special case. Импульсные отклики h k (n) фильтров в Т-канальном косинусоидально-модулированном наборе фильтров могут быть записаны в виде Impulse responses h k (n) filters in a T-channel cosine modulated filter set can be written as

Figure 00000028

где k=0, 1,... ,T-1, N - длина прототипа фильтра нижних частот р o (n), С - константа, а Ф к - фазовый угол, который обеспечивает исключение помех между соседними каналами. where k = 0, 1, ..., T-1, N - length of the lowpass prototype filter p o (n), C - constant and F k - the phase angle, which ensures exclusion of interference between adjacent channels. Ограничения на Ф к следующие: Restrictions on the F to the following:

Figure 00000029

которые могут быть упрощены до выражения в замкнутой форме which can be simplified to the closed form expression in

Figure 00000030

При таком выборе Ф к с использованием набора фильтров синтеза могут быть получены системы точной реконструкции или системы приближенной реконструкции (системы псевдоQMF) с импульсными откликами в виде With this choice for F using a set of accurate reconstruction systems may be prepared by the synthesis filters or approximate reconstruction systems (psevdoQMF system) with impulse responses as

Figure 00000031

Рассмотрим фильтры Consider filters

Figure 00000032

где h к ' (n) - синусоидально-модулированная версия фильтра р o (n). h where a '(n) - sinusoidally-modulated version of the filter p o (n). Фильтры H k ' (z) H k (z) имеют идентичные поддержки полосы пропускания, но отличающиеся фазовые отклики. The filters H k '(z) H k (z) have identical passband support, but the phase responses differ. Полосы пропускания фильтров в действительности являются преобразованиями Гильберта друг друга (это не действительно для частот близких к w=0 и w=π ). Bandpass filter are actually Hilbert transforms of each other (this is not valid for frequencies close to w = 0 and w = π). Объединение уравнений (19) и (23) согласно Combining equations (19) and (23) according to

Figure 00000033

дает фильтры, которые имеют ту же форму амплитудных откликов как Н к (z) для положительных частот, но являются нулями для отрицательных частот, использование набора фильтров с импульсными откликами как в уравнении (24) дает набор сигналов субполос, которые могут быть интерпретированы как сигналы анализа (комплексные), соответствующие сигналам субполос, полученным из набора фильтров с импульсными откликами, как в уравнении (19). yields filters that have the same shape as the amplitude response as H a (z) for positive frequencies but are zero for negative frequencies, using a filter set with impulse responses as in Eq (24) gives a set of subband signals that can be interpreted as signals analysis (integrated) corresponding to the subband signals obtained from a set of filters with impulse responses as in Eq (19). Сигналы анализа пригодны для манипуляции, поскольку выборки в виде комплесных значений могут быть записаны в полярной форме, т.е. analysis signals are suitable for manipulation, since the sample values ​​of a full machining can be written in polar form, i.e.

z(n)=r(n)+ji(n)=|z(n)|exp{j arg(z(n))}. z (n) = r (n) + ji (n) = | z (n) | exp {j arg (z (n))}.

Однако при использовании набора комплексных фильтров для транспозиции ограничения для Ф к должны быть обобщены, чтобы поддержать свойство исключения помех. However, when using a set of complex filters to limit transposition to F to be consolidated to support exceptions interference property. Новое ограничение для Ф к для обеспечения исключения помех совместно с набором фильтров синтеза с импульсными откликами как в уравнении (22) имеет вид: The new constraint for P to provide for interference elimination, together with a set of synthesis filter with impulse responses as in Eq (22) has the form:

Figure 00000034

что упрощается до уравнения (21), когда М=1. which is simplified to equation (21), when M = 1. При таком выборе транспонированные частичные тона будут иметь те же относительные фазы, какие они имели бы при М=1 (нет транспозиции). With this choice transposed partial tone will have the same relative phases as they would have when M = 1 (no transposition).

Объединение равенства 24 и равенства 25 дает Combining equation 24 and equation 25 yields

Figure 00000035

что является фильтрами, используемыми в модифицированном наборе фильтров для этапа (4) согласно настоящему изобретению. is that the filters used in the modified filter set for step (4) according to the present invention.

Ниже приведены некоторые пояснения касательно этапа (5). Below are some clarifications concerning step (5). Дискретизация с пониженной частотой комплексных сигналов субполос приводит к избыточной дискретизацией на М, что является существенным критерием, когда впоследствии фазовые углы умножаются на коэффициент транспозиции М. Избыточная дискретизация приводит к тому, что количество выборок субполос на ширину полосы после транспонирования в диапазон назначения, становиться равным количеству выборок субполос исходного диапазона. Discretization with low frequency complex subband signals leads to oversampled by M, which is an essential criterion when the phase angles subsequently are multiplied by the transposition factor M. oversampling causes that the number of samples in the subband bandwidth after transposition to the target range, to become equal to the number of subband samples of the source range. Индивидуальные полосы пропускания транспонированных сигналов субполос в М раз больше, чем полосы пропускания исходного диапазона, вследствие действия фазоумножителя. Individual signals transposed subband bandwidth is M times longer than the original bandwidth range, due to the action fazoumnozhitelya. Это приводит к тому, что сигналы субполос становятся критически дискретизированными после этапа (5), и кроме того, в спектре не будет нулей при транспозиции тональных сигналов. This leads to the fact that the subband signals are critically sampled after step (5), and furthermore, the spectrum will not be zero at the transposition of tones.

Чтобы избежать тригонометрических вычислений, т.е. To avoid trigonometric calculations, that is, при необходимости вычисления новых сигналов субполос как if necessary, calculating new subband signals as the

Figure 00000036

где |ν K (M) (n'')| where | ν K (M) (n '') | абсолютная величина ν K (M) (n''), используется следующее тригонометрическое соотношение: absolute value ν K (M) (n ' '), the following trigonometric relationship is used:

Figure 00000037

При условии On condition

Figure 00000038

Figure 00000039

и and

Figure 00000040

вычисления для этапа (5) можно выполнить без тригонометрических вычислений, уменьшив сложность вычислений. calculating for step (5) can be accomplished without trigonometric calculations, reducing computational complexity.

При использовании транспозиции с четным М могут возникнуть проблемы для фазо-умножителя, в зависимости от характеристик фильтра нижних частот p o (n). When using transpositions even-M may be problems for the phase-multiplier according to p o (n) low-pass filter characteristics. Все применимые фильтры имеют нули на единичной окружности в плоскости Z. Нуль на единичной окружности создает сдвиг на 180 градусов в фазовом отклике фильтра. All applicable filters have zeros on the unit circle in the plane Z. A zero on the unit circle creates a shift of 180 degrees in the phase response of the filter. Для четных М фазоумножитель переводит эти сдвиги в сдвиги на 360 градусов, т.е. For even M fazoumnozhitel translates these shifts to 360 ° shifts on, i.e. сдвиги по фазе исчезают. phase shifts disappear. Частичные тоны, расположенные таким образом по частоте, что такие фазовые сдвиги исчезают, приведут к помехе в синтезируемом сигнале. Partial tones, thus arranged in frequency that such phase shifts vanish to result in interference in the synthesized signal. Наихудший случай в этой ситуации имеет место тогда, когда частичный тон соответствует точке по частоте, соответствующей вершине первого бокового лепестка характеристики фильтра анализа. The worst case in this situation occurs when a partial tone corresponds to a point in frequency corresponding to the vertex of the first sidelobe characteristics analysis filter. В зависимости от ослабления этого лепестка в амплитудном отклике эти помехи будут более или менее слышимыми. Depending on the attenuation of this lobe in the magnitude response of the interference will be more or less audible. Как пример, первый боковой лепесток фильтра, используемого для уровня 1 и 2 стандартом ISO/MPEG, ослабляется на 96 дБ, в то время как ослабление первого бокового лепестка для синусоидального окна, используемого в схеме MDCT уровня 3 стандарта ISO/MPEG только 23 дБ. As an example, the first side of the filter petal used for level 1 and 2 ISO standard / MPEG, attenuated by 96 dB, while the attenuation of the first side lobe for the sine window used in Scheme MDCT layer 3 ISO / MPEG only 23 dB standard. Ясно, что помеха этого типа, при использовании синусоидального окна, будет прослушиваться. It is clear that this type of interference, using a sine window, will be heard. Ниже представлено решение этой проблемы, определяемое как относительная фазовая синхронизация. Below is a solution to this problem, defined as the relative phase synchronization.

Фильтры h a к (n) имеют линейные фазовые отклики. The filters h a to (n) have linear phase responses. Фазовые углы Ф к вводят относительные фазовые разности между соседними каналами, а нули на единичной окружности вводят сдвиг по фазе в 180 градусов в позициях по частоте, которые могут отличаться для различных каналов. Phase angles F are introduced to the relative phase differences between adjacent channels, and the zeros on the unit circle introduce a phase shift of 180 degrees at the frequency positions which can be different for different channels. Путем контроля разности фаз между сигналами соседних субполос, перед запуском фазоумножителя, легко выделить каналы, которые содержат информацию с инвертированной фазой. By monitoring the phase difference between neighboring subband signals, before starting fazoumnozhitelya easily identify the channels that contain phase-inverted information. Для тональных сигналов разность фазы равна примерно π /2М согласно уравнению (25) для неинвертированных сигналов и, соответственно, равна примерно π (1-1/2М) для сигналов, если какой-либо из сигналов инвертирован. For tone phase difference is approximately π / 2 M according to equation (25) for non-inverted signals and, accordingly, is approximately π (1-1 / 2 M) for signals, if any of the signals is inverted. Выделение инвертированных сигналов может быть выполнено вычислением скалярного произведения сигналов в соседних субполосах в виде Isolation of inverted signals may be accomplished by calculating the scalar product signals in adjacent subbands as

Figure 00000041

Если произведение в уравнении (32) отрицательно, разность фаз больше 90 градусов, и присутствует условие фазовой инверсии. If the product in equation (32) is negative, the phase difference is greater than 90 degrees, and the phase inversion condition is present. Фазовые углы комплексных сигналов субполос умножаются на М согласно схеме для этапа (5) и, наконец, сигналы, помеченные как инверсные, вычитаются. Phase angles of the complex subband signals are multiplied by M circuit according to step (5) and, finally, the signals are marked as inverted subtracted. Способ относительной фазовой синхронизации, таким образом, заставляет сдвинутые на 180 градусов сигналы субполос сохранять этот сдвиг после умножения фазы и тем самым поддерживать свойство подавления помех. Method relative phase synchronization thus makes shifted by 180 degrees subband signals retain this shift after the phase multiplication and thereby keep interference cancellation property.

Регулировка огибающей спектра. Adjusting spectral envelope.

Большинство звуков, таких как речь и музыка, характеризуются произведениями медленно изменяющихся огибающих и быстро изменяющихся несущих частот с постоянной амплитудой, как описано в работе "The Application of Generalized Linearity to Automatic Gain Control" TGStockham, Jr, IEEE Tans on Audio and Electroacoustics, Vol.AU-16, No.2, June 1968 и в уравнении (1). Most sounds, like speech and music, are characterized by products of slowly varying envelopes and rapidly varying carriers with constant amplitude, the frequency, as described in "The Application of Generalized Linearity to Automatic Gain Control" TGStockham, Jr, IEEE Tans on Audio and Electroacoustics, Vol .AU-16, No.2, June 1968 and in equation (1).

В перцептуальных аудиокодерах с расщепленной полосой аудиосигнал сегментирован на блоки и расщеплен на множество частотных полос с использованием фильтров субполос или преобразования из временной области частотную область. In perceptual audio encoder with split band audio signal is segmented into blocks and split into multiple frequency bands using subband filters or a transform from the time domain frequency domain. В большинстве типов кодеков сигнал последовательно разделяется на две главных сигнальных составляющих для передачи или запоминания, представления огибающей спектра и нормированных выборок субполос или коэффициентов. In most codec types of signal sequentially separated into two major signal components for transmission or storage, the spectral envelope representation and the normalized subband samples or coefficients. В последующем описании термин "выборки субполос" или "коэффициенты" относится к значениям выборок, полученным из фильтров субполос, а также к коэффициентам, полученным для преобразования из временной области в частотную область. In the following description, the term "subband samples" or "coefficients" refers to sample values ​​obtained from subband filters as well as coefficients obtained for a transformation from the time domain to the frequency domain. Термин "огибающая спектра" или "коэффициенты масштабирования" представляют собой величины для субполос на основе временного кадра, такие как средняя или максимальная амплитуда в каждой субполосе, используемые для нормировки выборок субполос. The term "spectral envelope" or "scale factors" represent values ​​for the subbands based on a time frame, such as the average or maximum amplitude in each subband, used for normalization of the subband samples. Однако огибающая спектра может быть также получена с использованием линейного прогнозирования (патент США 5684920). However, the spectral envelope may also be obtained using linear prediction (U.S. Patent 5,684,920). В типовом кодеке нормированные выборки субполос требуют кодирования при высокой скорости передачи (используя примерно 90% доступной скорости передачи) по сравнению с огибающими, медленно изменяющимися во времени, и, тем самым, огибающими спектра, которые могут кодироваться при значительно меньших скоростях (используя примерно 10% доступной скорости передачи). In a typical codec, the normalized subband samples require coding at a high bit rate (using approximately 90% of the available transmission rate) compared to the envelopes slowly time-varying, and thereby, spectral envelopes, that may be coded at a much slower rate (using approximately 10 % of the available transmission speed).

Точная огибающая спектра дублированной ширины полосы важна, если должны быть сохранены качества тембра исходного сигнала. Accurate spectral envelope redundant bandwidth is important if need be stored tone quality of the original signal. Воспринимаемый тембр музыкального инструмента или голоса определяется, главным образом, спектральным распределением ниже частоты f lim (граничной), расположенной в самых высоких октавах слышимого диапазона. The perceived timbre of a musical instrument or voice is determined primarily by the spectral distribution below the frequency f lim (boundary) located in the highest octaves of the audible range. Части спектра выше f lim , таким образом, имеют меньшее значение и, соответственно, тонкие структуры верхней полосы, полученные вышеописанными способами транспозиции, не требуют регулировки, в то время как грубые структуры, в общем случае требуют. Spectrum portion above f lim, thus have a minimal value and, accordingly, fine structures highband obtained above transposition, require no adjustment, while the coarse structures generally require. Для обеспечения такой регулировки полезно отфильтровать спектральное представление сигнала, чтобы отделить грубую структуру огибающей от тонкой структуры. To provide this adjustment is useful to filter the spectral representation of the signal to separate the envelope coarse structure from the fine structure.

В варианте с использованием ДСП-1 согласно настоящему изобретению грубая огибающая спектра верхней полосы оценивается по информации нижней полосы, имеющейся в декодере. In the embodiment using DSP-1 according to the present invention, coarse spectral envelope of the high band is estimated by the lowband information available at the decoder. Эта оценка выполняется непрерывным контролем огибающей нижней полосы и регулировкой огибающей спектра верхней полосы в соответствии со специальными правилами. This evaluation is performed continuously monitored envelope lowband and adjusting the highband spectral envelope according to specific rules. Новый способ осуществления вычисления огибающей использует асимптоты в логарифмической частотно-амплитудной области, что эквивалентно аппроксимации кривой с помощью полиномов переменного порядка в линейной области. A new method of calculating the envelope uses asymptotes in a logarithmic frequency-amplitude domain, which is equivalent to curve fitting with polynomials using alternating order in the linear region. Вычисляется уровень и наклон верхней части спектра нижней полосы, и оценки используются для определения уровня и наклона одного или нескольких сегментов, представляющих новую огибающую верхней полосы. Calculates the level and slope of an upper portion of the lower-band spectrum and estimates are used to determine the level and incline of one or several segments representing the new highband envelope. Точки пересечения ассимптот фиксируются по частоте и действуют как опорные точки. The points of intersection assimptot fixed in frequency and act as pivot points. Однако не всегда необходимо, хотя и выгодно, устанавливать ограничения, чтобы сохранять отклонения огибающей верхней полосы в реальных границах. However not always necessary, although it is advantageous to set limits to keep the highband envelope deviation in actual boundaries. Альтернативным подходом к оценке огибающей спектра является использование векторного квантований, VQ, большего количества характерных огибающих спектра и запоминания их в таблице преобразования или наборе кодов. An alternative approach to estimation of the spectral envelope is to use vector quantization, VQ, of more typical spectrum envelopes and storing them in the conversion table or set of codes. Векторное квантование выполняется путем обучения желаемого количества векторов на большом объеме данных обучения в данном случае огибающих спектра аудиосигнала. Vector quantization is performed by training the desired number of vectors on a large amount of training data, in this case audio spectral envelopes. Обучение обычно выполняется с помощью Обобщенного алгоритма Ллойда (см. работу "Vector Quantization and Signal Compression" A.Gersho, RMGray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0) и дает векторы, которые оптимально схватывают содержимое данных обучения. Training is typically performed using the generalized Lloyd algorithm (see. The work "Vector Quantization and Signal Compression" A.Gersho, RMGray, Kluwer Academic Publishers, USA 1992, ISBN 0-7923-9181-0) and yields vectors that optimally grasp the contents of the data training. Рассматривая набор кодов VQ, состоящих из А огибающих спектров, обученный на В огибающих (В>>А), затем А огибающих представляют А наиболее вероятных переходов от огибающей нижней полосы к огибающей верхней полосы на основании В наблюдений широкого разнообразия звуковых сигналов. Considering the set of VQ codes, consisting of A spectral envelope trained by B envelopes (B >> A), then the A envelopes represent the A most likely transitions from the lowband envelope to the highband envelope based on the B observations of a wide variety of audio signals. Это, теоретически, представляет собой А правил для прогнозирования огибающей на основании В наблюдений. This, in theory, is A rules for predicting the envelope based on the B observations. При оценке новой огибающей спектра верхней полосы исходная огибающая нижней полосы используется для поиска набора кодов, и часть верхней полосы наиболее точно совпадающей записи набора кодов используется для создания нового спектра верхней полосы. When assessing a new envelope of the higher-band spectrum envelope of the original lower band is used to find a set of codes, and part of the upper band most closely matching record set of codes used to create a new range of the upper band.

На фиг.23 нормирование выборки субполос обозначено позицией 2301, а огибающие спектров представлены коэффициентами масштабирования 2305. Для целей иллюстрации, передача к декодеру 2303 показана в параллельной форме. Figure 23 valuation subband sample indicated at 2301 and the spectral envelope represented by the scaling factors 2305. For purposes of illustration, the transmission to decoder 2303 is shown in parallel form. В способе ДСП-2 (фиг.24) информация огибающей спектра генерируется и передается согласно фиг.23, при этом передаются только выборки субполос нижней полосы. In the method of DSP-2 (24), the spectral envelope information is generated and transmitted according to 23, wherein only the transmitted lowband subband samples. Передаваемые коэффициенты масштабирования, таким образом, охватывают полный диапазон частот, в то время как выборки субполос охватывают только ограниченный диапазон частот, исключающий верхнюю полосу. The transmitted scale factors thus cover the full frequency range while the subband samples only span a restricted frequency range, excluding the highband. В декодере выборки субполос 2401 нижней полосы транспонируются (2403) и комбинируются с принятой информацией огибающей спектра 2405 верхней полосы. In the decoder subband samples 2401 are transposed lowband (2403) and combined with the received spectrum envelope information 2405 highband. Таким образом, синтезированная огибающая спектра верхней полосы идентична исходной огибающей, поддерживая в то же время значительное уменьшение скорости передачи данных. Thus, the synthesized highband spectral envelope is identical to the original envelope, maintaining at the same time a significant decrease in the data rate.

В некоторых кодеках возможно передавать масштабные коэффициенты для полной огибающей спектра, опуская в то же время выборки субполос верхней полосы, как показано на фиг.24. In some codecs may transmit the scale factors for the spectral envelope fully omitting while sampling highband subband, as shown in Figure 24. Другие стандарты кодеков устанавливают, что масштабные коэффициенты и выборки субполос должны перекрывать одинаковый диапазон частот, т.е. Other codec standards stipulate that the scale factors and subband samples must cover the same frequency range, i.e., масштабные коэффициенты не могут быть переданы, если выборки субполос опущены. scale factors may not be transmitted if the subband samples are omitted. В таких случаях имеется несколько решений: информация об огибающей спектра верхней полосы может быть передана в отдельных кадрах, причем эти кадры имеют свои заголовки и дополнительную защиту от ошибок, за которыми следуют данные. In such cases, there are several solutions: an upper band spectrum envelope information can be transmitted in separate frames, and these frames have their own headers and optional error protection, followed by the data.

Обычные декодеры, не использующие преимущества настоящего изобретения, не распознают эти заголовки и поэтому отбросят эти дополнительные кадры. Conventional decoders do not take advantage of the present invention do not recognize the headers and therefore will reject these additional frames. Согласно второму решению информация об огибающей спектра верхней полосы передается как дополнительные данные в кодированном потоке битов. According to a second solution of the information about the spectral envelope of the highband is transmitted as additional data in the coded bit stream. Однако доступное поле дополнительных данных должно быть достаточно большим, чтобы вместить информацию огибающей. However, the availability of additional data field should be large enough to hold the envelope information. В случаях, когда ни одно из двух первых решений не применимо, может быть использовано третье решение, согласно которому информация огибающей спектра верхней полосы скрыта в виде выборок субполос. In cases where none of the first two solutions are not applicable, the third solution, according to which information highband spectral envelope is hidden as subband samples, it may be used. Масштабные коэффициенты выбора субполос перекрывают большой динамический диапазон, обычно превышающий 100 дБ. Large-scale selection subband coefficients cover a large dynamic range, typically exceeding 100 dB. Таким образом, возможно установить произвольное количество масштабных коэффициентов выборок субполос (2505 на фиг.25) на очень малые значения и передавать масштабные коэффициенты верхней полосы "замаскированными" в виде выборок субполос 2501. Этот способ передачи масштабных коэффициентов верхней полосы в декодер 2503 обеспечивает совместимость с синтаксом потока битов. Thus, it is possible to set an arbitrary number of subband samples, scale factors (2505 in Figure 25) to very small values ​​and transmit the highband scale factors "camouflaged" as subband samples, 2501. This way of transmitting the highband scale factors to the decoder 2503 ensures compatibility with the The syntax of the bit stream. Следовательно, в этом режиме могут передаваться произвольные данные. Hence, arbitrary data can be transferred in this mode. Известен сходный способ, в котором информация кодируется в потоке выборок субполос (патент США 5687191). Known similar method in which information is encoded in the subband sample stream (US Patent 5,687,191). Четвертое решение (фиг.26) может быть применено, когда система кодирования использует кодирование Хафмана или другое кодирование с избыточностью (2603). A fourth solution (Figure 26) can be applied when a coding system uses Huffman coding or other coding redundancy (2603). Выборку субполос для верхней полосы затем устанавливаются в нуль (2601) или в постоянное значение для достижения высокой избыточности. Sample subband for the highband is then set to zero (2601) or to a constant value in order to achieve a high redundancy.

Улучшение отклика переходного процесса Improve transient response

Искажения, связанные с переходными процессами, являются общей проблемой в кодеках аудиосигналов, и подобные искажения имеют место и для настоящего изобретения. Distortion related transients are a common problem in audio codecs, and similar distortions occur and for the present invention. В принципе, связывание создает спектральные "нули" или провалы, соответствующие предварительным и последующим эхо-сигналам во временной области, т.е. In principle, the binding generates spectral "zeros" or dips corresponding pre- and post-echo signals in the time domain, i.e., ложным переходным процессом до и после "истинных" переходных процессов. false transition process before and after "true" transients. Хотя Р-блоки "заполняют нули" для медленно изменяющихся тональных сигналов, однако предварительные и последующие эхо-сигналы остаются. Although the P-blocks "fill in the zeros" for slowly varying tonal signals, but pre- and post-echoes remain. Усовершенствованный многополосный способ предназначен для работы на дискретных синусоидах, причем количество синусоид ограничено одной на субполосу. The improved multiband method is intended to work on discrete sinusoids, where the number of sinusoids is restricted to one subband. Переходные процессы или шум в субполосе могут рассматриваться как большое количество дискретных синусоид в такой субполосе. Transients or noise in a subband can be viewed as a large number of discrete sinusoids in a subband. Это создает интермодуляционное искажение. This creates intermodulation distortion. Такие искажения рассматриваются как дополнительные источники шумов квантования, связанные с дублированными каналами верхней полосы на интервалах переходных процессов. Such distortions are considered as additional quantization noise sources associated with redundant higher-band channels at intervals transients. Для усовершенствования субъективного качества усовершенствованного многополосового способа могут быть использованы традиционные способы устранения предварительных и последующих эхо-сигналов в перцептуальных кодерах аудиосигналов, например, адаптивное переключение окна. Traditional methods for removing the preliminary and subsequent echo signals in perceptual audio coders, for example adaptive window switching can be used to improve the subjective quality of the improved method mnogopolosovogo. Использование детектирования переходных процессов, обеспечиваемого кодеком или отдельным детектором, и уменьшение количества каналов, находящихся в условиях переходных процессов, приводит к тому, что шумы квантования не превышают зависящего от времени порога маскирования. Using transient detection provided by the codec or a separate detector and reducing the number of channels in situations of transient leads to the fact that quantization noise does not exceed the time-dependent masking threshold. Меньшее количество каналов используется при прохождении переходных процессов, в то время как большее количество используется при прохождении тональных сигналов. Minimal number of channels used at passage transients, while the greater number of passes used for the tones. Такое адаптивное переключение окна обычно применяется в кодеках для использования компромисса между частотной разрешающей способностью временной разрешающей способностью. Such adaptive window switching is commonly used in codecs to use a compromise between the frequency resolution temporal resolution. Различные способы могут быть использованы в задачах, где размер набора фильтров является фиксированным. Various methods can be used in applications where the filterbank size is fixed. Одним их подходов является преобразование шумов квантования во времени путем линейного прогнозирования в спектральной области. One approach is to transform them into time quantization noise by a linear prediction in the spectral domain. Транспозиция затем выполняется на остаточном сигнале, который является выходным результатом фильтра линейного предсказания. The transposition is then performed on the residual signal which is an output result of the linear prediction filter. После этого фильтр инверсного предсказания применяется одновременно к исходному и спектрально-дублированному каналам. After this inverse prediction filter is applied simultaneously to the source and spectrally duplicated channels. Другой подход использует систему компандера (компрессор + экспандер), т.е. Another approach employs a compander system (compressor expander +), i.e. динамическое сжатие переходного сигнала перед транспозицией или кодированием, и дополнительное расширение после транспозиции. dynamic compression of the transient signal prior to transposition or coding, and additional expansion after transposition. Возможно также попеременное использование способов транспозиции в зависимости от сигнала, например способ транспозиции с набором фильтров высокой разрешающей способности используется для стационарных сигналов, а способ прогнозирования изменяющейся по времени схемы поиска используется для переходных сигналов. It is also possible to use alternate methods transposition depending on the signal, such as transposition method with filters set of high resolution is used for stationary signals, and a method for predicting the changing time search circuit used for transient signals.

Практическое осуществление practical implementation

При использовании стандартных процессоров сигнала или персональных компьютеров с большими вычислительными возможностями возможна работа кодека на основе ДСП в режиме реального времени. When using a standard signal processors or personal computers with high computing power can work codec based on DSP in real time. Такой кодек может быть выполнен в виде аппаратных средств на обычной микросхеме. This codec may be implemented in hardware in a conventional chip. Он может быть также выполнен в различных видах систем для хранения или передачи сигналов, аналоговых или цифровых, с использованием произвольных кодеков (фиг.27 и фиг.28). It may also be formed in various kinds of systems for storage or transmission of signals, analogue or digital, using arbitrary codecs (27 and 28). Способ ДСП-1 может быть интегрирован в декодер или обеспечиваться как дополнительный модуль постобработки, аппаратный или программный. Method DSP-1 may be integrated in a decoder or provided as an optional postprocessing module, a hardware or software. Способ ДСП-2 требует дополнительной модификации кодера. Method DSP-2 requires additional modification of the encoder. Как показано на фиг.21, аналоговой входной сигнал подается на аналого-цифровой преобразователь 2701, формирующий цифровой сигнал, который подается на произвольный кодер 2703, на котором выполняется исходное кодирование. As shown in Figure 21, the analog input signal applied to an analog to digital converter 2701, forming a digital signal which is fed to the an arbitrary encoder 2703, where source coding is performed. Сигнал, подаваемый в систему, может быть сигналом нижних частот того типа, спектральные полосы которого уже были отброшены в пределах звукового диапазона или спектральные полосы которого отбрасываются в произвольном кодере. The signal fed into the system may be a signal of a lowpass type, whose spectral bands have been pushed within the audio range or spectral bands are discarded in the arbitrary encoder. Результирующие сигналы нижней полосы подаются на мультиплексор 2705, формирующий последовательный поток битов, который передается или запоминается (2707). The resulting lowband signals are fed to the multiplexer 2705, forming a serial bitstream which is transmitted or stored (2707). Демультиплексор 2709 восстанавливает эти сигналы и подает их на произвольный дешифратор 2711. Информация огибающей спектра 2715 оценивается в дешифраторе 2711 и подается на блок ДСП-1 2713, который транспортирует сигнал нижней полосы в сигнал верхней полосы и создает широкополосный сигнал с подстраиваемой огибающей спектра. Demultiplexer 2709 restores the signals and feeds them to an arbitrary decoder 2711. spectral envelope information 2715 is estimated at the decoder 2711 and fed to the DSP-unit January 2713, which transports the lowband signal to a highband signal and creates a signal with the adjustable wideband spectral envelope. Наконец, цифровой широкополосный сигнал преобразуется (2717) в аналоговый выходной сигнал. Finally, the digital wideband signal is converted (in 2717) into an analog output signal.

Способ ДСП-2 требует дополнительной модификации кодера. Method DSP-2 requires additional modification of the encoder. Согласно фиг.28, аналоговый входной сигнал подается на аналого-цифровой преобразователь 2801, формируя цифровой сигнал, который подается на произвольный кодер 2803, в котором выполняется исходное кодирование. According to Figure 28, an analog input signal applied to an analog to digital converter 2801, forming a digital signal which is fed to the an arbitrary encoder 2803, where source coding is performed. Информация огибающей спектра выделяется 2805. Результирующие сигналы, выборки субполос нижней полосы или коэффициенты и информация широкополосной огибающей подаются на мультиплексор 2807, формируя последовательный поток битов, который передается или запоминается (2809). Information allocated spectrum envelope 2805. The resulting signals, lowband subband samples or coefficients and wideband envelope information is fed to the multiplexer 2807, forming a serial bitstream which is transmitted or stored (2809). Демультиплексор 2811 восстанавливает эти сигналы, выборки субполос нижней полосы или коэффициенты и информацию широкополосной огибающей и подает их на произвольный декодер 2815. Информация огибающей спектра 2813 подается с демультиплексора 2811 на блок ДСП-2 2817, который транспонирует сигнал нижней полосы в сигнал верхней полосы и создает широкополосный сигнал С подстраиваемой огибающей спектра. Demultiplexer 2811 restores the signals, lowband subband samples or coefficients and wideband envelope information, and feeds them to an arbitrary decoder 2815 spectral envelope information 2813 is fed from the demultiplexer 2811 to block DSP-February 2817 which transposes the lowband signal to a highband signal and creates With the adjustable wideband signal spectrum envelope. Наконец, цифровой широкополосный сигнал преобразуется (2819) в аналоговый выходной сигнал. Finally, the digital wideband signal is converted (in 2819) into an analog output signal.

Когда доступны только очень низкие скорости передачи (интернет и низкоскоростные телефонные модемы, АМ-радиовещение и т.п.) неизбежно монокодирование материала аудиопрограмм. When available only a very low rate (low-speed Internet and telephone modems, AM-radioveschenie etc.) inevitably monokodirovanie audio program material. Чтобы улучшить качество восприятия и сделать звучание программ более приятным, создается простой "псевдостерео" генератор (фиг.29) путем введения линии задержки с отводами 2901. Это позволяет подавать сигналы с задержкой 10 мсек и 15 мсек с уровнем примерно 06 дБ (2903) на каждый выходной канал в дополнение к исходному моно-сигналу 2905. Этот псевдостереогенератор обеспечивает значительное улучшение восприятия при низких вычислительных затратах. To improve perceptual quality and make the program more pleasant sounding, a simple creates a "pseudo" generator (29) by introducing the tapped delay line 2901. This makes it possible to give signals with a delay of 10 msec and 15 msec from the level approximately 06 dB (2903) in each output channel in addition to the original mono signal 2905. This provides a significant improvement psevdostereogenerator perception at low computational cost.

Вышеописанные варианты осуществления иллюстрируют принципы настоящего изобретения, направленного на усовершенствования кодирования источников аудиосигнала. The foregoing embodiments illustrate the principles of the present invention is directed to improvements in audio signal coding sources. Ясно, что модификации и варианты описанных устройств и деталей их осуществления будут очевидны для специалистов в данной области техники. It is clear that modifications and variations of the described devices and the details of their implementation will be apparent to those skilled in the art. Поэтому объем изобретения ограничивается только последующей формулы изобретения, а не конкретными деталями, представленными при описании вариантов его осуществления. Therefore, the scope of the invention is limited only by the following claims and not by the specific details set forth in the description of embodiments thereof.

Claims (22)

  1. 1. Способ декодирования кодированного сигнала (201, 301), причем кодированный сигнал получен из исходного сигнала и представляет только часть полос частот, включенных в исходный сигнал, частотное содержимое кодированного сигнала (201, 301) представлено выборками субполос для множества субполос или представлено множеством спектральных коэффициентов, заключающийся в том, что выделяют первый полосовой сигнал (203, 303), причем первый полосовой сигнал имеет выборки субполос из предварительно определенного количества анализируемых субполос или имеет 1. A method for decoding an encoded signal (201, 301), wherein the encoded signal is derived from the original signal and represents only a portion of frequency bands included in the original signal, the frequency content of the encoded signal (201, 301) is represented by the subband samples for a plurality of subbands or a plurality of spectral represented coefficients, comprising the steps of isolating a first bandpass signal (203, 303), said first bandpass signal having subband samples from a predetermined number of subbands or analytes has предварительно определенное количество анализируемых спектральных коэффициентов, при этом первый полосовой сигнал имеет полосу частот меньшую полосы частот кодированного сигнала (201, 301), осуществляют транспозицию (205, 305) выборок субполос из субполос анализа или спектральных коэффициентов анализа, включенных в полосовой сигнал (203, 303), во второй полосовой сигнал (205, 305), имеющий частотное содержимое, которое включено в исходный сигнал и которое не включено в кодированный сигнал, причем второй полосовой сигнал имеет субполосы синтеза или с a predetermined amount of the analyzed spectral coefficients, wherein the first bandpass signal has a bandwidth less encoded signal bandwidth (201, 301) carried transposition (205, 305) the subband samples of the analysis subbands or spectral analysis coefficients included in the bandpass signal (203, 303), a second bandpass signal (205, 305) having a frequency content that is included in the original signal and that is not included in the encoded signal, the second bandpass signal having subband synthesis or ектральные коэффициенты синтеза, а при осуществлении транспозиции присоединяют субполосы анализа к субполосам синтеза или присоединяют спектральные коэффициенты анализа к спектральным коэффициентам синтеза, при этом выбранные выборки субполос или спектральные коэффициенты, включенные во второй полосовой сигнал (203, 303), перед или после осуществления транспозиции подстраивают по огибающей спектра с использованием информации огибающей спектра, полученной из исходного сигнала или кодированного сигнала, для получения подстроенных по о ektralnye coefficients of the synthesis, and for implementing transposition attached subband analysis to subbands synthesis or attached spectral coefficients of the analysis to the spectral coefficients of the synthesis, the selected sample of subbands or spectral coefficients included in the second band signal (203, 303), before or after the transposition will adapt for spectral envelope using spectral envelope information derived from the original signal or the encoded signal to obtain rigged for about гибающей спектра транспонированных выборок субполос или подстроенных по огибающей спектра транспонированных спектральных коэффициентов, и объединяют выборки субполос и подстроенные транспонированные выборки субполос или спектральные коэффициенты и подстроенные транспонированные спектральные коэффициенты для получения выходного сигнала (209, 309), причем выходной сигнал имеет частотное содержимое, включающее в себя частотное содержимое кодированного сигнала и частотное содержимое второго полосового сигнала. bending spectrum transposed samples subband or rigged on the spectral envelope of the transposed spectral coefficients, and combining the sampling subband and rigged transposed sampling subbands or spectral coefficients and rigged transposed spectral coefficients to produce an output signal (209, 309), wherein the output signal has a frequency content, comprising himself frequency content of the encoded signal and the second frequency band signal contents.
  2. 2. Способ по п.1, отличающийся тем, что полосу (полосы) пропускания подстроенных транспонированных выборок субполос или подстроенных транспонированных спектральных коэффициентов устанавливают так, чтобы не перекрывать или только частично перекрывать полосу (полосы) пропускания выборок субполос или спектральных коэффициентов, представляющих частотное содержимое кодированного сигнала. 2. A method according to claim 1, characterized in that the strip (strips) transmission rigged transposed subband samples or rigged transposed spectral coefficients are set so as not to overlap or only partly overlap the band (band) pass subband samples or spectral coefficients representing the frequency content encoded signal.
  3. 3. Способ по п.1, отличающийся тем, что дополнительно оценивают информацию огибающей спектра второго полосового сигнала с использованием кодированного сигнала. 3. A method according to claim 1, characterized in that it further evaluate the spectrum envelope information of the second band signal using the encoded signal.
  4. 4. Способ по п.1, отличающийся тем, что кодированный сигнал дополнительно включает в себя переданную информацию огибающей спектра в восстановленной полосе частот, которая была отброшена при кодировании исходного сигнала, при этом дополнительно демультиплексируют (2811) переданную информацию огибающей отброшенной полосы (полос) частот исходного сигнала из кодированного сигнала. 4. The method of claim 1, wherein the encoded signal further includes transmitted spectral envelope information in the restored frequency band that has been discarded when coding the original signal, the method further comprising demultiplexing (2811) the transmitted information envelope of the discarded bands (strips) starting signal from the encoded signal.
  5. 5. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде выборок субполос в произвольном количестве каналов субполос кодированного сигнала, причем усиления упомянутых каналов субполос устанавливают на низкий уровень. 5. The method of claim 4, wherein the spectral envelope information is transmitted in the form of subband samples in an arbitrary number of channels encoded subband signal, the gain of said subband channels set to a low level.
  6. 6. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде масштабных коэффициентов без передачи соответствующих выборок субполос в кодированном сигнале. 6. The method of claim 4, wherein the spectral envelope information is transmitted as scale factors without transmission of the corresponding subband samples in the encoded signal.
  7. 7. Способ по п.4, отличающийся тем, что информацию огибающей спектра передают в виде масштабных коэффициентов и соответствующие выборки субполос устанавливают в кодированном сигнале на нуль или на постоянную величину. 7. The method of claim 4, wherein the spectral envelope information is transmitted as scale factors and the corresponding subband samples in the encoded signal is set to zero or to a constant value.
  8. 8. Способ по п.1, отличающийся тем, что декодированный выходной сигнал представляет собой монофонический аудиосигнал, при этом дополнительно расщепляют декодированный выходной сигнал на два сигнала, каждый из которых состоит из упомянутого выходного сигнала и задержанных его версий для получения псевдостереосигнала. 8. A method according to claim 1, characterized in that the decoded output signal is a monophonic audio signal, the method further digested decoded output signal into two signals each comprised of said output signal and delayed versions of it to obtain psevdostereosignala.
  9. 9. Способ по п.1, отличающийся тем, что осуществляют фильтрацию сигнала посредством набора из N≥2 полосовых фильтров, причем упомянутые фильтры имеют полосы пропускания, содержащие соответственно частоты [f 1 ,...,f N ], для формирования N сигналов субполос, при этом при транспозиции осуществляют сдвиг сигналов субполос по частоте в области, содержащей частоты M[f 1 ,...,f N ], где M≠1 - коэффициент транспозиции. 9. A method according to claim 1, characterized in that a signal filtering is carried out through a set of bandpass filters, N≥2, wherein said filters have passbands comprising respectively the frequency [f 1, ..., f N], for generating signals N subband, the transposition carried out with the shift frequency subband signals in the region containing the frequencies M [f 1, ..., f N], where M ≠ 1 - transposition factor.
  10. 10. Способ по п.9, отличающийся тем, что сдвиг по частоте получают путем модуляции верхней боковой полосы (ВВП). 10. The method according to claim 9, characterized in that the frequency shift is obtained by modulating the upper sideband (GDP).
  11. 11. Способ по п.1, отличающийся тем, что осуществляют полосовую фильтрацию сигнала с использованием набора фильтров анализа или преобразования такого характера, что генерируют действительные или комплексные сигналы субполос анализа типа нижних частот, причем при упомянутой транспозиции осуществляют связывание произвольного количества каналов k упомянутого набора фильтров анализа или преобразования с каналами Mk, М≠1, в наборе фильтров синтеза или преобразования, где М - коэффициент транспозиции, при этом набор фильтров или преобразовани 11. A method according to claim 1, characterized in that the band-pass signal filtering is carried out using an analysis filterbank or transform of such a nature that the generated real or complex signal analysis subband lowpass type, and binding is performed an arbitrary number of channels k of said set at said transposition analysis filterbank or transform to channels Mk, M ≠ 1, in a synthesis filterbank or transform, where M - a transposition factor, wherein the filterbank or transform е используют при фильтрации или выполнении инверсного преобразования. e used in the filtering or performing an inverse transform.
  12. 12. Способ по п.11, отличающийся тем, что набор фильтров характеризуется максимальным прореживанием, при этом связывание выполняют в соответствии с соотношением: 12. The method of claim 11, wherein the filter stack characterized by a maximum decimation, wherein the binding is performed in accordance with the relationship:
    V Mk (n)=(-1) (M-1)kn V k (n), V Mk (n) = (- 1) (M-1) kn V k (n),
    где (-1) (M-1)kn - коэффициент коррекции; where (-1) (M-1) kn - correction coefficient; V k (n) - сигнал субполосы канала k; V k (n) - a signal channel subband k; V Mk (n) - сигнал субполосы канала Mk, при этом обеспечивают компенсацию спектрально инвертированных сигналов субполос. V Mk (n) - signal subband channel Mk, while providing compensation of spectral inverted subband signals.
  13. 13. Способ по п.1, отличающийся тем, что при транспозиции осуществляют связывание фаз выборок субполос анализа или частотных коэффициентов анализа из каналов k набора фильтров анализа или преобразования в качестве фаз выборок субполос, связанных с каналами Mk синтеза, где М - коэффициент транспозиции, являющийся целым числом, не равным 1, и k - номер канала, и осуществляют связывание амплитуд выборок субполос анализа или спектральных коэффициентов анализа из последовательных каналов l набора фильтров анализа или преобразования в качестве ампл 13. A method according to claim 1, characterized in that the transposition is carried out at the binding phase sample analysis subbands or the analysis frequency coefficients from channels k of an analysis filterbank or transform as phases of subband samples associated with synthesis channels Mk, where M - a transposition factor, It is an integer not equal to 1, and k - number of the channel and the amplitudes of samples carried binding analysis subbands or the analysis spectral coefficients from consecutive channels l of an analysis filterbank or transform as Vp итуд выборок субполос или спектральных коэффициентов, связанных с последовательными каналами синтеза l+S, где S - целое число, не равное 1, и l - номер канала. itud subband samples or spectral coefficients associated with consecutive synthesis channels l + S, where S - is an integer not equal to 1, and l - channel number.
  14. 14. Способ по п.13, отличающийся тем, что при транспозиции фазы выборок субполос анализа каналов k умножают на коэффициент М перед использованием упомянутого набора фильтров синтеза или преобразования. 14. The method according to claim 13, characterized in that the channel transposition phase analysis of samples subband k multiplied by a factor M before using said synthesis filterbank or transform.
  15. 15. Способ по п.13, отличающийся тем, что M=K± 1 , где К - целое число большее, чем 1. 15. The method of claim 13, wherein M = K ± 1, where K - is an integer greater than 1.
  16. 16. Способ по п.11, отличающийся тем, что при упомянутом связывании используют множество значений коэффициента М транспозиции. 16. The method according to claim 11, characterized in that in said binding using a plurality of values ​​of the transposition factor M.
  17. 17. Способ обеспечения транспонированного сигнала, который транспонирован с коэффициентом М, из входного сигнала, из которого отброшена по меньшей мере одна полоса частот, заключающийся в том, что осуществляют фильтрацию входного сигнала с использованием параллельного набора из L фильтров с импульсными характеристиками вида 17. A method of providing transposed signal which is transposed a factor M, of the input signal from which the discarded at least one frequency band, comprising the steps that perform input filtering using parallel sets of L filter with impulse response of the form
    Figure 00000042
    где k=0,1,...,L-1, К - константа, р 0 (n) - модель фильтра нижних частот длины N, формирующего набор из L комплексных сигналов, осуществляют дискретизацию с пониженной частотой упомянутого набора из L сигналов с коэффициентом L/M для формирования набора из L комплексных сигналов субполос, осуществляют умножение фазовых углов упомянутого набора из L комплексных сигналов субполос на М для формирования нового набора сигналов субполос, осуществляют выделение действительных частей упомянутого нового набора сигналов субполос для формирования набора из L where k = 0,1, ..., L-1, K - constant p 0 (n) - model lowpass filter length N, forming a set of L complex signals, sampling is performed with a lower frequency of said set of signals L ratio L / M to generate the set of L complex subband signals, perform multiplication phase angles of said set of L complex subband signals on M for generating a new set of subband signals the allocation is performed real parts of said new set of subband signals to generate the set of L ействительных сигналов субполос, осуществляют дискретизацию с повышенной частотой упомянутого набора из L действительных сигналов субполос с коэффициентом L' для формирования набора действительных сигналов, осуществляют фильтрацию упомянутого набора действительных сигналов посредством параллельного набора из L' фильтров с импульсными откликами вида Valid The subband signals, perform oversampling said set of L real subband signals by a factor of L 'to generate the set of valid signals carried filtering said set of valid signals via parallel sets of L' filters with impulse responses of the form
    Figure 00000043
    где k=0,1,...,L'-1, К' - константа, р' 0 (n) - модель фильтра нижних частот длины N', формирующего набор из L' отфильтрованных сигналов, и осуществляют суммирование упомянутого набора из L' отфильтрованных сигналов и входного сигнала для формирования транспонированного сигнала. where k = 0,1, ..., L'-1, K - constant r '0 (n) - model lowpass filter length N', forming a set of L 'filtered signals, and summing said set carried out L 'filtered signals and the input signal for forming the transposed signal.
  18. 18. Способ по п.17, отличающийся тем, что умножение упомянутых фазовых углов и выделение действительной части для получения набора из L действительных сигналов субполос выполняют посредством вычислений при определении упомянутого набора комплексных сигналов субполос в виде 18. The method according to claim 17, characterized in that the phase angles of said multiplication and isolation of the real part to obtain a set of L real subband signals is performed by computation in determining said set of complex subband signals in the form of
    Z k (n)=R k (n)+jI k (n), Z k (n) = R k (n) + jI k (n),
    где R k (n) и I k (n) - действительная и мнимая части Z k (n) соответственно, wherein R k (n) and I k (n) - the real and imaginary parts of Z k (n), respectively,
    вычислении упомянутого набора действительных сигналов субполос W k (n) в виде calculating said set of real subband signals W k (n) in the form
    Figure 00000044
    где Where
    Figure 00000045
    и М - положительный целочисленный коэффициент транспозиции, с использованием следующего тригонометрического тождества: and M - positive integer transposition factor, using the following trigonometric identity:
    cos(Ma)=cos M (a)-(M/2)sin 2 (a)cos M-2 (a)+(M/4)sin 4 (a)cos M-4 (a)..., cos (Ma) = cos M ( a) - (M / 2) sin 2 (a) cos M-2 (a) + (M / 4) sin 4 (a) cos M-4 (a) ...,
    где a=arctg{I k (n)/R k (n)}, и следующих соотношений: where a = arctg {I k (n ) / R k (n)}, and the following relations:
    Figure 00000046
    и and
    Figure 00000047
  19. 19. Декодер для декодирования кодированного сигнала (201, 301), причем кодированный сигнал получен из исходного сигнала или кодированного сигнала и представляет только часть полос частот, включенных в исходный сигнал, частотное содержимое кодированного сигнала (201, 301) представлено выборками субполос для множества субполос или представлено множеством спектральных коэффициентов, содержащий устройство выделения для выделения первого полосового сигнала (203, 303), причем первый полосовой сигнал имеет выборки субполос из предварительно определен 19. Decoder for decoding an encoded signal (201, 301), wherein the encoded signal is derived from the original signal or the encoded signal and only represents a portion of frequency bands included in the original signal, the frequency content of the encoded signal (201, 301) is represented by the subband samples for a plurality of subbands or presents a plurality of spectral coefficients having isolation device for isolating a first bandpass signal (203, 303), said first bandpass signal having subband samples from a pre-defined ого количества субполос анализа или имеет предварительно определенное количество спектральных коэффициентов анализа, при этом первый полосовой сигнал имеет полосу частот меньшую, чем частотное содержимое кодированного сигнала (201, 301), устройство транспозиции для транспозиции (205, 305) выбранных выборок субполос из субполос анализа или спектральных коэффициентов анализа, включенных в первый полосовой сигнал (203, 303), во второй полосовой сигнал (205, 305), имеющий частотное содержимое, которое включено в исходный сигнал и которое не включено в ко th amount of analysis subbands or has a predetermined number of spectral analysis coefficients, wherein the first bandpass signal has a band lower frequency than the frequency content of the encoded signal (201, 301), the transposition device for transposition (205, 305) of selected samples subband of the subband analysis or spectral analysis coefficients included in the first band signal (203, 303), a second bandpass signal (205, 305) having a frequency content that is included in the original signal and that is not included in to дированный сигнал, причем второй полосовой сигнал имеет субполосы синтеза или спектральные коэффициенты синтеза, а транспозиция включает в себя присоединение субполос анализа к субполосам синтеза или присоединение спектральных коэффициентов анализа к спектральным коэффициентам синтеза, при этом выбранные выборки субполос или спектральные коэффициенты, включенные во второй полосовой сигнал (203, 303), перед или после выполнения транспозиции подстраивают (207, 307) по огибающей спектра с использованием информации огибающей спектра, полученн dirovanny signal, the second bandpass signal having subband synthesis or spectral synthesis coefficients and transposition includes joining analysis subbands to synthesis subband or joining spectral analysis coefficients to the spectral coefficients of the synthesis, the selected sample of subbands or spectral coefficients included in the second band signal (203, 303) before or after the transposition will adapt (207, 307) of the spectrum envelope using the spectrum envelope information obtained ой из исходного сигнала или кодированного сигнала, для получения подстроенных по огибающей спектра транспонированных выборок субполос или подстроенных по огибающей спектра транспонированных спектральных коэффициентов и устройство объединения для объединения выборок субполос и подстроенных транспонированных выборок субполос или спектральных коэффициентов и подстроенных транспонированных спектральных коэффициентов для получения выходного сигнала (209, 309), причем выходной сигнал имеет частотное содержимое, включающее в себя частот th of the original signal or the encoded signal to obtain rigged on the spectral envelope of the transposed samples subband or rigged on the spectral envelope of the transposed spectral coefficients and combining apparatus for combining the subband samples and rigged transposed samples of subbands or spectral coefficients and rigged transposed spectral coefficients to produce an output signal ( 209, 309), wherein the output signal has a frequency content including the frequency ое содержимое кодированного сигнала и частотное содержимое второго полосового сигнала. th content of the encoded signal and the second frequency band signal contents.
  20. 20. Устройство для обеспечения транспонированного сигнала, который транспонирован с коэффициентом М, из входного сигнала, из которого отброшена по меньшей мере одна полоса частот, содержащее фильтр для фильтрации входного сигнала с использованием параллельного набора из L фильтров с импульсными откликами вида 20. An apparatus for providing transposed signal which is transposed a factor M, of the input signal from which the discarded at least one frequency band, comprising a filter for filtering the input signal using a parallel set of L filters with impulse responses of the form
    Figure 00000048
    где k=0,1,...,L-1, К – константа; where k = 0,1, ..., L-1, K - constant; р 0 (n) - модель фильтра нижних частот длины N; p 0 (n) - the model low-pass filter of length N; М - коэффициент, формирующий набор из L комплексных сигналов, устройство дискретизации с пониженной частотой для дискретизации с пониженной частотой упомянутого набора из L сигналов с коэффициентом L/M для формирования набора из L комплексных сигналов субполос, умножитель для умножения фазовых углов упомянутого набора комплексных сигналов субполос на М для формирования нового набора сигналов субполос, устройство выделения для выделения действительных частей упомянутого нового набора сигналов субполос для формирования набора из L дейст M - factor, forming a set of L complex signals, the sampling device with a reduced frequency for sampling a lower frequency of said set of L signal by a factor L / M to generate the set of L complex subband signals, a multiplier for multiplying the phase angles of said set of complex subband signals to M to form a new set of subband signals, allocating device for allocating the real parts of said new set of subband signals to generate the set of L the action ительных сигналов субполос, устройство дискретизации с повышенной частотой для дискретизации с повышенной частотой упомянутого набора из L действительных сигналов субполос с коэффициентом L' для формирования набора действительных сигналов, фильтр для фильтрации упомянутого набора действительных сигналов посредством параллельного набора из L' фильтров с импульсными откликами вида itelnyh subband signals, the sampling device with high frequency for oversampling said set of L real subband signals by a factor of L 'to generate the set of valid signals, a filter for filtering said set of valid signals via parallel sets of L' filters with impulse responses of the form
    Figure 00000049
    где k=0,1,...,L'-1, К' - константа, p' 0 (n) - модель фильтра нижних частот длины N', формирующего набор из L' отфильтрованных сигналов, и сумматор для суммирования упомянутого набора из L' отфильтрованных сигналов и входного сигнала для формирования транспонированного сигнала. where k = 0,1, ..., L'-1, K - constant, p '0 (n) - model lowpass filter length N', forming a set of L 'filtered signals, and an adder for summing said set of L 'filtered signals and the input signal for forming the transposed signal.
    Приоритеты: priorities:
  21. 10.06.1997 - пп.1-16 и 19; 10.06.1997 - claims 1-16 and 19;
  22. 30.01.1998 - пп.17, 18 и 20. 30.01.1998 - Claims 17, 18 and 20.
RU99104814A 1997-06-10 1998-06-09 Improving initial coding using duplicating band RU2256293C2 (en)

Priority Applications (5)

Application Number Priority Date Filing Date Title
SE9702213 1997-06-10
SE9702213-1 1997-06-10
SE9704634-6 1997-12-12
SE9800268-6 1998-01-30
SE9800268 1998-01-30

Publications (2)

Publication Number Publication Date
RU99104814A true RU99104814A (en) 2001-01-27
RU2256293C2 true RU2256293C2 (en) 2005-07-10

Family

ID=35838713

Family Applications (1)

Application Number Title Priority Date Filing Date
RU99104814A RU2256293C2 (en) 1997-06-10 1998-06-09 Improving initial coding using duplicating band

Country Status (1)

Country Link
RU (1) RU2256293C2 (en)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2487428C2 (en) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Apparatus and method for calculating number of spectral envelopes
RU2490728C2 (en) * 2009-05-27 2013-08-20 Долби Интернешнл Аб Efficient combined harmonic transposition
RU2493618C2 (en) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Improved harmonic conversion
RU2494478C1 (en) * 2009-10-21 2013-09-27 Долби Интернешнл Аб Oversampling in combined transposer filter bank
RU2495505C2 (en) * 2009-01-16 2013-10-10 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
RU2498420C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2507572C2 (en) * 2008-07-11 2014-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoding device and decoder for encoding/decoding quantised audio signal frames
RU2512090C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Apparatus and method of generating wide bandwidth signal
RU2596594C2 (en) * 2009-10-20 2016-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Audio signal encoder, audio signal decoder, method for encoded representation of audio content, method for decoded representation of audio and computer program for applications with small delay
RU2598035C1 (en) * 2013-01-08 2016-09-20 ИНТЕЛ АйПи КОРПОРЕЙШН Methods and apparatus for reducing conflicts in radio communication networks
RU2667629C1 (en) * 2009-01-16 2018-09-21 Долби Интернешнл Аб Cross product-enhanced harmonic transformation

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ШЛЯПОБЕРСКИЙ В.И. Основы техники передачи дискретных сообщений. - М.: Связь, 1973, с.300-306. *

Cited By (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2507572C2 (en) * 2008-07-11 2014-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoding device and decoder for encoding/decoding quantised audio signal frames
RU2512090C2 (en) * 2008-07-11 2014-04-10 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Apparatus and method of generating wide bandwidth signal
US8612214B2 (en) 2008-07-11 2013-12-17 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and a method for generating bandwidth extension output data
RU2487428C2 (en) * 2008-07-11 2013-07-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Apparatus and method for calculating number of spectral envelopes
US9799346B2 (en) 2009-01-16 2017-10-24 Dolby International Ab Cross product enhanced harmonic transposition
RU2495505C2 (en) * 2009-01-16 2013-10-10 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
US8818541B2 (en) 2009-01-16 2014-08-26 Dolby International Ab Cross product enhanced harmonic transposition
RU2646314C1 (en) * 2009-01-16 2018-03-02 Долби Интернешнл Аб Harmonic transformation improved by cross-product
RU2638748C2 (en) * 2009-01-16 2017-12-15 Долби Интернешнл Аб Harmonic transformation improved by cross-product
RU2667629C1 (en) * 2009-01-16 2018-09-21 Долби Интернешнл Аб Cross product-enhanced harmonic transformation
US9236061B2 (en) 2009-01-28 2016-01-12 Dolby International Ab Harmonic transposition in an audio coding method and system
US10043526B2 (en) 2009-01-28 2018-08-07 Dolby International Ab Harmonic transposition in an audio coding method and system
RU2493618C2 (en) * 2009-01-28 2013-09-20 Долби Интернешнл Аб Improved harmonic conversion
RU2498421C2 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2498420C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2595914C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2595951C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2595915C2 (en) * 2009-04-03 2016-08-27 Нтт Докомо, Инк. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2498422C1 (en) * 2009-04-03 2013-11-10 Нтт Докомо, Инк. Speech encoder, speech decoder, speech encoding method, speech decoding method, speech encoding program and speech decoding program
RU2490728C2 (en) * 2009-05-27 2013-08-20 Долби Интернешнл Аб Efficient combined harmonic transposition
RU2596594C2 (en) * 2009-10-20 2016-09-10 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Audio signal encoder, audio signal decoder, method for encoded representation of audio content, method for decoded representation of audio and computer program for applications with small delay
RU2494478C1 (en) * 2009-10-21 2013-09-27 Долби Интернешнл Аб Oversampling in combined transposer filter bank
US9830928B2 (en) 2009-10-21 2017-11-28 Dolby International Ab Oversampling in a combined transposer filterbank
US9384750B2 (en) 2009-10-21 2016-07-05 Dolby International Ab Oversampling in a combined transposer filterbank
US8886346B2 (en) 2009-10-21 2014-11-11 Dolby International Ab Oversampling in a combined transposer filter bank
RU2598035C1 (en) * 2013-01-08 2016-09-20 ИНТЕЛ АйПи КОРПОРЕЙШН Methods and apparatus for reducing conflicts in radio communication networks

Similar Documents

Publication Publication Date Title
Flanagan et al. Speech coding
US20020087304A1 (en) Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
US20030233236A1 (en) Audio coding system using characteristics of a decoded signal to adapt synthesized spectral components
US20050252361A1 (en) Sound encoding apparatus and sound encoding method
US5408580A (en) Audio compression system employing multi-rate signal analysis
US6629078B1 (en) Apparatus and method of coding a mono signal and stereo information
US20070238415A1 (en) Method and apparatus for encoding and decoding
US7469206B2 (en) Methods for improving high frequency reconstruction
US20110004479A1 (en) Harmonic transposition
US20110173006A1 (en) Audio Signal Synthesizer and Audio Signal Encoder
EP0446037A2 (en) Hybrid perceptual audio coding
US20090110208A1 (en) Apparatus, medium and method to encode and decode high frequency signal
US20070063877A1 (en) Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
US7483758B2 (en) Spectral translation/folding in the subband domain
US20110106529A1 (en) Apparatus and method for converting an audiosignal into a parameterized representation, apparatus and method for modifying a parameterized representation, apparatus and method for synthesizing a parameterized representation of an audio signal
US20130051571A1 (en) Apparatus and method for processing an audio signal using patch border alignment
JP2004102186A (en) Device and method for sound encoding
WO2010081892A2 (en) Cross product enhanced harmonic transposition
JP2003323199A (en) Device and method for encoding, device and method for decoding
WO2010003557A1 (en) Apparatus and method for generating a bandwidth extended signal
US20070100610A1 (en) Information Signal Processing by Modification in the Spectral/Modulation Spectral Range Representation
US20110054885A1 (en) Device and Method for a Bandwidth Extension of an Audio Signal
JP2005523480A (en) Parameter display of spatial audio
US20050197831A1 (en) Device and method for generating a complex spectral representation of a discrete-time signal
JP2005521907A (en) Reconstruction of the spectrum based on the frequency conversion of the audio signal having an incomplete spectrum

Legal Events

Date Code Title Description
PD4A Correction of name of patent owner