RU2484542C2

RU2484542C2 - Device for encoding stereophonic signals, device for decoding stereophonic signals and methods realised by said devices

Info

Publication number: RU2484542C2
Application number: RU2010138572A
Authority: RU
Inventors: Тосиюки МОРИИ
Original assignee: Панасоник Корпорэйшн
Priority date: 2008-03-19
Filing date: 2009-03-18
Publication date: 2013-06-10

Abstract

FIELD: information technology.

SUBSTANCE: device for encoding stereophonic signals disclosed in the present invention employs a configuration, having: a sum and difference calculator which generates a monaural signal related to a sum of a left and a right signal forming a stereo signal, and generates a side signal related to the difference between the left and right channel signals; a mode information generator which generates mode information per layer indicating a coding mode of one of monaural coding and stereophonic coding; and first to N-th layer coders which perform monaural coding in an i-th layer (i=1, 2 …, N, where N is an integer equal to or greater than 2) using information related to the monaural signal or performs stereophonic coding in the i-th layer using both the information related to the monaural signal and information related to the side signal, based on the mode information, and provide i-th layer encoded information.

EFFECT: providing scalable coding based on correlation between left and right channel signals and information value and setting layers for performing monaural and stereophonic coding.

13 cl, 20 dwg

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение относится к устройству кодирования стереофонических сигналов, устройству декодирования стереофонических сигналов и способам кодирования и декодирования, которые используются для того, чтобы кодировать стереофоническую речь.The present invention relates to a stereo signal encoding apparatus, stereo signal decoding apparatus, and encoding and decoding methods that are used to encode stereo speech.

Предшествующий уровень техникиState of the art

В мобильной связи кодирование со сжатием для цифровой информации по речи и изображениям является важнейшим для эффективного использования полос частот передачи. В частности, с технологиями речевого кодека (кодирования и декодирования), широко используемыми в мобильных телефонах, связаны большие ожидания, и постоянно растет потребность в дополнительно повышенном качестве звука при традиционном высокоэффективном кодировании с высокой эффективностью сжатия.In mobile communications, compression coding for digital speech and image information is essential for the efficient use of transmission frequency bands. In particular, the technology of the speech codec (encoding and decoding), widely used in mobile phones, has high expectations, and the need for additionally increased sound quality is constantly growing with traditional high-performance encoding with high compression efficiency.

В последнее время с расширением полосы пропускания сетей связи возникает потребность в реализации и высоком качестве звука в речевой связи, и для того, чтобы удовлетворять этой потребности, разработаны системы речевой связи с использованием технологий кодирования стереофонической речи.Recently, with the expansion of the bandwidth of communication networks, a need arises for realizing high sound quality in voice communication, and in order to satisfy this need, voice communication systems using stereo coding technologies have been developed.

В качестве способа кодирования стереофонической речи предусмотрен известный традиционный способ обнаружения монофонического и бокового сигналов и кодирования этих сигналов, при этом монофонический сигнал - это сумма сигнала левого канала и сигнала правого канала, и при этом боковой сигнал - это разность между сигналом левого канала и сигналом правого канала (см. патентный документ 1).As a method of encoding stereophonic speech, a conventional conventional method for detecting monophonic and side signals and encoding these signals is provided, wherein the monophonic signal is the sum of the left channel signal and the right channel signal, and the side signal is the difference between the left channel signal and the right signal channel (see patent document 1).

Сигнал левого канала и сигнал правого канала представляют звук, который прослушивают левое и правое ухо человека, монофонический сигнал может представлять общие элементы между сигналом левого канала и сигналом правого канала, а боковой сигнал может представлять пространственную разность между сигналом левого канала и сигналом правого канала.The left channel signal and the right channel signal represent the sound that the human left and right ears listen to, the monaural signal can represent common elements between the left channel signal and the right channel signal, and the side signal can represent the spatial difference between the left channel signal and the right channel signal.

Имеется высокая корреляция между сигналом левого канала и сигналом правого канала. Следовательно, по сравнению со случаем, когда сигнал правого канала и сигнал левого канала кодируются непосредственно, можно выполнять более надлежащее кодирование в соответствии с признаками монофонического сигнала и бокового сигнала посредством преобразования сигнала правого канала и сигнала левого канала в монофонический и боковой сигнал и последующего кодирования этих преобразованных сигналов так, что можно реализовывать кодирование с меньшей избыточностью, низкой битовой скоростью (битрейтом) и высоким качеством.There is a high correlation between the left channel signal and the right channel signal. Therefore, compared with the case where the right channel signal and the left channel signal are directly encoded, more appropriate coding can be performed in accordance with the characteristics of the monophonic signal and the side signal by converting the right channel signal and the left channel signal into a monophonic and side signal and then encoding these converted signals so that it is possible to implement coding with less redundancy, low bit rate (bit rate) and high quality.

В последнее время стандартизация масштабируемого кодека, имеющего многослойную конфигурацию, изучается, например, в ITU-T (сектор стандартизации связи международного союза по телекоммуникациям) и MPEG (экспертная группа по киноизображению), и более эффективный и более высококачественный речевой кодек требуется.Recently, the standardization of a scalable codec having a multilayer configuration has been studied, for example, in ITU-T (the telecommunication standardization sector of the International Telecommunication Union) and MPEG (motion picture expert group), and a more efficient and higher-quality speech codec is required.

Например, масштабируемое устройство кодирования на основе ITU-T G.729.1 выполняет кодирование на основе рекомендации ITU-T G.729.1 на 8 кбит/с и посредством дополнительного кодирования улучшающего слоя может выполнять кодирование на двенадцати типах битрейтов, к примеру 8 кбит/с, 12 кбит/с, 14 кбит/с, 16 кбит/с, 18 кбит/с, 20 кбит/с, 22 кбит/с, 24 кбит/с, 26 кбит/с, 28 кбит/с, 30 кбит/с и 32 кбит/с. Эта масштабируемость реализуется посредством последовательного кодирования искажения при кодировании нижнего слоя в верхнем слое. Таким образом, масштабируемое устройство кодирования G.729.1 формируется с помощью одного базового слоя с битрейтом 8 кбит/с, одного улучшающего слоя с битрейтом 4 кбит/с и десяти улучшающих слоев с битрейтом 2 кбит/с.For example, a scalable encoding device based on ITU-T G.729.1 performs encoding based on ITU-T G.729.1 recommendation at 8 kbps and, through additional encoding of the enhancement layer, can perform encoding on twelve types of bitrates, for example 8 kbps, 12 kbps, 14 kbps, 16 kbps, 18 kbps, 20 kbps, 22 kbps, 24 kbps, 26 kbps, 28 kbps, 30 kbps and 32 kbps This scalability is realized by sequentially coding distortion when coding the lower layer in the upper layer. Thus, the scalable G.729.1 coding device is formed using one base layer with a bit rate of 8 kbps, one enhancement layer with a bitrate of 4 kbps and ten enhancement layers with a bitrate of 2 kbps.

Кроме того, в качестве технологии выполнения масштабируемого кодирования стереофонических сигналов предусмотрено устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2. Это устройство кодирования стереофонических сигналов выражает дополнительную информацию для каждого слоя посредством заранее определенного числа битов и с помощью заранее определенной вероятностной модели выполняет арифметическое кодирование битовых последовательностей в порядке от старшей битовой последовательности к младшей битовой последовательности. Здесь, данное устройство кодирования стереофонических сигналов имеет признак переключения между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодирования этих сигналов.In addition, as a technology for performing scalable encoding of stereo signals, a stereo signal encoding device is disclosed in Patent Document 2. This stereo signal encoding device expresses additional information for each layer by a predetermined number of bits and, using a predetermined probabilistic model, performs arithmetic encoding of the bit sequences in order from highest bit sequence to low bit howling sequence. Here, this stereo signal encoding device has a sign of switching between the left channel signal and the right channel signal according to a predetermined rule and encoding these signals.

Патентный документ 1. Выложенная заявка на патент (Япония) номер 2001-255892Patent Document 1. Patent Application Laid-Open (Japan) No. 2001-255892

Патентный документ 2. Выложенная заявка на патент (Япония) номер HEI11-317672Patent Document 2. Patent Application Laid-Open (Japan) No. HEI11-317672

Сущность изобретенияSUMMARY OF THE INVENTION

Проблемы, разрешаемые изобретениемProblems Resolved by the Invention

Тем не менее, как описано выше, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, выполнено с возможностью переключаться между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодировать эти сигналы, т.е. это кодирование не зависит от корреляции между сигналом левого канала и сигналом правого канала и от значимости информации. Кроме того, имеется проблема в том, что, хотя предпочтительно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования посредством пользовательских операций в устройстве кодирования стереофонических сигналов, которое выполняет масштабируемое кодирование, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, не может поддерживать это задание.However, as described above, the stereo signal encoding apparatus disclosed in Patent Document 2 is configured to switch between the left channel signal and the right channel signal according to a predetermined rule and encode these signals, i.e. this coding is independent of the correlation between the left channel signal and the right channel signal and the significance of the information. In addition, there is a problem in that, although it is preferable to define a layer for performing monophonic encoding and a layer for performing stereo encoding by means of user operations in a stereo encoding apparatus that performs scalable encoding, the stereo encoding apparatus disclosed in Patent Document 2 is not can support this task.

Следовательно, цель настоящего изобретения заключается в том, чтобы предоставить устройство кодирования стереофонических сигналов, устройство декодирования стереофонических сигналов и способы кодирования и декодирования для выполнения масштабируемого кодирования на основе корреляции между сигналом левого канала и сигналом правого канала и значимости информации и для задания слоя для выполнения монофонического кодирования и слоя для выполнения стереофонического кодирования.Therefore, it is an object of the present invention to provide a stereo signal encoding apparatus, stereo signal decoding apparatus, and encoding and decoding methods for performing scalable encoding based on the correlation between the left channel signal and the right channel signal and the significance of the information and for defining a layer for performing monaural encoding and layer for performing stereo encoding.

Средство решения проблемыProblem Solver

Устройство кодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: модуль вычисления суммы и разности, который формирует монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала; модуль формирования информации режима, который формирует информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и модули кодирования слоев с первого по N-й, которые выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - это целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.The stereo signal encoding apparatus of the present invention uses a configuration having: a sum and difference calculation module that generates a monophonic signal associated with the sum of the first channel signal and the second channel signal forming the stereo signal and generates a side signal associated with the difference between the signal of the first channel and the signal of the second channel; a mode information generating unit that generates mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and coding modules of the first through Nth layers, which perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information related to monophonic signal, or perform stereo coding in the i-th layer using both information related to the monaural signal and information associated with the side signal based on the mode information and provide encoded information of the i-th layer.

Устройство декодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: приемный модуль, который принимает информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; модули декодирования слоев с первого по N-й, которые выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и модуль вычисления суммы и разности, который вычисляет декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.The stereo signal decoding apparatus of the present invention uses a configuration having: a receiving module that receives mode information and encoded layer 1 to N layers information detected by encoding processing in layers 1 to N of which the mode information indicates which monaural encoding and stereo encoding is performed during encoding processing in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) of the stereo encoding device fishing, which performs coding using a first channel signal and second channel signal forming a stereo signal; first to Nth layer decoding modules that perform monophonic decoding or stereo decoding using encoded information of the i-th layer based on mode information and provide the result of decoding the monaural signal in the i-th layer and the result of decoding the side signal in the i-th layer wherein the monaural signal is associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and a sum and difference calculator that calculates a decoded signal of the first channel and a decoded signal of the second channel using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.

Способ кодирования настоящего изобретения включает в себя этапы: формирования монофонического сигнала, связанного с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирования бокового сигнала, связанного с разностью между сигналом первого канала и сигналом второго канала; формирования информации режима в расчете на слой, указывающей режим кодирования одного из монофонического кодирования и стереофонического кодирования; и выполнения монофонического кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполнения стереофонического кодирования в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставления кодированной информации i-го слоя.The encoding method of the present invention includes the steps of: generating a monophonic signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and generating a side signal associated with the difference between the signal of the first channel and the signal of the second channel; generating mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and performing monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information associated with the monophonic signal, or performing stereo coding in the i-th layer with using both information related to the monophonic signal and information related to the side signal based on the mode information and providing encoded information of the i-th layer.

Способ декодирования настоящего изобретения включает в себя этапы: приема информации режима и кодированной информации слоев с первого по N-й, обнаруживаемой посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; выполнения монофонического декодирования или стереофонического декодирования с использованием кодированной информации i-го слоя на основе информации режима и предоставления результата декодирования монофонического сигнала в i-м слое и результата декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и вычисления декодированного сигнала первого канала и декодированного сигнала второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.The decoding method of the present invention includes the steps of: receiving mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of the monophonic encoding and stereo encoding is performed when encoding processing in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) of the stereo signal encoding device, which performs encoding using the signal of the first the signal and the second channel signal forming a stereo signal; performing monophonic decoding or stereo decoding using the encoded information of the i-th layer based on the mode information and providing the result of decoding the monophonic signal in the i-th layer and the result of decoding the side signal in the i-th layer, the monaural signal being associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and computing a decoded signal of the first channel and a decoded signal of the second channel using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.

Преимущества изобретенияAdvantages of the Invention

Согласно настоящему изобретению, посредством выполнения масштабируемого кодирования монофонического сигнала (M-сигнала) и бокового сигнала (S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, и задания режима кодирования для каждого слоя в масштабируемом кодировании на основе информации режима можно выполнять масштабируемое кодирование, согласно корреляции между сигналом левого канала и сигналом правого канала и на основе значимости информации. Кроме того, согласно настоящему изобретению, можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования, так что можно повышать степень свободы в управлении точностью кодирования.According to the present invention, by performing scalable encoding of a monaural signal (M signal) and side signal (S signal) calculated from the L signal and the R signal of the stereo signal, and setting the encoding mode for each layer in scalable encoding based on the mode information scalable coding can be performed according to the correlation between the left channel signal and the right channel signal and based on the significance of the information. Furthermore, according to the present invention, it is possible to define a layer for performing monophonic encoding and a layer for performing stereo encoding, so that the degree of freedom in controlling the accuracy of encoding can be increased.

Краткое описание чертежейBrief Description of the Drawings

Фиг.1 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;1 is a block diagram showing the main components of a stereo signal encoding apparatus according to Embodiment 1 of the present invention;

Фиг.2 является блок-схемой, показывающей основные компоненты в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;FIG. 2 is a block diagram showing main components in a base layer encoding module according to Embodiment 1 of the present invention;

Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;FIG. 3 illustrates operations in the case where a monaural encoding mode is set in a base layer encoding module according to Embodiment 1 of the present invention;

Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;4 illustrates operations in the case where a stereo coding mode is set in a base layer coding unit according to Embodiment 1 of the present invention;

Фиг.5 является блок-схемой, показывающей основные компоненты в модуле монофонического кодирования согласно варианту осуществления 1 настоящего изобретения;5 is a block diagram showing the main components in a monophonic coding module according to Embodiment 1 of the present invention;

Фиг.6 является блок-схемой последовательности операций способа, показывающей алгоритм поиска в модуле зонального поиска согласно варианту осуществления 1 настоящего изобретения;6 is a flowchart showing a search algorithm in a zone search module according to Embodiment 1 of the present invention;

Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска, согласно варианту осуществления 1 настоящего изобретения;7 shows an example of a spectrum represented by pulses that are searched in the zone search module according to Embodiment 1 of the present invention;

Фиг.8 является блок-схемой последовательности операций способа, показывающей предварительную обработку алгоритма поиска в модуле полного поиска согласно варианту осуществления 1 настоящего изобретения;FIG. 8 is a flowchart showing preprocessing a search algorithm in a full search module according to Embodiment 1 of the present invention;

Фиг.9 является блок-схемой последовательности операций способа, показывающей поиск посредством алгоритма поиска модуля полного поиска согласно варианту осуществления 1 настоящего изобретения;FIG. 9 is a flowchart showing a search by the search algorithm of the full search module according to Embodiment 1 of the present invention;

Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска и модуле полного поиска, согласно варианту осуществления 1 настоящего изобретения;10 illustrates an example of a spectrum represented by pulses that are searched in the zone search module and the full search module according to Embodiment 1 of the present invention;

Фиг.11 является блок-схемой, показывающей основные компоненты в модуле монофонического декодирования согласно варианту осуществления 1 настоящего изобретения;11 is a block diagram showing main components in a monaural decoding module according to Embodiment 1 of the present invention;

Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля декодирования спектра согласно варианту осуществления 1 настоящего изобретения;12 is a flowchart showing a decoding algorithm of a spectrum decoding module according to Embodiment 1 of the present invention;

Фиг.13 является блок-схемой, показывающей основные компоненты в модуле стереофонического кодирования согласно варианту осуществления 1 настоящего изобретения;13 is a block diagram showing main components in a stereo coding unit according to Embodiment 1 of the present invention;

Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле интегрирования согласно варианту осуществления 1 настоящего изобретения;Fig. 14 illustrates a state where an M-signal spectrum and an S-signal spectrum are integrated in an integration module according to Embodiment 1 of the present invention;

Фиг.15 иллюстрирует выделение битов в модуле кодирования спектра согласно варианту осуществления 1 настоящего изобретения;Fig. 15 illustrates bit allocation in a spectrum encoding module according to Embodiment 1 of the present invention;

Фиг.16 является блок-схемой, показывающей основные компоненты в модуле стереофонического декодирования согласно варианту осуществления 1 настоящего изобретения;16 is a block diagram showing main components in a stereo decoding module according to Embodiment 1 of the present invention;

Фиг.17 является блок-схемой, показывающей основные компоненты устройства декодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;17 is a block diagram showing the main components of a stereo signal decoding apparatus according to Embodiment 1 of the present invention;

Фиг.18 является блок-схемой, показывающей основные компоненты в модуле декодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;Fig. 18 is a block diagram showing main components in a base layer decoding module according to Embodiment 1 of the present invention;

Фиг.19 является блок-схемой, показывающей основные компоненты в модуле декодирования второго улучшающего слоя согласно варианту осуществления 1 настоящего изобретения; иFig is a block diagram showing the main components in the decoding module of the second enhancement layer according to a variant implementation 1 of the present invention; and

Фиг.20 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения.20 is a block diagram showing the main components of a stereo signal encoding apparatus according to Embodiment 2 of the present invention.

Оптимальный режим осуществления изобретенияThe optimal mode of carrying out the invention

Далее подробно пояснены варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.Embodiments of the present invention are explained in detail below with reference to the accompanying drawings.

Первый вариант осуществленияFirst Embodiment

Фиг.1 является блок-схемой, показывающей основные компоненты устройства 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения. Описывается примерный случай, в котором устройство 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения предоставляет один базовый слой и три улучшающих слоя. Далее поясняется примерный случай, в котором стереофонический сигнал состоит из сигнала левого канала (в дальнейшем "L-сигнала") и сигнала правого канала (в дальнейшем "R-сигнала").1 is a block diagram showing the main components of a stereo signal encoding apparatus 100 according to Embodiment 1 of the present invention. An example case is described in which the stereo signal encoding apparatus 100 according to Embodiment 1 of the present invention provides one base layer and three enhancement layers. The following illustrates an exemplary case in which a stereo signal consists of a left channel signal (hereinafter “L-signal”) and a right channel signal (hereinafter “R-signal”).

На фиг.1 устройство 100 кодирования стереофонических сигналов содержит модуль 101 вычисления суммы и разности, модуль 102 задания режима, модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя, модуль 106 кодирования третьего улучшающего слоя и модуль 107 мультиплексирования.1, a stereo signal encoding apparatus 100 comprises a sum and difference calculator 101, a mode setting module 102, a base layer encoding module 103, a first enhancement layer encoding module 104, a second enhancement layer encoding module 105, a third enhancement layer encoding module 106 and a module 107 multiplexing.

Модуль 101 вычисления суммы и разности вычисляет суммарный сигнал (т.е. монофонический сигнал, в дальнейшем "M-сигнал") и разностный сигнал (т.е. боковой сигнал, в дальнейшем "S-сигнал") с помощью L-сигнала и R-сигнала согласно следующим уравнениям 1 и 2 и выводит результаты в модуль 103 кодирования базового слоя. Здесь, L-сигнал и R-сигнал представляют звук, который прослушивают левое и правое ухо человека, M-сигнал может представлять общие элементы между L-сигналом и R-сигналом, а S-сигнал может представлять пространственную разность между L-сигналом и R-сигналом.The sum and difference calculating unit 101 calculates a sum signal (ie, a monophonic signal, hereinafter “M-signal”) and a difference signal (ie, side signal, hereinafter “S-signal”) using the L signal and R-signal according to the following equations 1 and 2 and outputs the results to the module 103 encoding the base layer. Here, the L signal and the R signal represent the sound that the human left and right ears are listening to, the M signal may represent common elements between the L signal and the R signal, and the S signal may represent the spatial difference between the L signal and R -signal.

M_i=L_i+R_i … (уравнение 1)M _i = L _i + R _i ... (equation 1)

S_i=L_i-R_i … (уравнение 2)S _i = L _i -R _i ... (equation 2)

В уравнениях 1 и 2 нижний индекс "i" представляет номер выборки каждого сигнала, но сигналы могут представляться без "i".In equations 1 and 2, the subscript “i” represents the sample number of each signal, but signals can be represented without “i”.

Например, M_i-сигнал может быть записан просто как M-сигнал.For example, an M _i signal may be recorded simply as an M signal.

Информация режима для задания режима кодирования в модулях кодирования из модуля 103 кодирования базового слоя, модуля 104 кодирования первого улучшающего слоя, модуля 105 кодирования второго улучшающего слоя и модуля 106 кодирования третьего улучшающего слоя принимается в качестве ввода в модуле 102 задания режима посредством пользовательских операций и затем выводится в эти модули кодирования и модуль 107 мультиплексирования. Здесь, пользовательские операции включают в себя ввод с клавиатуры, DIP-переключателя и кнопки и загрузку с PC (персонального компьютера) и т.д.The mode information for setting the encoding mode in the encoding units from the base layer encoding unit 103, the first enhancement layer encoding unit 104, the second enhancement layer encoding unit 105 and the third enhancement layer encoding unit 106 is received as input in the mode setting unit 102 by user operations and then output to these encoding modules and multiplexing module 107. Here, user operations include keyboard input, DIP switch and buttons, and booting from a PC (personal computer), etc.

Режим кодирования в каждом модуле кодирования соответствует режиму монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Здесь, "информация M-сигнала" типично относится к самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, "информация S-сигнала" типично относится к самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.The encoding mode in each encoding module corresponds to a monaural encoding mode for encoding only M-signal information or a stereo encoding mode for encoding both M-signal information and S-signal information. Here, “M-signal information” typically refers to the M-signal itself or coding distortion associated with the M-signal in each layer. In addition, “S-signal information” typically refers to the S-signal itself or coding distortion associated with the S-signal in each layer.

Далее, режим кодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического кодирования, а значение "1" представляет режим стереофонического кодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы кодирования в модуле 103 кодирования базового слоя, модуле 104 кодирования первого улучшающего слоя, модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя.Further, the encoding mode in each layer is shown using each of the bits of the mode information. Thus, in bits, the value “0” represents the monaural encoding mode, and the value “1” represents the stereo encoding mode. More specifically, for example, each of the four bits of mode information is used to sequentially represent encoding modes in the base layer encoding unit 103, the first enhancement layer encoding unit 104, the second enhancement layer encoding unit 105 and the third enhancement layer encoding unit 106.

Например, информация четырехбитового режима "0000" означает, что монофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал с максимальным качеством. Кроме того, например, информация режима "0011" означает, что режимом кодирования в модуле 103 кодирования базового слоя и модуле 104 кодирования первого улучшающего слоя является режим монофонического кодирования, а режимом кодирования в модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя является режим стереофонического кодирования. Кроме того, например, информация режима "1111" означает, что стереофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал и S-сигнал с равным взвешиванием. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов кодирования в четырех модулях кодирования.For example, the four-bit mode information “0000” means that monophonic coding is performed in all layers. In this case, the stereo signal encoding apparatus 100 can encode the M signal with maximum quality. In addition, for example, the “0011” mode information means that the encoding mode in the base layer encoding unit 103 and the first enhancement layer encoding unit 104 is a monophonic encoding mode, and the encoding mode in the second enhancement layer encoding unit 105 and the third enhancement layer encoding unit 106 is a stereo coding mode. In addition, for example, “1111” mode information means that stereo coding is performed in all layers. In this case, the stereo signal encoding apparatus 100 may encode the M signal and the S signal with equal weighting. Thus, using the information of the four-bit mode, sixteen types of encoding modes in four encoding modules can be represented.

В настоящем варианте осуществления информация режима, выводимая из модуля 102 задания режима, принимается в каждом модуле кодирования и модуле 107 мультиплексирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль кодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим кодирования, и задает режим кодирования. Таким образом, в четырех битах входной информации режима модуль 103 кодирования базового слоя проверяет первый бит, модуль 104 кодирования первого улучшающего слоя проверяет второй бит, модуль 105 кодирования второго улучшающего слоя проверяет третий бит, а модуль 106 кодирования третьего улучшающего слоя проверяет четвертый бит.In the present embodiment, the mode information output from the mode setting unit 102 is received in each coding unit and the multiplexing unit 107 as identical input information of the four-bit mode. Additionally, each encoding module checks only one bit of the four input bits required to set the encoding mode, and sets the encoding mode. Thus, in four bits of mode input information, the base layer encoding module 103 checks the first bit, the first enhancement layer encoding module 104 checks the second bit, the second enhancement layer encoding module 105 checks the third bit, and the third enhancement layer encoding module 106 checks the fourth bit.

Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле кодирования, модуль 102 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим кодирования в каждом модуле кодирования, и выводить один бит в каждый модуль кодирования. Таким образом, в информации четырехбитового режима, модуль 102 задания режима может вводить только первый бит в модуле 103 кодирования базового слоя, только второй бит в модуле 104 кодирования первого улучшающего слоя, только третий бит в модуле 105 кодирования второго улучшающего слоя и только четвертый бит в модуле 106 кодирования третьего улучшающего слоя.However, instead of entering identical four-bit mode information in each encoding unit, the mode setting module 102 can pre-sort one bit required to set the encoding mode in each encoding unit and output one bit to each encoding unit. Thus, in the four-bit mode information, the mode setting module 102 can enter only the first bit in the base layer encoding unit 103, only the second bit in the first enhancement layer encoding unit 104, only the third bit in the second enhancement layer encoding unit 105, and only the fourth bit in module 106 encoding the third enhancement layer.

Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 102 задания режима в модуль 107 мультиплексирования, упоминается как информация четырехбитового режима.In addition, in any of the above cases, the mode information received as input from the mode setting unit 102 to the multiplexing unit 107 is referred to as four-bit mode information.

В модуле 103 кодирования базового слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует только M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит и выводит искажение при кодировании базового слоя M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Напротив, после задания режима стереофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует как M-сигнал, так и S-сигнал, принимаемые в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит искажения при кодировании базового слоя M- и S-сигналов, принимаемых в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результаты в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и информацию S-сигнала в базовом слое. Кроме того, модуль 103 кодирования базового слоя подробнее поясняется ниже.In the base layer encoding unit 103, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting unit 102. After setting the monophonic encoding mode in the base layer encoding unit 103, the base layer encoding unit 103 encodes only the M signal received as input from the sum and difference calculation unit 101 and outputs the resulting monophonic encoded information to the multiplexing unit 107 as encoded information of the base layer. Additionally, the base layer encoding module 103 finds and outputs distortion when encoding the base layer of the M signal received as input from the sum and difference calculation module 101 to the encoding module of the first enhancement layer as information of the M signal in the base layer and outputs S- a signal received as input from the sum and difference calculation unit 101, as is the encoding unit 104 of the first enhancement layer as S-signal information in the base layer. On the contrary, after setting the stereo coding mode in the base layer coding unit 103, the base layer coding unit 103 encodes both the M signal and the S signal received as input from the sum and difference calculation unit 101 and outputs the resulting stereo encoded information to the module 107 multiplexing as encoded information of the base layer. Additionally, the base layer encoding unit 103 finds distortions in encoding the base layer of M and S signals received as input from the sum and difference calculation unit 101, and outputs the results to the first enhancement layer encoding unit 104 as M signal information in the base layer and S-signal information in the base layer. In addition, the base layer encoding module 103 is explained in more detail below.

В модуле 104 кодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует информацию M-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое, принимаемой в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и выводит информацию S-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, как есть в модуль 105 кодирования второго улучшающего слоя как информацию S-сигнала в первом улучшающем слое.In the encoding module 104 of the first enhancement layer, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting module 102. After setting the monophonic encoding mode in the encoding module 104 of the first enhancement layer, the encoding module 104 of the first enhancement layer encodes the M-signal information in the base layer received as input from the base layer encoding module 103 and outputs the resulting monophonic encoded information to the multiplexing module 107 as encoded information of the first enhancement layer. Additionally, using the information of the M signal in the base layer received as input from the base layer encoding unit 103, the encoding module 104 of the first enhancement layer finds and outputs distortion when encoding the first enhancement layer associated with the M signal to encoding module 105 of the second the enhancement layer as M-signal information in the first enhancement layer and outputs S-signal information in the base layer, taken as input from the base layer encoding unit 103, as is the second enhancement layer encoding unit 105 as S-signal information in the first enhancement layer.

В отличие от этого, после задания режима стереофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует как информацию M-сигнала в базовом слое, так и информацию S-сигнала в базовом слое, принимаемые в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое и информации S-сигнала в базовом слое, принимаемых в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и информацию S-сигнала в первом улучшающем слое. Кроме того, модуль 104 кодирования первого улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 104 of the first enhancement layer, the encoding module 104 of the first enhancement layer encodes both the M-signal information in the base layer and the S-signal information in the base layer received as input from module 103 encoding the base layer, and outputs the resulting stereo encoded information to the multiplexing unit 107 as encoded information of the first enhancement layer. Further, by using the information of the M signal in the base layer and the information of the S signal in the base layer received as input from the base layer encoding unit 103, the encoding module 104 of the first enhancement layer finds and outputs distortions when encoding the first enhancement layer associated with M - and S-signals, to the encoding module 105 of the second enhancement layer as the M-signal information in the first enhancement layer and the S-signal information in the first enhancement layer. In addition, the encoding module 104 of the first enhancement layer is explained in more detail below.

В модуле 105 кодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует информацию M-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое, принимаемой в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и выводит информацию S-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, как есть в модуль 106 кодирования третьего улучшающего слоя как информацию S-сигнала во втором улучшающем слое.In the encoding unit 105 of the second enhancement layer, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting unit 102. After setting the monophonic encoding mode in the encoding module 105 of the second enhancement layer, the encoding module 105 of the second enhancement layer encodes the M signal information in the first enhancement layer received as input from the encoding module 104 of the first enhancement layer and outputs the resulting monophonic encoded information to the multiplexing module 107 as encoded information of the second enhancement layer. Additionally, using the information of the M signal in the first enhancement layer received as input from the encoding module 104 of the first enhancement layer, the encoding module 105 of the second enhancement layer finds and outputs distortion when encoding the second enhancement layer associated with the M signal to module 106 encoding the third enhancement layer as M-signal information in the second enhancement layer and outputs the S-signal information in the first enhancement layer, taken as input from the encoding module 104 of the first enhancement layer, as is the fashion s 106 of the third enhancement layer coding information as the S-signal in the second enhancement layer.

В отличие от этого, после задания режима стереофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует как информацию M-сигнала в первом улучшающем слое, так и информацию S-сигнала в первом улучшающем слое, принимаемые в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое и информации S-сигнала в первом улучшающем слое, принимаемых в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и информацию S-сигнала во втором улучшающем слое. Кроме того, модуль 105 кодирования второго улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 105 of the second enhancement layer, the encoding module 105 of the second enhancement layer encodes both the M-signal information in the first enhancement layer and the S-signal information in the first enhancement layer, taken as input from a coding unit 104 of the first enhancement layer, and outputs the resulting stereo encoded information to the multiplexing unit 107 as encoded information of the second enhancement layer. Further, by using the M signal information in the first enhancement layer and the S signal information in the first enhancement layer, taken as input from the encoding module 104 of the first enhancement layer, the encoding module 105 of the second enhancement layer finds and outputs distortion when encoding the second enhancement layer, associated with the M and S signals, to the encoding module 106 of the third enhancement layer as the M signal information in the second enhancement layer and the S signal information in the second enhancement layer. In addition, the encoding module 105 of the second enhancement layer is explained in more detail below.

В модуле 106 кодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует информацию M-сигнала во втором улучшающем слое, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя.In the encoding module 106 of the third enhancement layer, the monophonic encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting module 102. After setting the monophonic coding mode in the encoding module 106 of the third enhancement layer, the encoding module 106 of the third enhancement layer encodes the M-signal information in the second enhancement layer received as input from the encoding module 105 of the second enhancement layer and outputs the resulting monophonic encoded information to the multiplexing module 107 as encoded information of the third enhancement layer.

В отличие от этого, после задания режима стереофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует как информацию M-сигнала во втором улучшающем слое, так и информацию S-сигнала во втором улучшающем слое, принимаемые в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя. Кроме того, модуль 106 кодирования третьего улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 106 of the third enhancement layer, the encoding module 106 of the third enhancement layer encodes both the M signal information in the second enhancement layer and the S signal information in the second enhancement layer, taken as input from a second enhancement layer encoding unit 105, and outputs the resulting stereo encoded information to the multiplexing unit 107 as encoded information of the third enhancement layer. In addition, the encoding module 106 of the third enhancement layer is explained in more detail below.

Модуль 107 мультиплексирования мультиплексирует информацию режима, принимаемую в качестве ввода из модуля 102 задания режима, кодированную информацию базового слоя, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, кодированную информацию первого улучшающего слоя, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, кодированную информацию второго улучшающего слоя, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и кодированную информацию третьего улучшающего слоя, принимаемую в качестве ввода из модуля 106 кодирования третьего улучшающего слоя, и формирует потоки битов, которые должны быть переданы в устройство декодирования стереофонических сигналов.The multiplexing unit 107 multiplexes the mode information received as input from the mode setting unit 102, the encoded base layer information received as an input from the base layer encoding unit 103, the encoded information of the first enhancement layer received as input from the encoding unit 104 of the first enhancement layer , encoded information of the second enhancement layer received as input from the encoding module 105 of the second enhancement layer, and encoded information of the third enhancement layer Loy, received as input from encoding unit 106 of the third enhancement layer, and generates bit streams that are to be transmitted to stereo decoding apparatus.

В устройстве 100 кодирования стереофонических сигналов модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя имеют идентичную конфигурацию и, следовательно, выполняют в основном идентичные операции, а отличаются друг от друга только своими входными сигналами и выходными сигналами. Модуль 106 кодирования третьего улучшающего слоя не требует конфигурации для нахождения искажения при кодировании и, следовательно, отличается от вышеуказанных трех модулей кодирования в части конфигурации. Таким образом, модуль 106 кодирования третьего улучшающего слоя использует конфигурацию с исключением модуля 303 монофонического декодирования, модуля 306 стереофонического декодирования, переключателя 307, сумматора 308, сумматора 309 и переключателя 310 из конфигурации, показанной на фиг.2. Что касается вышеуказанных трех модулей кодирования, имеющих идентичную конфигурацию, например модуль 103 кодирования базового слоя принимает в качестве ввода M-сигнал и S-сигнал; при выполнении монофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и сам S-сигнал как информацию S-сигнала; и при выполнении стереофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и искажение при кодировании базового слоя S-сигнала как информацию S-сигнала.In the stereo signal encoding apparatus 100, the base layer encoding module 103, the first enhancement layer encoding module 104 and the second enhancement layer encoding module 105 have the same configuration and therefore perform basically the same operations, and differ from each other only in their input signals and output signals . The encoding module 106 of the third enhancement layer does not require a configuration to find an encoding distortion and, therefore, differs from the above three encoding modules in terms of configuration. Thus, the third enhancement layer encoding unit 106 uses a configuration with the exception of monaural decoding unit 303, stereo decoding unit 306, switch 307, adder 308, adder 309, and switch 310 from the configuration shown in FIG. 2. Regarding the above three encoding modules having the same configuration, for example, the base layer encoding module 103 receives an M signal and an S signal as input; when performing monophonic encoding, outputs to the encoding module 104 of the first enhancement layer the distortion when encoding the base layer of the M-signal as M-signal information and the S-signal itself as S-signal information; and when performing stereo coding, outputs to the encoding unit 104 of the first enhancement layer a distortion when encoding the base layer of the M signal as M signal information and a distortion when encoding the base layer of the S signal as S signal information.

Кроме того, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя: принимают в качестве ввода информацию M-сигнала в предыдущем слое и информацию S-сигнала в доступном слое; при выполнении монофонического кодирования выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и саму информацию S-сигнала в предыдущем слое; и, при выполнении стереофонического кодирования, выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и искажение при кодировании, обнаруживаемое посредством дополнительного кодирования S-сигнала в предыдущем слое. Далее, конфигурации и операции вышеуказанных модулей кодирования поясняются с использованием модуля 103 кодирования базового слоя в качестве примера.In addition, the encoding module 104 of the first enhancement layer and the encoding module 105 of the second enhancement layer: take as input the M-signal information in the previous layer and the S-signal information in the available layer; when performing monophonic coding, the coding distortion detected by additionally encoding the M-signal information in the previous layer and the S-signal information itself in the previous layer are output to the coding module in the subsequent layer; and when stereo coding is performed, coding distortion detected by additional encoding of the M-signal information in the previous layer and coding distortion detected by additional encoding of the S-signal in the previous layer are output to the encoding module in the subsequent layer. Further, the configurations and operations of the above encoding modules are explained using the base layer encoding module 103 as an example.

Фиг.2 является блок-схемой, показывающей основные компоненты в модуле 103 кодирования базового слоя.2 is a block diagram showing the main components in the base layer encoding unit 103.

На фиг.2 модуль 103 кодирования базового слоя содержит переключатель 301, модуль 302 монофонического кодирования, модуль 303 монофонического декодирования, переключатель 304, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования, переключатель 307, сумматор 308, сумматор 309, переключатель 310 и переключатель 311.2, the base layer encoding module 103 comprises a switch 301, a monophonic encoding module 302, a monophonic decoding module 303, a switch 304, a stereo encoding module 305, a stereo decoding module 306, a switch 307, an adder 308, an adder 309, a switch 310 and a switch 311 .

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 301 выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 302 монофонического кодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the switch 301 outputs the M signal received as input from the sum and difference calculation module 101 to the monophonic encoding module 302, and if the value the first bit of the mode information received as input from the mode setting module 102 is “1”, outputs the M signal received as input from the sum and difference calculation unit 101 to the stereo coding unit 305.

Модуль 302 монофонического кодирования выполняет кодирование (т.е. монофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и выводит результирующую монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311. Кроме того, модуль 302 монофонического кодирования подробнее поясняется ниже.The monophonic encoding unit 302 performs encoding (i.e., monophonic encoding) using the M signal received as input from the switch 301 and outputs the resulting monophonic encoded information to the monophonic decoding unit 303 and the switch 311. In addition, the monophonic encoding unit 302 explained in more detail below.

Модуль 303 монофонического декодирования декодирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, и выводит результирующий декодированный сигнал (т.е. монофонический декодированный M-сигнал) в переключатель 307. Кроме того, модуль 303 монофонического декодирования подробнее поясняется ниже.Monophonic decoding unit 303 decodes monophonic encoded information received as input from monophonic encoding unit 302 and outputs the resulting decoded signal (i.e., monophonic decoded M signal) to switch 307. In addition, monophonic decoding unit 303 is explained in more detail below.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 304 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.If the value of the first bit of the mode information received as input from the mode setting module 102 is “1”, the switch 304 outputs the S signal received as input from the sum and difference calculation unit 101 to the stereo coding unit 305.

Модуль 305 стереофонического кодирования выполняет кодирование (т.е. стереофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и S-сигнала, принимаемого в качестве ввода из переключателя 304, и выводит результирующую стереофоническую кодированную информацию в модуль 306 стереофонического декодирования и переключатель 311. Кроме того, модуль 305 стереофонического кодирования подробнее поясняется ниже.The stereo coding unit 305 performs encoding (i.e., stereo coding) using the M signal received as input from the switch 301 and the S signal received as input from the switch 304, and outputs the resulting stereo encoded information to the module 306 stereo decoding and a switch 311. In addition, the stereo encoding unit 305 is explained in more detail below.

Модуль 306 стереофонического декодирования декодирует стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, и выводит два результирующих декодированных сигнала, т.е. стереофонический декодированный M-сигнал и стереофонический декодированный S-сигнал, в переключатель 307 и сумматор 309, соответственно.The stereo decoding unit 306 decodes the stereo encoded information received as input from the stereo encoding unit 305 and outputs two resulting decoded signals, i.e. a stereo decoded M signal and a stereo decoded S signal to switch 307 and adder 309, respectively.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 307 выводит монофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 303 монофонического декодирования, в сумматор 308, или если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит стереофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 306 стереофонического декодирования, в сумматор 308.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the switch 307 outputs the monaural decoded M signal received as input from the monaural decoding unit 303 to the adder 308, or if the value of the first bit the mode information received as input from the mode setting module 102 is “1”, the stereo decoded M signal received as input from the stereo decoding unit 306 is output to the adder 308.

Сумматор 308 вычисляет разность между M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и одним из монофонического декодированного M-сигнала и стереофонического декодированного M-сигнала, принимаемого в качестве ввода из переключателя 307, как искажение при кодировании базового слоя M-сигнала. Дополнительно, сумматор 308 выводит это искажение при кодировании базового слоя M-сигнала в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое.An adder 308 calculates the difference between the M signal received as input from the sum and difference calculation module 101 and one of the monophonic decoded M signal and the stereo decoded M signal received as input from the switch 307 as a distortion when encoding the base layer M-signal. Additionally, the adder 308 outputs this distortion when encoding the base layer of the M signal to the encoding module 104 of the first enhancement layer as information of the M signal in the base layer.

Сумматор 309 вычисляет разность между S-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и стереофоническим декодированным S-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, как искажение при кодировании базового слоя S-сигнала. Дополнительно, сумматор 309 выводит это искажение при кодировании базового слоя S-сигнала в переключатель 310.An adder 309 calculates the difference between the S signal received as input from the sum and difference calculation unit 101 and the stereo decoded S signal received as input from the stereo decoding unit 306 as a distortion in encoding the base layer of the S signal. Additionally, adder 309 outputs this distortion when encoding the base layer of the S signal to switch 310.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the switch 310 outputs an S signal received as input from the sum and difference calculation unit 101, as is the first enhancement layer encoding unit 104 as S-signal information in the base layer. If the value of the first bit of the mode information received as input from the mode setting module 102 is “1”, the switch 310 outputs distortion when encoding the base layer of the S signal received as input from the adder 309 to the encoding module 104 of the first enhancement layer as S-signal information in the base layer.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the switch 311 outputs the monophonic encoded information received as input from the monaural encoding unit 302 to the multiplexing unit 107 as encoded base layer information. If the value of the first bit of the mode information received as input from the mode setting unit 102 is “1”, the switch 311 outputs the stereo encoded information received as input from the stereo encoding unit 305 to the multiplexing unit 107 as encoded base layer information.

Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "0" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.FIG. 3 illustrates operations in the case where the monaural encoding mode is set in the base layer encoding unit 103 based on the value “0” of the first bit of the mode information received as input from the mode setting unit 102.

Как показано на фиг.3, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 не работают, а модуль 302 монофонического кодирования и модуль 303 монофонического декодирования работают. Кроме того, сумматор 308 находит остаточный сигнал между монофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 303 монофонического декодирования через переключатель 307, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.As shown in FIG. 3, when the monaural encoding mode is set in the base layer encoding unit 103, the stereo encoding unit 305, the stereo decoding unit 306 and the adder 309 do not work, and the monaural encoding unit 302 and the monaural decoding unit 303 work. In addition, the adder 308 finds the residual signal between the monophonic decoded M-signal received as input from the monophonic decoding unit 303 via the switch 307, and the M-signal received as input from the sum and difference calculation unit 101, as a distortion when encoding the base M-signal layer. In addition, the switch 310 outputs an S signal received as input from the sum and difference calculator 101, as is the first enhancement layer encoding module 104. The switch 311 outputs the monophonic encoded information received as input from the monophonic encoding unit 302 to the multiplexing unit 107 as the encoded information of the base layer.

Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "1" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.FIG. 4 illustrates operations in the case where the stereo coding mode is set in the base layer encoding unit 103 based on the value “1” of the first bit of the mode information received as input from the mode setting unit 102.

Как показано на фиг.4, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 302 монофонического кодирования и модуль 303 монофонического декодирования не работают, а модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 работают. Кроме того, сумматор 308 находит остаточный сигнал между стереофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.As shown in FIG. 4, when the stereo coding mode is set in the base layer encoding unit 103, the monaural encoding unit 302 and the monaural decoding unit 303 do not work, and the stereo encoding unit 305, the stereo decoding unit 306, and the adder 309 operate. In addition, the adder 308 finds a residual signal between the stereo decoded M-signal received as input from the stereo decoding unit 306 and the M-signal received as input from the sum and difference calculation unit 101, as distortion when encoding the base layer M- signal. In addition, the switch 310 outputs distortion when encoding the base layer of the S signal received as input from the adder 309 into the encoding module 104 of the first enhancement layer. The switch 311 outputs the stereo encoded information received as input from the stereo encoding unit 305 to the multiplexing unit 107 as encoded information of the base layer.

Фиг.5 является блок-схемой, показывающей основные компоненты в модуле 302 монофонического кодирования.5 is a block diagram showing the main components in monophonic coding unit 302.

На фиг.5 модуль 302 монофонического кодирования содержит модуль 321 анализа LPC (коэффициентов линейного прогнозирования), модуль 322 LPC-квантования, модуль 323 LPC-деквантования, обратный (инверсный) фильтр 324, модуль 325 MDCT (модифицированного дискретного косинусного преобразования), модуль 326 кодирования спектра и модуль 327 мультиплексирования. Модуль 326 кодирования спектра включает в себя модуль 111 квантования по форме и модуль 112 квантования по усилению, а модуль 111 квантования по форме включает в себя модуль 121 зонального поиска и модуль 122 полного поиска.5, the monophonic coding module 302 comprises an LPC (linear prediction coefficient) analysis module 321, an LPC quantization module 322, an LPC dequantization module 323, an inverse filter 324, an MDCT (modified discrete cosine transform) module 325, 326 module spectrum coding and multiplexing module 327. The spectrum encoding module 326 includes a shape quantization module 111 and a gain quantization module 112, and a shape quantization module 111 includes a zone search module 121 and a full search module 122.

Модуль 321 LPC-анализа выполняет анализ с линейным прогнозированием с использованием M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, и предоставляет и выводит LPC-параметры (т.е. параметры линейного прогнозирования), указывающие структуру спектра M-сигнала, в модуль 322 LPC-квантования.LPC analysis module 321 performs linear prediction analysis using an M signal received as input from sum and difference calculation module 101 via switch 301, and provides and outputs LPC parameters (i.e., linear prediction parameters) indicating the structure spectrum of the M-signal into the module 322 LPC quantization.

Модуль 322 LPC-квантования преобразует параметры линейного прогнозирования, принимаемые в качестве ввода из модуля 321 LPC-анализа, в параметры с хорошей комплементарностью, такие как LSP (пары спектральных линий или пары спектральных линий) и ISP (пары спектральных иммитансов), и квантует преобразованные параметры посредством такого способа квантования, как VQ (векторное квантование), прогнозирующее VQ, многостадийное VQ и раздельное VQ. Модуль 322 LPC-квантования выводит LPC-квантованные данные, полученные посредством квантования, в модуль 323 LPC-деквантования и модуль 327 мультиплексирования.LPC quantization module 322 converts linear prediction parameters received as input from LPC analysis module 321 into parameters with good complementarity, such as LSP (pairs of spectral lines or pairs of spectral lines) and ISP (pairs of spectral immitances), and quantizes the transformed parameters through a quantization method such as VQ (vector quantization), predictive VQ, multi-stage VQ and separate VQ. LPC quantization module 322 outputs LPC quantized data obtained by quantization to LPC quantization module 323 and multiplexing module 327.

Модуль 323 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 322 LPC-квантования, и дополнительно инвертирует результирующие параметры, такие как LSP и ISP, в LPC-параметры.LPC quantization module 323 de-quantizes the LPC quantized data received as input from the LPC quantization module 322 and further inverts the resulting parameters, such as LSP and ISP, into LPC parameters.

Обратный фильтр 324 применяет обратную фильтрацию к M-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323 LPC-деквантования, и выводит в MDCT-модуль 325 фильтрованный M-сигнал, в котором конкретная для спектра структура удаляется и изменяется на плоскую форму. Здесь, функция обратного фильтра 324 представляется посредством следующего уравнения 3.The inverse filter 324 applies inverse filtering to the M signal received as input from the sum and difference calculation unit 101 through the switch 301 using the LPC parameters received as input from the LPC dequantization module 323 and outputs to the MDCT module 325 filtered M-signal in which the spectrum-specific structure is removed and changed to a flat shape. Here, the function of the inverse filter 324 is represented by the following equation 3.

[1][one]

… (уравнение 3)

... (equation 3)

В уравнении 3 нижний индекс i представляет номер выборки каждого сигнала, x_i представляет входной сигнал обратного фильтра 324, а y_i представляет выходной сигнал обратного фильтра 324. Кроме того, α_i представляет LPC-параметры, квантованные и деквантованные в модуле 322 LPC-квантования и модуле 323 LPC-деквантования, а J представляет порядок линейного прогнозирования.In equation 3, the subscript i represents the sample number of each signal, x _i represents the input of the inverse filter 324, and y _i represents the output of the inverse filter 324. In addition, α _i represents the LPC parameters quantized and dequantized in the LPC quantization module 322 and LPC dequantization module 323, and J represents the linear prediction order.

MDCT-модуль 325 выполняет MDCT M-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 324, и преобразует M-сигнал временной области в спектр M-сигнала частотной области. Кроме того, вместо MDCT в равной степени можно использовать FFT (быстрое преобразование Фурье). MDCT-модуль 325 выводит спектр M-сигнала, полученный посредством MDCT, в модуль 326 кодирования спектра.The MDCT module 325 performs the MDCT of the back-filtered M-signal received as input from the inverse filter 324 and converts the M-signal of the time domain into the spectrum of the M-signal of the frequency domain. In addition, FFT (Fast Fourier Transform) can equally be used instead of MDCT. The MDCT module 325 outputs the spectrum of the M signal obtained by the MDCT to the spectrum encoding module 326.

Модуль 326 кодирования спектра принимает спектр M-сигнала в качестве ввода из MDCT-модуля 325, квантует спектральную форму и усиление входного спектра отдельно и выводит результирующий импульсный код и код усиления в модуль 327 мультиплексирования. Модуль 111 квантования по форме квантует форму входного спектра в позициях и полярностях небольшого числа импульсов, и модуль 112 квантования по усилению вычисляет и квантует усиления импульсов, для которых выполняется поиск в модуле 111 квантования по форме, на основе каждой полосы частот. Модуль 326 кодирования спектра выводит импульсный код, указывающий позиции и полярности искомых импульсов, и код усиления, представляющий усиление искомых импульсов, в модуль 327 мультиплексирования. Кроме того, модуль 111 квантования по форме и модуль 112 квантования по усилению подробнее поясняются ниже.The spectrum coding unit 326 receives the M-signal spectrum as input from the MDCT module 325, quantizes the spectral shape and gain of the input spectrum separately, and outputs the resulting pulse code and gain code to the multiplexing unit 327. The shape quantization module 111 quantizes the shape of the input spectrum in the positions and polarities of a small number of pulses, and the gain quantization module 112 calculates and quantizes the amplifications of the pulses that are searched in the shape quantization module 111 based on each frequency band. The spectrum coding unit 326 outputs a pulse code indicating the positions and polarities of the desired pulses and a gain code representing the amplification of the desired pulses to the multiplexing unit 327. In addition, the shape quantization module 111 and the gain quantization module 112 are explained in more detail below.

Модуль 327 мультиплексирования предоставляет монофоническую кодированную информацию посредством мультиплексирования LPC-квантованных данных, принимаемых в качестве ввода из модуля 322 LPC-квантования, и импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 326 кодирования спектра, и выводит монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311.The multiplexing unit 327 provides monophonic encoded information by multiplexing the LPC quantized data received as input from the LPC quantization unit 322, and a pulse code and a gain code received as input from the spectrum encoding unit 326, and outputs the monophonic encoded information to the module 303 mono decoding and switch 311.

Далее подробнее поясняются модуль 111 квантования по форме и модуль 112 квантования по усилению. Модуль 111 квантования по форме включает в себя модуль 121 зонального поиска, который выполняет поиск импульсов в каждой из множества из полос частот, на которые заранее определенная зона поиска разделяется, и модуль 122 полного поиска, который выполняет поиск импульсов по всей зоне поиска.Next, a shape quantization module 111 and a gain quantization module 112 are explained in more detail. The shape quantization module 111 includes a zone search module 121 that searches for pulses in each of a plurality of frequency bands into which a predetermined search zone is divided, and a full search module 122 that searches for pulses throughout the search zone.

Следующее уравнение 4 предоставляет исходную точку поиска. Здесь, в уравнении 4, E представляет искажение при кодировании, s_i представляет входной спектр, g представляет оптимальное усиление, δ - это дельта-функция, а p представляет позицию импульса.The following equation 4 provides the starting point of the search. Here, in equation 4, E represents the coding distortion, s _i represents the input spectrum, g represents the optimal gain, δ is the delta function, and p is the pulse position.

[2][2]

… (уравнение 4)

... (equation 4)

Из вышеприведенного уравнения 4 позицией импульса для того, чтобы минимизировать функцию затрат, является позиция, в которой абсолютное значение |sp| входного спектра в каждой полосе частот является максимальным, а полярность имеет значение входного спектра в этой позиции импульса.From Equation 4 above, the position of the momentum in order to minimize the cost function is the position in which the absolute value | sp | the input spectrum in each frequency band is maximum, and the polarity has the value of the input spectrum in this position of the pulse.

Ниже поясняется примерный случай, в котором длина вектора входного спектра составляет восемьдесят выборок, число полос частот составляет пять, и спектр кодируется с помощью всего восьми импульсов, состоящих из одного импульса в расчете на полосу частот и трех импульсов во всей зоне. В этом случае длина каждой полосы частот составляет шестнадцать выборок. Дополнительно, амплитуда импульсов, для которых следует выполнять поиск, задается фиксированно равной "1", а их полярность является "+" или "-".The following illustrates an exemplary case in which the input spectrum vector is eighty samples long, the number of frequency bands is five, and the spectrum is encoded using a total of eight pulses consisting of a single pulse per frequency band and three pulses in the entire zone. In this case, the length of each frequency band is sixteen samples. Additionally, the amplitude of the pulses for which to search is fixedly set to "1", and their polarity is "+" or "-".

Модуль 121 зонального поиска выполняет поиск позиции максимальной энергии и ее полярности (+/-) в каждой полосе частот и дает возможность появляться одному импульсу в расчете на полосу частот. В этом примере число полос частот пять, и каждая полоса частот требует четырех битов, чтобы показывать позицию импульса (записи позиций: 16), и один бит, чтобы показывать полярность (+/-), требуя всего 25 информационных битов.The zonal search module 121 searches for the position of the maximum energy and its polarity (+/-) in each frequency band and allows one pulse to appear per frequency band. In this example, the number of frequency bands is five, and each frequency band requires four bits to indicate the position of the pulse (record positions: 16), and one bit to indicate polarity (+/-), requiring a total of 25 information bits.

Последовательность операций алгоритма поиска модуля 121 зонального поиска показана на фиг.6. Здесь, символы, используемые на блок-схеме последовательности операций способа фиг.6, означают следующее:The sequence of operations of the search algorithm module 121 zone search shown in Fig.6. Here, the symbols used in the flowchart of FIG. 6 mean the following:

i: позицияi: position

b: номер полосы частотb: frequency band number

max: максимальное значениеmax: maximum value

c: счетчикc: counter

pos[b]: результат поиска (позиция)pos [b]: search result (position)

pol[b]: результат поиска (полярность)pol [b]: search result (polarity)

s[i]: входной спектрs [i]: input spectrum

Как показано на фиг.6, модуль 121 зонального поиска вычисляет входной спектр s[i] каждой выборки (0≤c≤15) в расчете на полосу частот (0≤b≤4) и вычисляет максимальное значение "max".As shown in FIG. 6, the zonal search module 121 calculates an input spectrum s [i] of each sample (0≤c≤15) per frequency band (0≤b≤4) and calculates a maximum value of "max".

Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска. Как показано на фиг.7, один импульс, имеющий амплитуду "1" и полярность "+" или "-", размещается в каждой из пяти полос частот, каждая из которых имеет полосу пропускания в шестнадцать выборок.7 shows an example of a spectrum represented by pulses that are searched in the area search module 121. As shown in FIG. 7, one pulse having an amplitude of “1” and a polarity of “+” or “-” is located in each of the five frequency bands, each of which has a bandwidth of sixteen samples.

Модуль 122 полного поиска выполняет поиск позиций, чтобы размещать три импульса, по всей зоне поиска и кодирует позиции импульсов и их полярности. В модуле 122 полного поиска поиск выполняется согласно следующим четырем условиям для кодирования точных позиций с небольшим числом информационных битов и небольшим объемом вычислений.The full search module 122 searches for positions to accommodate three pulses throughout the search area and encodes the positions of the pulses and their polarity. In the full search module 122, a search is performed according to the following four conditions for encoding exact positions with a small number of information bits and a small amount of computation.

(1) Два или более импульсов не размещаются в одной позиции. В этом примере импульсы не размещаются в позициях, в которых импульс каждой полосы частот размещается в модуле 121 зонального поиска. С помощью данного изобретения информационные биты не используются для того, чтобы представлять амплитудные компоненты, так что можно эффективно использовать информационные биты.(1) Two or more pulses are not placed in one position. In this example, the pulses are not located at positions in which the pulse of each frequency band is located in the area search module 121. With the present invention, information bits are not used to represent amplitude components, so that information bits can be effectively used.

(2) Поиск импульсов выполняется по порядку, один за другим, в разомкнутом контуре. Во время поиска, согласно правилу (1), определенные позиции импульсов не подлежат поиску.(2) The search for pulses is performed in order, one after another, in an open loop. During the search, according to rule (1), certain pulse positions cannot be searched.

(3) При поиске позиции позиция, в которой импульс менее предпочтительно должен размещаться, также кодируется как информация позиции один.(3) When searching for a position, the position in which the impulse should be less preferably placed is also encoded as position information alone.

(4) С учетом того, что усиление кодируется на основе каждой полосы частот, поиск импульсов выполняется посредством оценки искажения при кодировании относительно идеального усиления каждой полосы частот.(4) Given that the gain is encoded based on each frequency band, the pulse search is performed by coding distortion estimation relative to the ideal gain of each frequency band.

Модуль 122 полного поиска выполняет следующую двухэтапную оценку затрат, чтобы выполнять поиск одиночного импульса по всему входному спектру. Во-первых, на первом этапе, модуль 122 полного поиска оценивает затраты в каждой полосе частот и находит позицию и полярность так, чтобы минимизировать функцию затрат. Затем, на второй стадии, модуль 122 полного поиска оценивает полные затраты каждый раз, когда вышеуказанный поиск завершен в полосе частот, и сохраняет позицию и полярность импульса, чтобы минимизировать затраты, как конечный результат. Этот поиск выполняется в расчете на полосу частот, по порядку. Дополнительно, этот поиск выполняется для того, чтобы удовлетворять вышеуказанным условиям (1)-(4). Затем, когда поиск одного импульса завершен, при условии присутствия этого импульса в искомой позиции, поиск следующего импульса выполняется. Этот поиск выполняется до тех пор, пока заранее определенного числа импульсов (три импульса в этом примере) не обнаружено, посредством повторения вышеуказанной обработки.The full search module 122 performs the following two-step cost estimate in order to search for a single pulse across the entire input spectrum. First, in the first step, the full search module 122 estimates the costs in each frequency band and finds the position and polarity so as to minimize the cost function. Then, in the second stage, the full search module 122 estimates the total costs each time the above search is completed in the frequency band, and saves the position and polarity of the pulse in order to minimize costs as an end result. This search is performed per frequency band, in order. Additionally, this search is performed in order to satisfy the above conditions (1) to (4). Then, when the search for one pulse is completed, provided that this pulse is in the desired position, the search for the next pulse is performed. This search is performed until a predetermined number of pulses (three pulses in this example) is detected by repeating the above processing.

Последовательность операций алгоритма поиска в модуле 122 полного поиска показана на фиг.8.The flow of the search algorithm in the full search module 122 is shown in FIG.

Фиг.8 является блок-схемой последовательности операций способа предварительной обработки поиска, а фиг.9 является блок-схемой последовательности операций способа поиска. Дополнительно, части, соответствующие вышеуказанным условиям (1), (2) и (4), показаны на блок-схеме последовательности операций способа фиг.9.FIG. 8 is a flowchart of a search preprocessing method, and FIG. 9 is a flowchart of a search method. Additionally, parts corresponding to the above conditions (1), (2) and (4) are shown in the flowchart of FIG. 9.

Символы, используемые на блок-схеме последовательности операций способа фиг.8, означают следующее:The symbols used in the flowchart of FIG. 8 mean the following:

c: счетчикc: counter

pf[*]: флаг присутствия/отсутствия импульсаpf [*]: flag presence / absence of an impulse

b: номер полосы частотb: frequency band number

pos[*]: результат поиска (позиция)pos [*]: search result (position)

n_s[*]: значение корреляцииn_s [*]: correlation value

n_max[*]: максимальное значение корреляцииn_max [*]: maximum correlation value

n2_s[*]: значение квадрата корреляцииn2_s [*]: correlation squared value

n2_max[*]: максимальное значение квадрата корреляцииn2_max [*]: maximum value of the correlation square

d_s[*]: значение мощностиd_s [*]: power value

d_max[*]: максимальное значение мощностиd_max [*]: maximum power value

s[*]: входной спектрs [*]: input spectrum

Символы, используемые на блок-схеме последовательности операций способа фиг.9, означают следующее:The symbols used in the flowchart of FIG. 9 mean the following:

i: номер импульсаi: pulse number

i0: позиция импульсаi0: pulse position

cmax: максимальное значение функции затратcmax: maximum value of the cost function

pf[*]: флаг присутствия/отсутствия импульса (0: отсутствие, 1: присутствие)pf [*]: flag of presence / absence of an impulse (0: absence, 1: presence)

ii0: относительная позиция импульса в полосе частотii0: relative position of the pulse in the frequency band

nom: спектральная амплитудаnom: spectral amplitude

nom2: член числителя (спектральная мощность)nom2: numerator term (spectral power)

den: член знаменателяden: denominator

n_s[*]: относительное значениеn_s [*]: relative value

d_s[*]: значение мощностиd_s [*]: power value

s[*]: входной спектрs [*]: input spectrum

idx_max[*]: результат поиска каждого импульса (позиция) (здесь, idx_max[*] от 0 до 4 эквивалентно pos[b] на фиг.6)idx_max [*]: search result of each impulse (position) (here, idx_max [*] from 0 to 4 is equivalent to pos [b] in Fig.6)

fd0, fd1, fd2: буфер для временного хранения (тип вещественных чисел)fd0, fd1, fd2: buffer for temporary storage (type of real numbers)

id0, id1: буфер для временного хранения (тип целых чисел)id0, id1: buffer for temporary storage (integer type)

id0_s, id1_s: буфер для временного хранения (тип целых чисел)id0_s, id1_s: buffer for temporary storage (integer type)

>>: битовый сдвиг (вправо)>>: bit shift (right)

&: "и" как битовая последовательность&: "and" as a bit sequence

Здесь, при поиске на фиг.8 и фиг.9, случай, в котором idx_max[*] равно "-1", соответствует случаю вышеуказанного условия (3), когда импульс менее предпочтительно должен размещаться. Конкретным примером этого является то, когда спектр достаточно аппроксимируется только с помощью импульсов, для которых выполняется поиск в расчете на полосу частот, и импульсов, для которых выполняется поиск по всей зоне, и когда дополнительное прибавление импульсов с идентичной величиной пропорционально увеличивает искажение при кодировании.Here, when searching in FIG. 8 and FIG. 9, the case in which idx_max [*] is “-1” corresponds to the case of the above condition (3), when the pulse is less preferably to be placed. A concrete example of this is when the spectrum is sufficiently approximated only by pulses for which a search is performed per frequency band, and pulses for which a search is performed over the entire zone, and when the additional addition of pulses with an identical value proportionally increases the coding distortion.

Полярности искомых импульсов соответствуют полярностям входного спектра в этих позициях, и модуль 122 полного поиска кодирует эти полярности с помощью 3 (импульсов) × 1=3 битов. Здесь, когда позиция - это "-1", т.е. когда импульс не должен размещаться, любая полярность может использоваться. Тем не менее, полярность может использоваться для того, чтобы обнаруживать битовую ошибку, и, в общем, задается фиксированно равной "+" или "-".The polarities of the desired pulses correspond to the polarities of the input spectrum at these positions, and the full search module 122 encodes these polarities with 3 (pulses) × 1 = 3 bits. Here, when the position is "-1", i.e. when the pulse should not be placed, any polarity can be used. However, polarity can be used to detect a bit error, and, in general, is set fixed to "+" or "-".

Дополнительно, модуль 122 полного поиска кодирует информацию позиций импульсов на основе числа комбинаций позиций импульсов. В этом примере, поскольку входной спектр содержит восемьдесят выборок, и пять импульсов уже обнаружены в пяти отдельных полосах частот, если случаи, в которых импульсы не размещаются, также принимаются во внимание, варьирования позиций могут представляться с помощью семнадцати битов посредством вычисления следующего уравнения 5.Additionally, the full search module 122 encodes the pulse position information based on the number of pulse position combinations. In this example, since the input spectrum contains eighty samples and five pulses are already detected in five separate frequency bands, if cases in which pulses are not placed are also taken into account, position variations can be represented using seventeen bits by calculating the following equation 5.

[3][3]

75+1C3=(75+1)*(74+1)*(73+1)/3/2/175 + 1C3 = (75 + 1) * (74 + 1) * (73 + 1) / 3/2/1

=70300= 70300

<131072<131072

=2^17 … (уравнение 5)= 2 ^ 17 ... (equation 5)

Здесь, согласно правилу запрета размещения двух или более импульсов в одной позиции можно сокращать число комбинаций, так что эффект этого правила становится большим, когда число импульсов, для которых выполняется полный поиск, увеличивается.Here, according to the rule prohibiting the placement of two or more pulses in one position, the number of combinations can be reduced, so that the effect of this rule becomes large when the number of pulses for which a full search is performed increases.

Способ кодирования позиций импульсов, для которых выполняется поиск в модуле 122 полного поиска, описывается ниже подробно.A method for encoding pulse positions for which a search is performed in the full search module 122 is described in detail below.

(1) Три позиции импульсов сортируются на основе своей величины и размещаются в порядке от наименьшего числового значения к наибольшему числовому значению. Здесь, "-1" - это влево, как есть.(1) Three pulse positions are sorted based on their magnitude and arranged in order from the smallest numerical value to the largest numerical value. Here, “-1” is left as it is.

(2) Номера импульсов выровнены по левой границе посредством числа импульсов, возникающих в отдельных полосах частот, чтобы уменьшать числовые значения позиций импульсов. Числовые значения, вычисляемые таким образом, упоминаются "как номера позиций". Здесь, "-1" - это влево, как есть. Например, при обращении к позиции импульса "66", когда по одному импульсу предоставляется между 0 и 15, между 16 и 31, между 32 и 47 и между 48 и 64, номер позиции изменяется на "66-4=62".(2) The pulse numbers are aligned to the left boundary by the number of pulses occurring in the individual frequency bands in order to reduce the numerical values of the pulse positions. The numerical values calculated in this way are referred to “as item numbers”. Here, “-1” is left as it is. For example, when referring to the position of the pulse "66", when one pulse is provided between 0 and 15, between 16 and 31, between 32 and 47 and between 48 and 64, the position number changes to "66-4 = 62".

(3) "-1" задается равным номеру позиции, представленному посредством "максимального значения импульса+1". В этом случае порядок значений регулируется и определяется так, что заданный номер позиции не путается с номером позиции, в котором фактически присутствует импульс. Посредством этого номер импульса для импульса #0 ограничен диапазоном 0-73, номер позиции для импульса #1 ограничен диапазоном между номером позиции для импульса #0-74, а номер позиции для импульса #2 ограничен диапазоном между номером позиции для импульса #1-75, т.е. номер позиции меньшего импульса сконфигурирован не превышать номер позиции большего импульса.(3) “-1” is set equal to the position number represented by “maximum pulse value + 1”. In this case, the order of values is adjusted and determined so that the specified position number is not confused with the position number in which the pulse is actually present. By this, the pulse number for pulse # 0 is limited to the range 0-73, the position number for pulse # 1 is limited to the range between the position number for pulse # 0-74, and the position number for pulse # 2 is limited to the range between the position number for pulse # 1-75 , i.e. the position number of the smaller pulse is configured not to exceed the position number of the larger pulse.

(4) Затем, согласно обработке интегрирования, показанной в следующем уравнении 6, чтобы вычислять комбинированный код, номера позиций (i0, i1, i2) интегрируются, чтобы формировать код (c). Эта обработка интегрирования упоминается как обработка вычисления интегрирования всех комбинаций в случае, когда имеется порядок величины.(4) Then, according to the integration processing shown in the following equation 6, to calculate the combined code, the position numbers (i0, i1, i2) are integrated to form the code (c). This integration processing is referred to as integration calculation processing of all combinations in the case where there is an order of magnitude.

[4][four]

c=((76-0)*(77-0)*(153-2*0)/3+(74-0)*(75-0))/4c = ((76-0) * (77-0) * (153-2 * 0) / 3 + (74-0) * (75-0)) / 4

-((76-i0)*(77-i0)*(153-2*i0)/3+(74-i0)*(75-i0))/4;- ((76-i0) * (77-i0) * (153-2 * i0) / 3 + (74-i0) * (75-i0)) / 4;

c=c+(76-i0)*(77-i0)/2-(76-i1)*(77-i1)/2;c = c + (76-i0) * (77-i0) / 2- (76-i1) * (77-i1) / 2;

c=c+75-i2; … (уравнение 6)c = c + 75-i2; ... (equation 6)

(5) Затем, посредством комбинирования семнадцати битов этого c и трех битов для полярности код из двадцати битов формируется.(5) Then, by combining seventeen bits of this c and three bits for polarity, a code of twenty bits is generated.

Здесь, в вышеуказанных номерах позиций, импульс #0 в "73", импульс #1 в "74" и импульс #2 в "75" являются номерами позиций, в которых импульсы не размещаются. Например, если имеется три номера позиций (73,-1,-1) согласно вышеуказанной взаимосвязи между номером позиции один и номером позиции, в которой импульс не размещается, эти номера позиций переупорядочиваются как (-1, 73,-1) и становятся следующими (73, 73, 74).Here, in the above position numbers, pulse # 0 at “73”, pulse # 1 at “74” and pulse # 2 at “75” are position numbers at which the pulses are not placed. For example, if there are three position numbers (73, -1, -1) according to the above relationship between position number one and the position number in which the impulse is not placed, these position numbers are reordered as (-1, 73, -1) and become the following (73, 73, 74).

Таким образом, с помощью модели для того, чтобы представлять входной спектр посредством последовательности из восьми импульсов (пять импульсов в отдельных полосах частот и три импульса во всей зоне), как показано в этом примере, можно выполнять кодирование посредством 45 информационных битов.Thus, using the model, in order to represent the input spectrum by means of a sequence of eight pulses (five pulses in separate frequency bands and three pulses in the entire zone), as shown in this example, encoding can be performed using 45 information bits.

Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска и модуле 122 полного поиска. Кроме того, на фиг.10 импульсы, представленные посредством полужирных линий, являются импульсами, для которых выполняется поиск в модуле 122 полного поиска.10 illustrates an example of a spectrum represented by pulses that are searched in the area search module 121 and the full search module 122. In addition, in FIG. 10, pulses represented by bold lines are pulses that are searched in the full search module 122.

Модуль 112 квантования по усилению квантует усиление каждой полосы частот. Восемь импульсов размещаются в полосах частот, и модуль 112 квантования по усилению вычисляет усиления посредством анализа корреляции между этими импульсами и входным спектром.Gain quantization module 112 quantizes the gain of each frequency band. Eight pulses are arranged in frequency bands, and gain quantization module 112 calculates gains by analyzing the correlation between these pulses and the input spectrum.

Если модуль 112 квантования по усилению вычисляет идеальные усиления и затем выполняет кодирование посредством скалярного или векторного квантования, во-первых, модуль 112 квантования по усилению вычисляет идеальные усиления согласно следующему уравнению 7. Здесь, в уравнении 7, gn - это идеальное усиление полосы частот n, s(i+16n) - это входной спектр полосы частот n, vn(i)- это вектор, обнаруживаемый посредством декодирования формы полосы частот n.If the gain quantization module 112 calculates ideal amplifications and then encodes using scalar or vector quantization, firstly, the gain quantization module 112 calculates ideal amplifications according to the following equation 7. Here, in equation 7, gn is the ideal gain of the frequency band n , s (i + 16n) is the input spectrum of the frequency band n, vn (i) is the vector detected by decoding the shape of the frequency band n.

[5][5]

… (уравнение 7)

... (equation 7)

Дополнительно, модуль 112 квантования по усилению выполняет кодирование посредством совместного выполнения скалярного квантования (SQ) идеальных усилений или совместного выполнения векторного квантования этих пяти усилений. В случае выполнения векторного квантования можно выполнять эффективное кодирование посредством прогнозирующего квантования, многостадийного VQ, раздельного VQ и т.д. Здесь, усиление может прослушиваться перцепционно на основе логарифмического масштаба, и, следовательно, посредством выполнения SQ или VQ после выполнения логарифмического преобразования усиления можно предоставлять перцепционно хороший синтезирующий звук.Additionally, gain quantization module 112 performs encoding by jointly performing scalar quantization (SQ) of ideal amplifications or jointly performing vector quantization of these five amplifications. In the case of vector quantization, efficient coding can be performed by means of predictive quantization, multi-stage VQ, separate VQ, etc. Here, the gain can be perceptually audited based on a logarithmic scale, and therefore, by performing SQ or VQ after performing the logarithmic gain conversion, a perceptually good synthesizing sound can be provided.

Дополнительно, вместо вычисления идеальных усилений, предусмотрен способ прямой оценки искажения при кодировании. Например, в случае выполнения VQ для пяти усилений искажение при кодировании вычисляется так, чтобы минимизировать следующее уравнение 8. Здесь, в уравнении 8, E_k - это искажение вектора k-го усиления, s(i+16n) - это входной спектр полосы частот n, g(k)n - это n-й элемент вектора k-го усиления, а vⁿ(i) - это вектор формы, обнаруживаемый посредством декодирования формы полосы частот n.Additionally, instead of calculating ideal gains, a method for directly assessing coding distortion is provided. For example, if VQ is performed for five amplifications, the coding distortion is calculated so as to minimize the following equation 8. Here, in equation 8, E _k is the distortion of the kth gain vector, s (i + 16n) is the input spectrum of the frequency band n, g (k) n is the nth element of the kth gain vector, and v ⁿ (i) is the shape vector detected by decoding the shape of the frequency band n.

[6][6]

… (уравнение 8)

... (equation 8)

Фиг.11 является блок-схемой, показывающей основные компоненты в модуле 303 монофонического декодирования. Модуль 303 монофонического декодирования, показанный на фиг.11, содержит модуль 331 демультиплексирования, модуль 332 LPC-деквантования, модуль 333 декодирования спектра, модуль 334 IMDCT (обратного модифицированного дискретного косинусного преобразования) и синтезирующий фильтр 335.11 is a block diagram showing the main components in the monophonic decoding unit 303. The monaural decoding module 303 shown in FIG. 11 includes a demultiplexing module 331, an LPC dequantization module 332, a spectrum decoding module 333, an IMDCT (inverse modified discrete cosine transform) module 334, and a synthesis filter 335.

На фиг.11 модуль 331 демультиплексирования демультиплексирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в LPC-квантованные данные, импульсный код и код усиления, выводит LPC-квантованные данные в модуль 332 LPC-деквантования и выводит импульсный код и код усиления в модуль 333 декодирования спектра.11, the demultiplexing unit 331 demultiplexes the monophonic encoded information received as input from the monophonic encoding unit 302 into LPC quantized data, a pulse code, and a gain code, outputs the LPC quantized data to the LPC quantization module 332 and outputs a pulse code and gain code in the spectrum decoding module 333.

Модуль 332 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 331 демультиплексирования, и выводит результирующие LPC-параметры в синтезирующий фильтр 335.LPC quantization module 332 dequantizes the LPC quantized data received as input from demultiplexing module 331 and outputs the resulting LPC parameters to synthesis filter 335.

Модуль 333 декодирования спектра декодирует вектор формы и усиление при декодировании посредством способа, поддерживающего способ кодирования в модуле 326 кодирования спектра, показанном на фиг.5, с помощью импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 331 демультиплексирования. Дополнительно, модуль 333 декодирования спектра предоставляет декодированный спектр посредством умножения декодированного вектора формы на усиление при декодировании и выводит этот декодированный спектр в IMDCT-модуль 334.The spectrum decoding unit 333 decodes the shape vector and decoding gain by a method supporting the encoding method in the spectrum encoding unit 326 of FIG. 5 using a pulse code and a gain code received as input from the demultiplexing unit 331. Additionally, the spectrum decoding module 333 provides a decoded spectrum by multiplying the decoded shape vector by decoding gain and outputs this decoded spectrum to the IMDCT module 334.

IMDCT-модуль 334 преобразует декодированный спектр, принимаемый в качестве ввода из модуля 333 декодирования спектра, противоположным способом относительно преобразования в MDCT-модуле 325, показанном на фиг.5, и выводит M-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 335.The IMDCT module 334 converts the decoded spectrum received as input from the spectrum decoding module 333 in the opposite way with respect to the conversion in the MDCT module 325 shown in FIG. 5, and outputs the time series M signal detected by the conversion to a synthesis filter 335 .

Синтезирующий фильтр 335 предоставляет монофонический декодированный M-сигнал посредством применения синтезирующего фильтра к M-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 334, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332 LPC-деквантования.Synthesizing filter 335 provides a monophonic decoded M signal by applying a synthesizing filter to the time series M signal received as input from IMDCT module 334 using LPC parameters received as input from LPC dequantization module 332.

Далее поясняется способ декодирования трех импульсов в модуле 333 декодирования спектра, для которых выполняется полный поиск.Next, a method for decoding three pulses in a spectrum decoding unit 333 for which a full search is performed is explained.

В модуле 122 полного поиска из модуля 326 кодирования спектра номера позиций (i0, i1, i2) интегрируются в один код с помощью вышеприведенного уравнения 5. В модуле 333 декодирования спектра выполняется противоположная обработка. Таким образом, модуль 333 декодирования спектра последовательно вычисляет значение уравнения интегрирования при изменении каждого номера позиции, фиксированно задает номер позиции, когда номер позиции меньше значения интегрирования, и выполняет декодирование посредством выполнения этой обработки от номера позиции нижнего слоя до номера позиции высшего порядка один за другим. Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля 333 декодирования спектра.In the full search module 122 from the spectrum encoding module 326, the position numbers (i0, i1, i2) are integrated into a single code using the above equation 5. In the spectrum decoding module 333, the opposite processing is performed. Thus, the spectrum decoding module 333 sequentially calculates the value of the integration equation when each position number changes, fixes the position number when the position number is less than the integration value, and performs decoding by performing this processing from the lower layer position number to the higher order position number one after the other . 12 is a flowchart showing a decoding algorithm of a spectrum decoding unit 333.

Дополнительно, на фиг.12, когда введенный код "k" интегрированной позиции заключает в себе ошибку вследствие битовой ошибки, последовательность операций переходит к этапу обработки ошибок. Следовательно, в этом случае позиция должна быть обнаружена посредством заранее определенной обработки ошибок.Additionally, in FIG. 12, when the integrated position code “k” entered contains an error due to a bit error, the process proceeds to the error processing step. Therefore, in this case, the position must be detected by the predetermined error handling.

Дополнительно, поскольку декодер выполняет контурную обработку, объем вычислений в декодере больше, чем в кодере. Здесь, каждый контур является разомкнутым контуром, и, следовательно, по сравнению с общим объемом обработки в устройстве кодирования объем вычислений в декодере не является настолько большим.Additionally, since the decoder performs loop processing, the amount of computation in the decoder is greater than in the encoder. Here, each loop is an open loop, and therefore, compared to the total processing amount in the encoding device, the amount of computation in the decoder is not so large.

Фиг.13 является блок-схемой, показывающей основные компоненты в модуле 305 стереофонического кодирования. Модуль 305 стереофонического кодирования, показанный на фиг.13, имеет в основном идентичную конфигурацию и выполняет в основном операции, идентичные модулю 302 монофонического кодирования, показанному на фиг.5. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.5 и фиг.13, "a" назначается ссылкам с номерами модулей на фиг.13. Например, модуль на фиг.13, соответствующий модулю 321 LPC-анализа на фиг.5, выражается как модуль 32a1 LPC-анализа. Кроме того, модуль 305 стереофонического кодирования на фиг.13 отличается от модуля 302 монофонического кодирования на фиг.5 включением дополнительного обратного фильтра 351, MDCT-модуля 352 и модуля 353 интегрирования. Кроме того, модуль 356 кодирования спектра из модуля 305 стереофонического кодирования на фиг.13 отличается от модуля 326 кодирования спектра из модуля 302 монофонического кодирования на фиг.5 входными сигналами, и, следовательно, ему назначается другая ссылка с номером.13 is a block diagram showing major components in a stereo coding unit 305. The stereo coding unit 305 shown in FIG. 13 has a substantially identical configuration and performs basically the same operations as the monaural coding unit 302 shown in FIG. 5. Therefore, with regard to modules that perform identical operations for FIG. 5 and FIG. 13, “a” is assigned to the module number references in FIG. 13. For example, the module in FIG. 13 corresponding to the LPC analysis module 321 in FIG. 5 is expressed as the LPC analysis module 32a1. In addition, the stereo encoding module 305 in FIG. 13 differs from the monaural encoding module 302 in FIG. 5 by the inclusion of an additional inverse filter 351, an MDCT module 352, and an integration module 353. In addition, the spectrum encoding unit 356 from the stereo encoding unit 305 in FIG. 13 is different from the spectrum encoding unit 326 from the monaural encoding unit 302 in FIG. 5 with input signals, and therefore is assigned another reference number.

Обратный фильтр 351 применяет обратную фильтрацию к S-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323a LPC-деквантования, чтобы сглаживать конкретную для спектра структуру, и выводит фильтрованный S-сигнал в MDCT-модуль 352. Здесь, функция обратного фильтра 324a представляется посредством вышеприведенного уравнения 3. Строго говоря, хотя LPC-коэффициенты, полученные из M-сигнала, не совпадают со спектральной структурой S-сигнала с учетом того, что M-сигнал и S-сигнал, в общем, имеют аналогичные спектральные структуры и что объем вычислений и объем ROM, требуемый для LPC-анализа, квантования и деквантования S-сигнала, экономится, LPC-параметры, принимаемые в качестве ввода из модуля 323a LPC-деквантования, используются при обработке обратной фильтрации в обратном фильтре 351.The inverse filter 351 applies inverse filtering to the S signal received as input from the sum and difference calculation module 101, using LPC parameters received as input from the LPC dequantization module 323a to smooth the spectrum-specific structure, and outputs the filtered S-signal to MDCT module 352. Here, the function of the inverse filter 324a is represented by the above equation 3. Strictly speaking, although the LPC coefficients obtained from the M-signal do not coincide with the spectral structure of the S-signal, given that M -signal and S-signal, in general, have similar spectral structures and that the amount of computation and the amount of ROM required for LPC analysis, quantization and dequantization of the S-signal is saved, LPC parameters taken as input from the LPC- module 323a dequantization are used in reverse filtering processing in the inverse filter 351.

MDCT-модуль 352 выполняет MDCT S-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 351, и преобразует S-сигнал временной области в спектр S-сигнала частотной области. Здесь, вместо MDCT в равной степени можно использовать FFT. MDCT-модуль 352 выводит спектр S-сигнала, обнаруживаемый посредством MDCT, в модуль 353 интегрирования.The MDCT module 352 performs the MDCT of the back-filtered S signal received as input from the inverse filter 351, and converts the S-signal of the time domain into the spectrum of the S-signal of the frequency domain. Here, instead of MDCT, FFT can equally be used. The MDCT module 352 outputs the spectrum of the S signal detected by the MDCT to the integration module 353.

Модуль 353 интегрирования интегрирует спектр M-сигнала, принимаемый в качестве ввода из MDCT-модуля 325a, и спектр S-сигнала, принимаемый в качестве ввода из MDCT-модуля 352 так, что спектры одной частоты являются смежными друг с другом, и выводит результирующий интегрированный спектр в модуль 356 кодирования спектра.The integration module 353 integrates the spectrum of the M signal received as input from the MDCT module 325a and the spectrum of the S signal received as input from the MDCT module 352 so that the spectra of the same frequency are adjacent to each other and outputs the resulting integrated spectrum to spectrum encoding module 356.

Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле 353 интегрирования. Модуль 356 кодирования спектра использует интегрированный спектр, обнаруживаемый посредством интегрирования двух спектров, как показано на фиг.14, как один целевой спектр кодирования, и, следовательно, выделяет большее число битов важным частям при кодировании спектра M-сигнала и спектра S-сигнала.FIG. 14 illustrates a state where an M-signal spectrum and an S-signal spectrum are integrated in an integration unit 353. The spectrum encoding unit 356 uses the integrated spectrum detected by integrating the two spectra, as shown in FIG. 14, as one target encoding spectrum, and therefore allocates a larger number of bits to the important parts when encoding the spectrum of the M signal and the spectrum of the S signal.

Возвращаемся к фиг.13, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра использованием интегрированного спектра, принимаемого в качестве ввода из модуля 353 интегрирования, в качестве входного спектра. Кроме того, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра числом импульсов, для которых выполняется поиск по всему входному спектру.Returning to FIG. 13, the spectrum encoding module 356 differs from the spectrum encoding module 326 by using the integrated spectrum received as input from the integration module 353 as an input spectrum. In addition, the spectrum encoding module 356 differs from the spectrum encoding module 326 in the number of pulses that are searched across the entire input spectrum.

В ассоциации с числом импульсов, для которых выполняется полный поиск, выделение битов в модуле 356 кодирования спектра поясняется в отношении фиг.15.In association with the number of pulses for which a full search is performed, bit allocation in the spectrum encoding unit 356 is explained with respect to FIG.

Модуль 356 кодирования спектра использует интегрированный спектр как входной спектр, и, следовательно, число выборок во входном спектре в два раза превышает число выборок во входном спектре в модуле 326 кодирования спектра, и число выборок в каждой из пяти полос частот, обнаруживаемых посредством деления входного спектра, в два раза превышает число выборок в модуле 326 кодирования спектра. С учетом того, что общее число битов кода формы составляет 45 битов в модуле 302 монофонического кодирования, модуль 356 кодирования спектра выполняет выделение битов, как показано на фиг.15. Как показано на фиг.15, число импульсов, для которых выполняется полный поиск, составляет "2" в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число импульсов, для которых выполняется полный поиск, составляет "3".The spectrum coding unit 356 uses the integrated spectrum as an input spectrum, and therefore, the number of samples in the input spectrum is two times the number of samples in the input spectrum in the spectrum coding unit 326, and the number of samples in each of the five frequency bands detected by dividing the input spectrum is twice the number of samples in the spectrum coding unit 326. Considering that the total number of bits of the shape code is 45 bits in the monophonic coding unit 302, the spectrum coding unit 356 performs bit allocation as shown in FIG. As shown in FIG. 15, the number of pulses for which a full search is performed is “2” in the spectrum coding unit 356, which is different from the spectrum coding unit 326 in which the number of pulses for which a full search is performed is “3”.

Кроме того, как показано на фиг.15, число битов, которое следует использовать при кодировании спектра, составляет "46" всего в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число битов, которое следует использовать при кодировании спектра, составляет "45" всего.In addition, as shown in FIG. 15, the number of bits to be used in spectrum coding is “46” in total in the spectrum coding unit 356, which is different from the spectrum coding unit 326 in which the number of bits to be used in spectrum coding is "45" in total.

Здесь, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Например, диапазон поиска для одного из двух импульсов, для которых выполняется полный поиск в модуле 356 кодирования спектра, может быть ограничен от 0-159 выборок до 0-50 выборок. Посредством этого можно выражать 160×51<8192 видов результатов поиска посредством 13 битов, так что можно подавлять общее число битов, которые следует использовать при кодировании спектра, пределами 45 битов. Альтернативно, например, после поиска импульса в расчете на полосу частот, посредством ограничения диапазона поиска пятой полосы частот (т.е. наивысшей полосы частот) от 0-31 выборки до 0-15 выборок, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Это обусловлено тем, что в этом случае можно представлять позиции импульсов полосы частот в пяти полосах частот посредством 5×4+4=24 битов.Here, it is equally possible to fully compare the total number of bits that should be used when coding the spectrum in spectrum coding unit 356 with the total number of bits that should be used when coding the spectrum in spectrum coding unit 326. For example, the search range for one of two pulses for which a full search is performed in the spectrum coding unit 356 may be limited from 0-159 samples to 0-50 samples. By this means, 160 × 51 <8192 kinds of search results can be expressed by 13 bits, so that the total number of bits that should be used in spectrum coding can be suppressed beyond 45 bits. Alternatively, for example, after searching for an impulse per frequency band, by limiting the search range of the fifth frequency band (i.e., the highest frequency band) from 0-31 samples to 0-15 samples, the total number of bits can be compared equally, which should be used when coding the spectrum in the spectrum coding unit 356, with the total number of bits to be used when coding the spectrum in the spectrum coding unit 326. This is because in this case it is possible to represent the positions of the pulses of the frequency band in the five frequency bands by 5 × 4 + 4 = 24 bits.

Если модуль 356 кодирования спектра кодирует интегрированный спектр, интегрирующий спектр M-сигнала и спектр S-сигнала, выделение битов автоматически выполняется на основе признаков M-сигнала и S-сигнала, так что можно выполнять эффективное кодирование согласно значимости информации.If the spectrum encoding unit 356 encodes an integrated spectrum integrating the spectrum of the M signal and the spectrum of the S signal, bit allocation is automatically performed based on the characteristics of the M signal and the S signal, so that efficient encoding can be performed according to the significance of the information.

Например, если L-сигнал и R-сигнал являются полностью идентичными, спектр S-сигнала равен "0", и импульсы размещаются только в позициях спектра M-сигнала в интегрированном спектре. Следовательно, спектр M-сигнала кодируется точно.For example, if the L-signal and the R-signal are completely identical, the spectrum of the S-signal is "0", and the pulses are placed only in the positions of the spectrum of the M-signal in the integrated spectrum. Therefore, the spectrum of the M signal is encoded accurately.

В отличие от этого, если фаза L-сигнала и фаза R-сигнала являются приблизительно противоположными, спектр S-сигнала становится значимым, и больше импульсов размещается в позициях спектра S-сигнала в интегрированном спектре. Следовательно, спектр S-сигнала кодируется точно. Таким образом, без специальной классификации на основе решений или случаев выделение битов выполняется автоматически, и спектр M-сигнала и спектр S-сигнала кодируются эффективно.In contrast, if the phase of the L-signal and the phase of the R-signal are approximately opposite, the spectrum of the S-signal becomes significant, and more pulses are placed in the positions of the spectrum of the S-signal in the integrated spectrum. Therefore, the spectrum of the S signal is encoded accurately. Thus, without special classification based on decisions or cases, bit allocation is performed automatically, and the spectrum of the M signal and the spectrum of the S signal are encoded efficiently.

Кроме того, если имеются большие элементы на определенной частоте, и фаза L-сигнала и фаза R-сигнала не являются приблизительно противоположными, то один из спектра M-сигнала и спектра S-сигнала с большой вероятностью должен иметь большие элементы. Здесь, спектр M-сигнала и спектр S-сигнала элементов с одной частотой интегрируются рядом в интегрированный спектр, и интегрированный спектр разделяется на множество полос частот и кодируется в модуле 356 кодирования спектра, так что выполняется поиск и кодирование только одного из спектра M-сигнала и спектра S-сигнала частоты со значимыми элементами. Посредством этого можно не допускать кодирования двух импульсов элемента с одной частотой и реализовывать эффективное кодирование.In addition, if there are large elements at a certain frequency, and the phase of the L signal and the phase of the R signal are not approximately opposite, then one of the spectrum of the M signal and the spectrum of the S signal is likely to have large elements. Here, the M-signal spectrum and the S-signal spectrum of elements with the same frequency are integrated side by side in the integrated spectrum, and the integrated spectrum is divided into a plurality of frequency bands and encoded in the spectrum encoding unit 356, so that only one of the M-signal spectrum is searched and encoded and the spectrum of the S-signal frequency with significant elements. Through this, it is possible to prevent the coding of two pulses of the element with the same frequency and to implement effective coding.

Фиг.16 является блок-схемой, показывающей основные компоненты в модуле 306 стереофонического декодирования. Модуль 306 стереофонического декодирования содержит модуль 331a демультиплексирования, модуль 332a LPC-деквантования, модуль 333a декодирования спектра, IMDCT-модуль 334a и синтезирующий фильтр 335a, которые выполняют операции, идентичные операциям модуля 331 демультиплексирования, модуля 332 LPC-деквантования, модуля 333 декодирования спектра, IMDCT-модуля 334 и синтезирующего фильтра 335 из модуля 303 монофонического декодирования, показанного на фиг.11. Дополнительно, модуль 306 стереофонического декодирования содержит модуль 361 разложения, IMDCT-модуль 362 и синтезирующий фильтр 363. Кроме того, на фиг.16 выходной сигнал синтезирующего фильтра 335a является стереофоническим декодированным M-сигналом, а выходной сигнал синтезирующего фильтра 363 является стереофоническим декодированным S-сигналом.Fig is a block diagram showing the main components in the module 306 stereo decoding. The stereo decoding module 306 comprises a demultiplexing module 331a, an LPC dequantization module 332a, a spectrum decoding module 333a, an IMDCT module 334a and a synthesis filter 335a that perform operations identical to those of the demultiplexing module 331, the LPC dequantization module 332, the spectrum decoding module 333, IMDCT module 334 and synthesizing filter 335 from monophonic decoding module 303 shown in FIG. 11. Further, the stereo decoding module 306 includes a decomposition module 361, an IMDCT module 362, and a synthesis filter 363. In addition, in FIG. 16, the output of the synthesis filter 335a is a stereo decoded M signal, and the output of the synthesis filter 363 is stereo decoded S- signal.

Модуль 361 разложения раскладывает декодированный спектр, принимаемый в качестве ввода из модуля 333a декодирования спектра, в декодированный спектр M-сигнала и декодированный спектр S-сигнала посредством противоположной обработки относительно обработки в модуле 353 интегрирования на фиг.13. Дополнительно, модуль 361 разложения выводит декодированный спектр M-сигнала в IMDCT-модуль 334a и выводит декодированный спектр S-сигнала в IMDCT-модуль 362.The decomposition unit 361 decomposes the decoded spectrum received as input from the spectrum decoding unit 333a into the decoded spectrum of the M signal and the decoded spectrum of the S signal by opposite processing with respect to the processing in the integration module 353 in FIG. 13. Additionally, decomposition module 361 outputs the decoded spectrum of the M signal to IMDCT module 334a and outputs the decoded spectrum of the S signal to IMDCT module 362.

IMDCT-модуль 362 преобразует декодированный спектр S-сигнала, принимаемый в качестве ввода из модуля 361 разложения, противоположным способом относительно MDCT-модуля 352, показанного на фиг.13, и выводит S-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 363.The IMDCT module 362 converts the decoded spectrum of the S signal received as input from the decomposition module 361 in the opposite way to the MDCT module 352 shown in FIG. 13 and outputs the time series S signal detected by the conversion to a synthesis filter 363 .

Синтезирующий фильтр 363 предоставляет стереофонический декодированный S-сигнал посредством применения синтезирующего фильтра к S-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 362, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332a LPC-деквантования.Synthesizing filter 363 provides a stereo decoded S signal by applying a synthesizing filter to an S-signal of a time series received as input from IMDCT module 362 using LPC parameters received as input from LPC dequantization module 332a.

Далее поясняется конфигурация и операции устройства декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов, показанное на чертеже 1.Next, the configuration and operations of the stereo signal decoding apparatus supporting the stereo signal encoding apparatus 100 shown in FIG. 1 are explained.

Фиг.17 является блок-схемой, показывающей основные компоненты устройства 200 декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов.17 is a block diagram showing the main components of a stereo signal decoding apparatus 200 supporting a stereo signal encoding apparatus 100.

На фиг.17 устройство 200 декодирования стереофонических сигналов содержит модуль 201 демультиплексирования, модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя, модуль 206 декодирования третьего улучшающего слоя и модуль 207 вычисления суммы и разности.17, the stereo signal decoding apparatus 200 comprises a demultiplexing module 201, a mode setting module 202, a base layer decoding module 203, a first enhancement layer decoding module 204, a second enhancement layer decoding module 205, a third enhancement layer decoding module 206, and a sum calculation module 207 and difference.

Модуль 201 демультиплексирования демультиплексирует потоки битов, принимаемые в качестве ввода из устройства 100 кодирования стереофонических сигналов, в информацию режима, кодированную информацию базового слоя, кодированную информацию первого улучшающего слоя, кодированную информацию второго улучшающего слоя и кодированную информацию третьего улучшающего слоя, и выводит их в модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, соответственно.The demultiplexing unit 201 demultiplexes the bit streams received as input from the stereo signal encoding apparatus 100 into mode information, encoded information of the base layer, encoded information of the first enhancement layer, encoded information of the second enhancement layer and encoded information of the third enhancement layer, and outputs them to the module 202 mode settings, base layer decoding module 203, first enhancement layer decoding module 204, second enhancement layer decoding module 205 I and decoding module 206 of the third enhancement layer, respectively.

Модуль 202 задания режима выводит информацию режима для задания режимов декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя, принимаемую в качестве ввода из модуля 201 демультиплексирования, в эти модули декодирования.The mode setting module 202 outputs mode information for setting the decoding modes in the base layer decoding module 203, the first enhancement layer decoding module 204, the second enhancement layer decoding module 205 and the third enhancement layer decoding module 206, received as input from the demultiplexing unit 201, to these decoding modules.

Режим декодирования в каждом модуле декодирования упоминается как режим монофонического декодирования для декодирования только информации M-сигнала или режим стереофонического декодирования для декодирования как информации M-сигнала, так и информации S-сигнала. Здесь, информация M-сигнала типично соответствует самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, информация S-сигнала типично соответствует самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.The decoding mode in each decoding unit is referred to as a monaural decoding mode for decoding only M-signal information or a stereo decoding mode for decoding both M-signal information and S-signal information. Here, the information of the M signal typically corresponds to the M signal itself or coding distortion associated with the M signal in each layer. In addition, S-signal information typically corresponds to the S-signal itself or coding distortion associated with the S-signal in each layer.

Далее, режим декодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического декодирования, а значение "1" представляет режим стереофонического декодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя. Например, информация четырехбитового режима "0000" означает, что монофоническое декодирование выполняется во всех слоях. Кроме того, например, информация режима "0011" означает, что модуль 203 декодирования базового слоя и модуль 204 декодирования первого улучшающего слоя выполняют монофоническое декодирование, а модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя выполняют стереофоническое декодирование. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов декодирования в четырех модулях декодирования.Further, the decoding mode in each layer is shown using each of the mode information bits. Thus, in bits, the value “0” represents the mono decoding mode, and the value “1” represents the stereo decoding mode. More specifically, for example, each of the four bits of mode information is used to sequentially represent decoding modes in the base layer decoding module 203, the first enhancement layer decoding module 204, the second enhancement layer decoding module 205, and the third enhancement layer decoding module 206. For example, the four-bit mode information “0000” means that monaural decoding is performed in all layers. In addition, for example, the “0011” mode information means that the base layer decoding module 203 and the first enhancement layer decoding module 204 perform monophonic decoding, and the second enhancement layer decoding module 205 and the third enhancement layer decoding module 206 perform stereo decoding. Thus, using the information of the four-bit mode, sixteen types of decoding modes in four decoding modules can be represented.

В настоящем варианте осуществления информация режима, выводимая из модуля 202 задания режима, принимается в каждом модуле декодирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль декодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим декодирования, и задает режим декодирования. Таким образом, во входной информации четырехбитового режима модуль 203 декодирования базового слоя проверяет первый бит, модуль 204 декодирования первого улучшающего слоя проверяет второй бит, модуль 205 декодирования второго улучшающего слоя проверяет третий бит, а модуль 206 декодирования третьего улучшающего слоя проверяет четвертый бит.In the present embodiment, the mode information output from the mode setting unit 202 is received in each decoding unit as identical input information of the four-bit mode. Additionally, each decoding module checks only one bit of the four input bits required to set the decoding mode, and sets the decoding mode. Thus, in the four-bit mode input, the base layer decoding module 203 checks the first bit, the first enhancement layer decoding module 204 checks the second bit, the second enhancement layer decoding module 205 checks the third bit, and the third enhancement layer decoding module 206 checks the fourth bit.

Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле декодирования, модуль 202 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим декодирования в каждом модуле декодирования и выводить один бит в каждый модуль декодирования. Таким образом, в четырех битах информации режима модуль 202 задания режима может вводить только первый бит в модуле 203 декодирования базового слоя, только второй бит в модуле 204 декодирования первого улучшающего слоя, только третий бит в модуле 205 декодирования второго улучшающего слоя и только четвертый бит в модуле 206 декодирования третьего улучшающего слоя.However, instead of entering identical four-bit mode information in each decoding unit, the mode setting unit 202 can pre-sort one bit required to set the decoding mode in each decoding unit and output one bit to each decoding unit. Thus, in four bits of mode information, the mode setting module 202 can only enter the first bit in the base layer decoding module 203, only the second bit in the first enhancement layer decoding module 204, only the third bit in the second enhancement layer decoding module 205, and only the fourth bit in decoding module 206 of the third enhancement layer.

Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 201 демультиплексирования в модуль 202 задания режима, упоминается как информация четырехбитового режима.In addition, in any of the above cases, the mode information received as input from the demultiplexing unit 201 to the mode setting unit 202 is referred to as four-bit mode information.

В модуле 203 декодирования базового слоя режим монофонического декодирования или режим стереофонического декодирования задается на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 203 декодирования базового слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. В этом случае информация S-сигнала не декодируется, и, следовательно, нулевой сигнал, видимо, выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя.In the base layer decoding unit 203, a monaural decoding mode or a stereo decoding mode is set based on the mode information received as input from the mode setting unit 202. More specifically, after setting the monophonic decoding mode, the base layer decoding module 203 decodes the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the base layer and outputs the resulting decoded M-signal of the base layer to the first enhancement layer decoding module 204. In this case, the S-signal information is not decoded, and therefore, the zero signal is apparently output to the first enhancement layer decoding unit 204 as a decoded S-signal of the base layer.

Напротив, после задания режима стереофонического декодирования модуль 203 декодирования базового слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. Здесь, модуль 203 декодирования базового слоя полностью сбрасывает M-сигнал и S-сигнал (т.е. задает значения 0 для этих сигналов) перед декодированием. Кроме того, модуль 203 декодирования базового слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the base layer decoding unit 203 decodes the stereo encoded information received from the demultiplexing unit 201 as input encoded information of the base layer and outputs the resulting decoded M-signal of the base layer and the decoded S-signal of the base layer to the decoding unit 204 of the first enhancement layer. Here, the base layer decoding unit 203 completely resets the M signal and the S signal (i.e., sets the values 0 for these signals) before decoding. In addition, the base layer decoding module 203 is explained in more detail below.

В модуле 204 декодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажение при кодировании базового слоя M-сигнала. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Декодированный S-сигнал базового слоя, принимаемый в качестве ввода из модуля 203 декодирования базового слоя, выводится как есть в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя.In the decoding module 204 of the first enhancement layer, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting unit 202. More specifically, after setting the monophonic decoding mode, the first enhancement layer decoding unit 204 decodes the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the first enhancement layer, and detects an encoding distortion of the base layer of the M signal. The first enhancement layer decoding unit 204 sums the distortion in encoding the base layer of the M signal and the decoded base layer M signal received as input from the base layer decoding unit 203, and outputs the summation result to the second enhancement layer decoding unit 205 as a decoded M signal first enhancement layer. The decoded S-signal of the base layer, taken as input from the base layer decoding unit 203, is output as is to the second enhancement layer decoding unit 205 as a decoded S-signal of the first enhancement layer.

Напротив, после задания режима стереофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажения при кодировании базового слоя M- и S-сигналов. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя S-сигнала и декодированный S-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the first enhancement layer decoding unit 204 decodes the stereo encoded information received from the demultiplexing unit 201 as input encoded information of the first enhancement layer, and detects distortions in encoding the base layer of the M and S signals. The first enhancement layer decoding unit 204 sums the distortion in encoding the base layer of the M signal and the decoded base layer M signal received as input from the base layer decoding unit 203, and outputs the summation result to the second enhancement layer decoding unit 205 as a decoded M signal first enhancement layer. In addition, the decoding module 204 of the first enhancement layer summarizes the distortion when encoding the base layer of the S signal and the decoded S signal of the base layer, taken as input from the decoding module 203 of the base layer, and outputs the result of the summation to the decoding module 205 of the second enhancement layer as decoded S signal of the first enhancement layer. In addition, the first enhancement layer decoding unit 204 is explained in more detail below.

В модуле 205 декодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажение при кодировании первого улучшающего слоя, связанное с M-сигналом. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, выводится как есть в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.In the second enhancement layer decoding unit 205, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting unit 202. More specifically, after setting the monophonic decoding mode, the second enhancement layer decoding unit 205 decodes the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the second enhancement layer, and detects an encoding distortion of the first enhancement layer associated with the M signal. The second enhancement layer decoding unit 205 summarizes the coding distortion of the first enhancement layer associated with the M signal and the decoded M-signal of the first enhancement layer, taken as input from the decoding unit 204 of the first enhancement layer, and outputs the summation result to the third decoding unit 206 enhancement layer as a decoded M signal of the second enhancement layer. The decoded S signal of the first enhancement layer, received as input from the decoding module 204 of the first enhancement layer, is output as it is to the decoder module 206 of the third enhancement layer as the decoded S signal of the second enhancement layer.

Напротив, после задания режима стереофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo decoding mode, the second enhancement layer decoding unit 205 decodes the stereo encoded information received from the demultiplexing unit 201 as input encoded information of the second enhancement layer, and detects distortions in the encoding of the first enhancement layer associated with the M and S signals. The second enhancement layer decoding unit 205 summarizes the coding distortion of the first enhancement layer associated with the M signal and the decoded M-signal of the first enhancement layer, taken as input from the decoding unit 204 of the first enhancement layer, and outputs the summation result to the third decoding unit 206 enhancement layer as a decoded M signal of the second enhancement layer. In addition, the second enhancement layer decoding unit 205 summarizes the encoding distortion of the first enhancement layer associated with the S signal and the decoded S signal of the first enhancement layer received as input from the first enhancement layer decoding unit 204, and outputs the summing result to the module 206 decoding the third enhancement layer as a decoded S signal of the second enhancement layer. In addition, the decoding module 205 of the second enhancement layer is explained in more detail below.

В модуле 206 декодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажение при кодировании второго улучшающего слоя, связанное с M-сигналом. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Декодированный S-сигнал второго улучшающего слоя, принимаемый в качестве ввода из модуля 205 декодирования второго улучшающего слоя, выводится как есть в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя.In the third enhancement layer decoding unit 206, a monaural encoding mode or a stereo encoding mode are set based on the mode information received as input from the mode setting unit 202. More specifically, after setting the monophonic decoding mode, the third enhancement layer decoding unit 206 decodes the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the third enhancement layer, and detects an encoding distortion of the second enhancement layer associated with the M signal. The third enhancement layer decoding unit 206 sums the second enhancement layer encoding distortion associated with the M signal and the second enhancement layer decoded M signal received as input from the second enhancement layer decoding unit 205, and outputs the summation result to the sum calculation unit 207 and differences as a decoded M signal of the third enhancement layer. The decoded S signal of the second enhancement layer, received as input from the decoding module 205 of the second enhancement layer, is output as is to the sum and difference calculation unit 207 as the decoded S signal of the third enhancement layer.

Напротив, после задания режима стереофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the third enhancement layer decoding unit 206 decodes the stereo encoded information received from the demultiplexing unit 201 as input encoded information of the third enhancement layer and detects distortions in the encoding of the second enhancement layer associated with the M and S signals. The third enhancement layer decoding unit 206 sums the second enhancement layer encoding distortion associated with the M signal and the second enhancement layer decoded M signal received as input from the second enhancement layer decoding unit 205, and outputs the summation result to the sum calculation unit 207 and differences as a decoded M signal of the third enhancement layer. In addition, the third enhancement layer decoding unit 206 summarizes the second enhancement layer encoding distortion associated with the S signal and the second enhancement layer decoded S signal received as input from the second enhancement layer decoding unit 205, and outputs the summation result to the module 207 calculating the sum and difference as the decoded S signal of the third enhancement layer. In addition, the third enhancement layer decoding unit 206 is explained in more detail below.

Модуль 207 вычисления суммы и разности вычисляет декодированный L-сигнал и декодированный R-сигнал согласно следующим уравнениям 9 и 10 с помощью декодированного M-сигнала третьего улучшающего слоя и декодированного S-сигнала третьего улучшающего слоя, принимаемых в качестве ввода из модуля 206 декодирования третьего улучшающего слоя.The sum and difference calculation unit 207 calculates the decoded L signal and the decoded R signal according to the following equations 9 and 10 using the decoded M signal of the third enhancement layer and the decoded S signal of the third enhancement layer, taken as input from the third enhancement decoding unit 206 layer.

Li'=(Mi'+Si')/2 … (уравнение 9)Li '= (Mi' + Si ') / 2 ... (equation 9)

Ri'=(Mi'-Si')/2 … (уравнение 10)Ri '= (Mi'-Si') / 2 ... (equation 10)

В уравнениях 9 и 10 Mi' представляет декодированный M-сигнал третьего улучшающего слоя, si' представляет декодированный S-сигнал третьего улучшающего слоя, Li' представляет декодированный L-сигнал, а Ri' представляет декодированный R-сигнал.In equations 9 and 10, Mi 'represents the decoded M signal of the third enhancement layer, si' represents the decoded S signal of the third enhancement layer, Li 'represents the decoded L signal, and Ri' represents the decoded R signal.

Фиг.18 является блок-схемой, показывающей основные компоненты в модуле 203 декодирования базового слоя.Fig is a block diagram showing the main components in the module 203 decoding the base layer.

Модуль 203 декодирования базового слоя, показанный на фиг.18, содержит переключатель 231, модуль 232 монофонического декодирования, модуль 233 стереофонического декодирования, переключатель 234 и переключатель 235.The base layer decoding module 203 shown in FIG. 18 comprises a switch 231, a monaural decoding module 232, a stereo decoding module 233, a switch 234, and a switch 235.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 231 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 232 монофонического декодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 233 стереофонического декодирования.If the value of the first bit of the mode information received as input from the mode setting module 202 is “0”, the switch 231 outputs the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the base layer to the monophonic decoding module 232, and if the value the first bit of mode information received as input from mode setting module 202 is “1”, outputs stereo encoded information received from demultiplexing module 201 as input th coded information to base layer 233 in the stereo decoding unit.

Модуль 232 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, и выводит результирующий декодированный M-сигнал базового слоя в переключатель 234. Кроме того, конфигурация и операции в модуле 232 монофонического декодирования являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, показанном на фиг.11, и, следовательно, их конкретное пояснение опускается.Monophonic decoding module 232 performs monophonic decoding using monophonic encoded information received as input from switch 231, and outputs the resulting decoded base layer M signal to switch 234. In addition, the configuration and operations in monophonic decoding module 232 are identical to the configuration and operations in the monophonic decoding unit 303 shown in FIG. 11, and therefore, their specific explanation is omitted.

Модуль 233 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в переключатель 234 и переключатель 235, соответственно. Кроме того, конфигурация и операции в модуле 233 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.The stereo decoding unit 233 performs stereo decoding using stereo encoded information received as input from the switch 231, outputs the resulting decoded M-signal of the base layer and the decoded S-signal of the base layer to the switch 234 and the switch 235, respectively. In addition, the configuration and operations in the stereo decoding unit 233 are identical to the configurations and operations in the stereo decoding unit 306 shown in FIG. 16, and therefore, their specific explanation is omitted.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 232 монофонического декодирования, в модуль 204 декодирования первого улучшающего слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 233 стереофонического декодирования, в модуль 204 декодирования первого улучшающего слоя.If the value of the first bit of the mode information received as input from the mode setting unit 202 is “0”, the switch 234 outputs the decoded base layer M signal received as input from the monaural decoding unit 232 to the first enhancement layer decoding unit 204. If the value of the first bit of the mode information received as input from the mode setting unit 202 is “1”, the switch 234 outputs the decoded base layer M signal received as input from the stereo decoding unit 233 to the decoding unit 204 of the first enhancement layer.

Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 235 отключается и не выводит сигнал. Здесь, в качестве эквивалентной обработки, фактически сигнал из всех нулевых значений (т.е. нулевой сигнал) выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", принимаемый декодированный S-сигнал базового слоя в качестве ввода из модуля 233 стереофонического декодирования выводится в модуль 204 декодирования первого улучшающего слоя.If the value of the first bit of the mode information received as input from the mode setting module 202 is “0”, the switch 235 is turned off and does not output a signal. Here, as equivalent processing, in fact, a signal from all zero values (i.e., a zero signal) is output to the first enhancement layer decoding unit 204 as a decoded S-signal of the base layer. If the value of the first bit of the mode information received as input from the mode setting unit 202 is “1”, the received decoded S-signal of the base layer as input from the stereo decoding unit 233 is output to the decoding unit 204 of the first enhancement layer.

Фиг.19 является блок-схемой, показывающей основные компоненты в модуле 205 декодирования второго улучшающего слоя. Здесь, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, показанные на фиг.17, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 205 декодирования второго улучшающего слоя.19 is a block diagram showing the main components in the decoding module 205 of the second enhancement layer. Here, the first enhancement layer decoding module 204, the second enhancement layer decoding module 205, and the third enhancement layer decoding module 206 shown in FIG. 17 have the same internal configuration and operations, but differ in input and output signals. Therefore, an exemplary case is illustrated with only the decoding module 205 of the second enhancement layer.

На фиг.19 модуль 205 декодирования второго улучшающего слоя содержит переключатель 251, модуль 252 монофонического декодирования, модуль 253 стереофонического декодирования, переключатель 254, сумматор 255, переключатель 256 и сумматор 257.19, the decoding module 205 of the second enhancement layer comprises a switch 251, a mono decoding module 252, a stereo decoding module 253, a switch 254, an adder 255, a switch 256, and an adder 257.

Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 251 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 252 монофонического декодирования. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 251 выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 253 стереофонического декодирования.If the value of the third bit of the mode information received as input from the mode setting unit 202 is “0”, the switch 251 outputs the monophonic encoded information received from the demultiplexing unit 201 as input encoded information of the second enhancement layer to the monaural decoding unit 252. In addition, if the value of the third bit of the mode information received as input from the mode setting unit 202 is “1”, the switch 251 outputs the stereo encoded information received from the demultiplexing unit 201 as input encoded information of the second enhancement layer to the stereo decoding unit 253 .

Модуль 252 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в переключатель 254. Кроме того, конфигурация и операции в модуле 252 монофонического декодирования, показанном на фиг.11, являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, и, следовательно, их конкретное пояснение опускается.Monophonic decoding module 252 performs monophonic decoding using monophonic encoded information received as input from switch 251, and outputs the resulting distortion when encoding the first enhancement layer associated with the M signal to switch 254. In addition, the configuration and operations in module 252 the monophonic decoding shown in FIG. 11 are identical to the configuration and operations of the monophonic decoding unit 303, and therefore, their specific explanation is omitted .

Модуль 253 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, в переключатель 254 и переключатель 257, соответственно. Кроме того, конфигурация и операции в модуле 253 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.The stereo decoding unit 253 performs stereo decoding using the stereo encoded information received as input from the switch 251, and outputs the resulting distortion when encoding the first enhancement layer associated with the M signal and distortion when encoding the first enhancement layer associated with the S signal , into switch 254 and switch 257, respectively. In addition, the configuration and operations in the stereo decoding unit 253 are identical to the configuration and operations in the stereo decoding unit 306 shown in FIG. 16, and therefore, their specific explanation is omitted.

Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 252 монофонического декодирования, в сумматор 255. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, в сумматор 255.If the value of the third bit of the mode information received as input from the mode setting module 202 is “0”, the switch 254 outputs a distortion when encoding the first enhancement layer associated with the M signal received as input from the monaural decoding unit 252 to the adder 255. In addition, if the value of the third bit of the mode information received as input from the mode setting module 202 is “1”, the switch 254 outputs distortion when encoding the first enhancement layer associated with the M-signal received as stve input from stereo decoding module 253, an adder 255.

Сумматор 255 суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из переключателя 254, и декодированный M-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя.An adder 255 summarizes the distortion in encoding the first enhancement layer associated with the M signal received as input from the switch 254, and the decoded M signal of the first enhancement layer received as input from the decoding unit 204 of the first enhancement layer, and outputs the summation result to a third enhancement layer decoding unit 206 as a decoded M signal of the second enhancement layer.

Сумматор 257 суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, и декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат в переключатель 256.An adder 257 summarizes the distortion in encoding the first enhancement layer associated with the S signal received as input from the stereo decoding unit 253 and the decoded S signal of the first enhancement layer received as input from the decoding unit 204 of the first enhancement layer, and outputs the result into switch 256.

Если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 256 выводит декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, как есть в модуль 206 декодирования третьего улучшающего слоя. Кроме того, если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 256 выводит результат суммирования, принимаемый в качестве ввода из сумматора 257, в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.If the value of the second bit of the mode information received as input from the mode setting module 202 is “0”, the switch 256 outputs a decoded S-signal of the first enhancement layer, which is received as input from the decoding module 204 of the first enhancement layer, as is in the module 206 decoding the third enhancement layer. In addition, if the value of the second bit of the mode information received as input from the mode setting unit 202 is “1”, the switch 256 outputs the summation result received as input from the adder 257 to the third enhancement layer decoding unit 206 as decoded S- signal of the second enhancement layer.

Таким образом, согласно настоящему варианту осуществления, масштабируемое кодирование выполняется для монофонического сигнала (т.е. M-сигнала) и бокового сигнала (т.е. S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, так что можно выполнять масштабируемое кодирование с использованием корреляции между L-сигналом и R-сигналом. Дополнительно, согласно настоящему варианту осуществления, режим кодирования в каждом слое в масштабируемом кодировании задается на основе информации режима, так что можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и повышать степень свободы в управлении точностью кодирования.Thus, according to the present embodiment, scalable encoding is performed for the mono signal (i.e., the M signal) and the side signal (i.e., the S signal) calculated from the L signal and the R signal of the stereo signal, so that scalable coding can be performed using the correlation between the L signal and the R signal. Further, according to the present embodiment, the encoding mode in each layer in scalable encoding is set based on the mode information, so that a layer for performing monaural encoding and a layer for performing stereo encoding can be defined and the degree of freedom in controlling the encoding accuracy can be increased.

Кроме того, согласно настоящему варианту осуществления, спектр M-сигнала и спектр S-сигнала интегрируются и кодируются таким образом, что спектры одной частоты являются смежными друг с другом, так что можно выполнять автоматическое выделение битов без специальной классификации на основе решений или случаев при стереофоническом кодировании и выполнять эффективное кодирование согласно значимости информации L-сигнала и R-сигнала.Furthermore, according to the present embodiment, the M-signal spectrum and the S-signal spectrum are integrated and encoded so that the spectra of the same frequency are adjacent to each other, so that it is possible to perform automatic bit allocation without special classification based on decisions or cases in stereo encoding and performing efficient encoding according to the significance of the L-signal and R-signal information.

Второй вариант осуществленияSecond Embodiment

Фиг.20 является блок-схемой, показывающей основные компоненты устройства 110 кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения. Устройство 110 кодирования стереофонических сигналов, показанное на фиг.20, имеет в основном идентичную конфигурацию и выполняет в основном идентичные операции устройству 100 кодирования стереофонических сигналов, показанному на фиг.1. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.1 и фиг.20, "a" назначается ссылкам с номерами модулей на фиг.20. Например, модуль на фиг.20, соответствующий модулю 101 вычисления суммы и разности на фиг.1, выражается как модуль 101a вычисления суммы и разности. Кроме того, устройство 110 кодирования стереофонических сигналов на фиг.20 отличается от устройства 100 кодирования стереофонических сигналов на фиг.1 включением дополнительных модулей 112-114 задания режима. Кроме того, модуль 111 задания режима устройства 110 кодирования стереофонических сигналов на фиг.20 отличается от модуля 102 задания режима устройства 100 кодирования стереофонических сигналов на фиг.1 входными сигналами, и, следовательно, ему назначается другая ссылка с номером. Здесь, модули 111-114 задания режима, показанные на фиг.20, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 111 задания режима.FIG. 20 is a block diagram showing the main components of a stereo signal encoding apparatus 110 according to Embodiment 2 of the present invention. The stereo signal encoding device 110 shown in FIG. 20 has a substantially identical configuration and performs substantially identical operations to the stereo signal encoding device 100 shown in FIG. Therefore, with regard to modules that perform identical operations for FIG. 1 and FIG. 20, “a” is assigned to the module numbers in FIG. 20. For example, the module in FIG. 20 corresponding to the sum and difference calculation module 101 in FIG. 1 is expressed as the sum and difference calculation module 101a. In addition, the stereo signal encoding device 110 in FIG. 20 is different from the stereo signal encoding device 100 in FIG. 1 by the inclusion of additional mode setting modules 112-114. In addition, the mode setting module 111 of the stereo signal encoding device 110 in FIG. 20 is different from the mode setting module 102 of the stereo signal encoding device 100 in FIG. 1 by input signals, and therefore, another reference number is assigned to it. Here, the mode setting modules 111-114 shown in FIG. 20 have identical internal configuration and operations, but differ in input signals and output signals. Therefore, an exemplary case is illustrated with only the mode setting module 111.

Модуль 111 задания режима вычисляет мощность M-сигнала и S-сигнала, принимаемых в качестве ввода из модуля 101a вычисления суммы и разности, и на основе вычисленной мощности и заранее определенных условных уравнений задает режим монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Например, режим стереофонического кодирования задается, если мощность S-сигнала превышает мощность M-сигнала, или режим монофонического кодирования задается, если мощность S-сигнала ниже мощности M-сигнала. Кроме того, если мощность M-сигнала и мощность S-сигнала является низкой, режим монофонического кодирования задается. Это учитывает то, что когда кодеры разрабатываются, кодер стереофонических сигналов, который обрабатывает два типа сигналов, предоставляет более высокий битрейт, чем кодер монофонических сигналов, который обрабатывает один тип сигнала. Кроме того, информация о заданном режиме выводится в модуль 103a кодирования базового слоя и модуль 107a мультиплексирования.The mode setting module 111 calculates the power of the M-signal and the S-signal received as input from the sum and difference calculation module 101a, and, based on the calculated power and predetermined conditional equations, sets the monophonic coding mode for encoding only the M-signal information or the stereo mode encoding for encoding both the M-signal information and the S-signal information. For example, the stereo coding mode is set if the power of the S signal exceeds the power of the M signal, or the monaural coding mode is set if the power of the S signal is lower than the power of the M signal. In addition, if the power of the M-signal and the power of the S-signal is low, the monaural encoding mode is set. This allows for the fact that when encoders are developed, a stereo encoder that processes two types of signals provides a higher bit rate than a monophonic encoder that processes one type of signal. In addition, information about a predetermined mode is output to the base layer encoding unit 103a and the multiplexing unit 107a.

Вычисление мощности в модуле 111 задания режима выполняется согласно следующим уравнениям 11 и 12.The power calculation in the mode setting module 111 is performed according to the following equations 11 and 12.

[7][7]

… (уравнение 11)

... (equation 11)

… (уравнение 12)

... (equation 12)

В уравнениях 11 и 12 i представляет номер выборки, PowM представляет мощность M-сигнала, а M_i представляет M-сигнал. Кроме того, PowS представляет мощность S-сигнала, а s_i представляет S-сигнал.In equations 11 and 12, i represents the sample number, PowM represents the power of the M signal, and M _i represents the M signal. In addition, PowS represents the power of the S signal, and s _i represents the S signal.

Заранее определенное условное уравнение в модуле 111 задания режима показано в следующем уравнении 13.A predetermined conditional equation in the mode setting module 111 is shown in the following equation 13.

[8][8]

В уравнении 13 α представляет константу для оценки полной мощности и может приспосабливать верхнее предельное значение мощности сигнала, который не воспринимается. Кроме того, β представляет константу для оценки мощности S-сигнала. Способ вычисления константы β для оценки мощности S-сигнала описывается ниже. Кроме того, m представляет режим. Здесь, например, константа α для оценки полной мощности и константа β для оценки мощности S-сигнала сохраняются в ROM.In equation 13, α represents a constant for estimating the total power and can fit the upper limit value of the power of the signal, which is not perceived. In addition, β represents a constant for estimating the power of the S signal. A method for calculating the constant β for estimating the power of an S signal is described below. In addition, m represents a mode. Here, for example, the constant α for estimating the total power and the constant β for estimating the power of the S-signal are stored in ROM.

Что касается константы β для оценки мощности S-сигнала, если сигнал меньшего искажения при кодировании выбирается из L-сигнала и R-сигнала, способ статистического вычисления и сохранения соответствующих β в модулях 111-114 задания режима является возможным. Конкретный способ вычисления константы для оценки мощности S-сигнала β поясняется ниже.As for the constant β for estimating the power of the S-signal, if the signal of less distortion during encoding is selected from the L-signal and the R-signal, a method for calculating and storing corresponding β in the mode setting modules 111-114 is possible. A specific method for calculating the constant for estimating the power of the S-signal β is explained below.

Здесь поясняется способ вычисления константы β для оценки мощности S-сигнала в модуле 111 задания режима. Во-первых, большой объем стереофонических речевых данных принимается в качестве ввода в модуле 111 задания режима для обучения, и отношение между мощностью M-сигнала и мощностью S-сигнала вычисляется согласно следующему уравнению 14.Here, a method for calculating the constant β for estimating the power of the S signal in the mode setting unit 111 is explained. First, a large amount of stereo speech data is received as input in the learning mode setting unit 111, and the relationship between the power of the M signal and the power of the S signal is calculated according to the following equation 14.

[9][9]

… (уравнение 14)

... (equation 14)

В уравнении 14 i представляет номер выборки каждого сигнала, а j представляет номер обучающих стереофонических речевых данных. Кроме того, M_i представляет M-сигнал, а s_i представляет S-сигнал. Кроме того, PowM_j представляет мощность M-сигнала J-х обучающих стереофонических речевых данных, а PowS_j представляет мощность S-сигнала J-х обучающих стереофонических речевых данных.In equation 14, i represents the sample number of each signal, and j represents the number of training stereo speech data. In addition, M _i represents the M signal, and s _i represents the S signal. In addition, PowM _j represents the power of the M-signal of the J-x training stereo speech data, and PowS _j represents the power of the S-signal of the J-x training stereo speech data.

Затем, противоположная обработка относительно понижающего микширования выполняется для декодированного M-сигнала и декодированного S-сигнала, обнаруживаемых посредством кодирования и декодирования в двух режимах в модуле 103a кодирования базового слоя, чтобы находить декодированный L-сигнал и декодированный R-сигнал. Вычисляются суммы отношений "сигнал-шум" результирующего декодированного L-сигнала и декодированного R-сигнала (т.е. отношения "сигнал-шум" в случае, когда искажение при кодировании L-сигнала и R-сигнала, принимаемых в качестве ввода в устройстве 110 кодирования стереофонических сигналов, рассматривается как шум), т.е. E0j и E1j.Then, the opposite processing with respect to the downmix is performed for the decoded M signal and the decoded S signal detected by two-mode encoding and decoding in the base layer encoding unit 103a to find the decoded L signal and the decoded R signal. The sums of the signal-to-noise ratios of the resulting decoded L-signal and the decoded R-signal are calculated (i.e., the signal-to-noise ratios in the case where the distortion in the coding of the L-signal and R-signal, taken as input to the device 110 encoding stereo signals, is regarded as noise), i.e. E0j and E1j.

Затем, посредством постепенного изменения значения β между 0 и 1,0 полное отношение "сигнал-шум" E_β, показанное в следующем уравнении 15, вычисляется.Then, by gradually changing the value of β between 0 and 1.0, the total signal-to-noise ratio E _β shown in the following equation 15 is calculated.

[10][10]

Значение β, чтобы максимизировать вышеприведенное E_β, вычисляется. Это значение сохраняется в модуле 111 задания режима и используется как константа для оценки мощности S-сигнала β. Аналогично модулю 111 задания режима, модули 112-114 задания режима вычисляют и сохраняют константу для оценки мощности S-сигнала β.The value of β in order to maximize the above E _β is calculated. This value is stored in the mode setting module 111 and is used as a constant for estimating the power of the S-signal β. Similar to the mode setting module 111, the mode setting modules 112-114 calculate and store a constant for estimating the power of the S signal β.

Кроме того, устройство декодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения имеет конфигурацию, идентичную конфигурации на фиг.17 варианта осуществления 1, и, следовательно, пояснение опускается.In addition, the stereo signal decoding apparatus according to Embodiment 2 of the present invention has a configuration identical to that of FIG. 17 of Embodiment 1, and therefore, the explanation is omitted.

Таким образом, согласно настоящему варианту осуществления, по мере того как проходит обработка кодирования в каждом слое, режим кодирования в каждом слое при масштабируемом кодировании задается на основе локальных признаков речи, так что можно автоматически задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и предоставлять декодированные сигналы высокого качества. Кроме того, если битрейт варьируется между режимами, управление скоростью передачи осуществляется автоматически, так что можно экономить число информационных битов.Thus, according to the present embodiment, as encoding processing in each layer proceeds, the encoding mode in each layer for scalable encoding is set based on local speech features, so that a layer for performing monophonic encoding and a layer for performing stereo encoding can be automatically set. and provide high quality decoded signals. In addition, if the bit rate varies between modes, the transmission rate is controlled automatically, so that the number of information bits can be saved.

Выше описаны варианты осуществления настоящего изобретения.Embodiments of the present invention are described above.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых стереофонические сигналы главным образом используются как речевые сигналы, разумеется, что стереофонические сигналы могут использоваться как аудиосигналы.In addition, although the embodiments described above describe cases in which stereo signals are mainly used as speech signals, it is understood that stereo signals can be used as audio signals.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых модуль 353 интегрирования интегрирует спектр M-сигнала и спектр S-сигнала так, что спектры одной частоты являются смежными друг с другом, настоящее изобретение не ограничено этим, и в равной степени можно интегрировать эти спектры в модуле 353 интегрирования так, что спектр S-сигнала простым способом размещается смежно до или после спектра M-сигнала.Furthermore, although exemplary cases have been described in the embodiments above, in which the integration module 353 integrates the M-signal spectrum and the S-signal spectrum so that the spectra of the same frequency are adjacent to each other, the present invention is not limited to this, and it is equally possible integrate these spectra into the integration module 353 so that the spectrum of the S signal is easily placed adjacent to before or after the spectrum of the M signal.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых два типа стереофонических сигналов представляются с помощью названий "сигнал левого канала" и "сигнал правого канала", в равной степени можно использовать более общие названия, к примеру "сигнал первого канала" и "сигнал второго канала". Кроме того, ассоциирование между битовыми значениями "0" и "1" и режимами кодирования "режим монофонического кодирования" и "режим стереофонического кодирования" не ограничено.In addition, although the embodiments described above describe cases in which two types of stereo signals are represented by the names “left channel signal” and “right channel signal”, more general names such as “first channel signal” and "second channel signal". In addition, the association between the bit values “0” and “1” and the encoding modes “monaural encoding mode” and “stereo encoding mode” is not limited.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых настоящее изобретение применяется к техническим требованиям, в которых частота дискретизации составляет 16 кГц, а длина кадра составляет 20 мс, настоящее изобретение не ограничено этим, и в равной степени можно применять настоящее изобретение к другим техническим требованиям, в которых частота дискретизации составляет 8 кГц, 24 кГц, 32 кГц, 44,1 кГц, 48 кГц и т.д., а длина кадра составляет 10 мс, 30 мс, 40 мс и т.д. Настоящее изобретение не зависит от частоты дискретизации или длины кадра.In addition, although the embodiments described above exemplary cases in which the present invention is applied to technical requirements in which the sampling frequency is 16 kHz and the frame length is 20 ms, the present invention is not limited to this, and the present invention can be equally applied. other technical requirements in which the sampling frequency is 8 kHz, 24 kHz, 32 kHz, 44.1 kHz, 48 kHz, etc., and the frame length is 10 ms, 30 ms, 40 ms, etc. The present invention is independent of sample rate or frame length.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых конфигурация с четырьмя слоями используется в масштабируемом кодировании, настоящее изобретение не ограничено этим, и в равной степени можно использовать другие числа слоев, отличные от четырех. Настоящее изобретение не зависит от числа слоев.In addition, although the embodiments described above describe cases in which the four-layer configuration is used in scalable coding, the present invention is not limited to this, and other numbers of layers other than four can equally be used. The present invention is independent of the number of layers.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых импульсное кодирование используется для того, чтобы кодировать спектр сигнала возбуждения, настоящее изобретение не ограничено этим, и для того, чтобы кодировать спектр сигнала возбуждения, в равной степени можно использовать VQ, прогнозирующее VQ, раздельное VQ, многостадийное VQ, технологии расширения полосы частот, межканальное прогнозирующее декодирование и т.д. Настоящее изобретение не зависит от схем кодирования спектра.In addition, although the embodiments described above exemplary cases in which pulse coding is used to encode the spectrum of the excitation signal, the present invention is not limited to this, and in order to encode the spectrum of the excitation signal, predicting VQ can equally be used VQ, split VQ, multi-stage VQ, bandwidth extension technologies, inter-channel predictive decoding, etc. The present invention is independent of spectrum coding schemes.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонические сигналы кодируются, чтобы передавать кодированную информацию, настоящее изобретение не ограничено этим, и в равной степени можно сохранять кодированную информацию на носителе хранения данных. Например, хотя кодированная информация аудиосигналов зачастую сохраняется в запоминающем устройстве или на диске и используется, настоящее изобретение одинаково эффективно в этом случае. Настоящее изобретение не зависит от того, передается кодированная информация или хранится.In addition, although exemplary cases have been described in the embodiments above in which stereo signals are encoded to transmit encoded information, the present invention is not limited to this, and encoded information can equally be stored on a storage medium. For example, although encoded information of audio signals is often stored in a storage device or on a disk and used, the present invention is equally effective in this case. The present invention does not depend on whether encoded information is transmitted or stored.

Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонический сигнал формируется с помощью двух каналов, настоящее изобретение не ограничено этим, и в равной степени можно формировать стереофонический сигнал с помощью множества каналов, к примеру, каналов 5.1.In addition, although exemplary cases have been described in the embodiments above in which a stereo signal is generated using two channels, the present invention is not limited thereto, and a stereo signal can be generated equally using a plurality of channels, for example, 5.1 channels.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых кодирование выполняется с использованием только размера спектров M-сигнала и S-сигнала в качестве меры расстояния, настоящее изобретение не ограничено этим, и в равной степени можно выполнять кодирование с использованием разности фаз или энергетического отношения между M-сигналом и S-сигналом в качестве меры расстояния. Настоящее изобретение не зависит от меры расстояния, которую следует использовать при кодировании спектра.In addition, although the embodiments described above describe cases in which encoding is performed using only the size of the spectra of the M signal and S signal as a measure of distance, the present invention is not limited thereto, and encoding using a phase difference or energy ratio between the M-signal and the S-signal as a measure of distance. The present invention is independent of the distance measure that should be used when coding the spectrum.

Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых устройство декодирования стереофонических сигналов принимает и обрабатывает потоки битов, передаваемые от устройства кодирования стереофонических сигналов, настоящее изобретение не ограничено этим, и устройство декодирования стереофонических сигналов может принимать и обрабатывать потоки битов до тех пор, пока эти потоки битов передаются из устройства кодирования, которое может формировать потоки битов, которые могут обрабатываться в этом устройстве декодирования.In addition, although the embodiments described above describe cases in which a stereo signal decoding apparatus receives and processes bit streams transmitted from a stereo signal encoding apparatus, the present invention is not limited thereto, and a stereo signal decoding apparatus can receive and process bit streams until while these bitstreams are transmitted from an encoding device that can generate bitstreams that can be processed in this decoding device vania.

Кроме того, устройство кодирования стереофонических сигналов и устройство декодирования стереофонических сигналов согласно настоящему изобретению могут быть установлены на устройстве терминала связи и устройстве базовой станции в системе мобильной связи, так что можно предоставлять устройство терминала связи, устройство базовой станции и систему мобильной связи, имеющую функциональные эффекты, идентичные указанным выше.In addition, the stereo signal encoding device and stereo signal decoding device according to the present invention can be installed on the communication terminal device and the base station device in the mobile communication system, so that it is possible to provide the communication terminal device, the base station device and the mobile communication system having functional effects identical to the above.

Хотя в вышеприведенных вариантах осуществления описаны примерные случаи, в которых настоящее изобретение реализуется с помощью аппаратных средств, настоящее изобретение может быть реализовано с помощью программного обеспечения. Например, посредством описания алгоритма, согласно настоящему изобретению на языке программирования - сохранения этой программы в запоминающем устройстве и предписания модулю обработки информации выполнять эту программу можно реализовывать функцию, идентичную функции в устройстве кодирования стереофонических сигналов согласно настоящему изобретению.Although the above embodiments describe exemplary cases in which the present invention is implemented using hardware, the present invention can be implemented using software. For example, by describing the algorithm according to the present invention in a programming language — storing this program in a memory and instructing the information processing module to execute this program, it is possible to implement a function identical to that in the stereo signal encoding device according to the present invention.

Более того, каждый функциональный блок, используемый в пояснении каждого из вышеприведенных вариантов осуществления, типично может быть реализован как LSI, состоящая из интегральной схемы. Это могут быть отдельные микросхемы, либо они могут частично или полностью содержаться на одной микросхеме.Moreover, each function block used in the explanation of each of the above embodiments may typically be implemented as an LSI consisting of an integrated circuit. It can be separate microcircuits, or they can be partially or completely contained on one microcircuit.

В данном документе употребляется термин LSI, но она также может упоминаться как IC, "системная LSI", "супер-LSI" или "ультра-LSI", в зависимости от отличающейся степени интеграции.The term LSI is used throughout this document, but it may also be referred to as IC, “system LSI”, “super-LSI” or “ultra-LSI”, depending on the varying degree of integration.

Более того, способ интеграции микросхем не ограничен LSI, и реализация с помощью специализированных схем или процессора общего назначения также возможна. После изготовления LSI использование FPGA (программируемой пользователем вентильной матрицы) или реконфигурируемого процессора, где соединения или разъемы ячеек схемы в LSI могут быть переконфигурированы, также возможно.Moreover, the method of integrating microcircuits is not limited to LSI, and implementation using specialized circuits or a general-purpose processor is also possible. After manufacturing an LSI, the use of an FPGA (Field Programmable Gate Array) or reconfigurable processor where the connections or connectors of the circuit cells in LSI can be reconfigured is also possible.

Кроме того, если появится технология интегральных микросхем, чтобы заменять LSI, в результате усовершенствования полупроводниковой технологии или другой производной технологии, разумеется, также можно выполнять интеграцию функциональных блоков с помощью этой технологии. Применение биотехнологии также допускается.In addition, if integrated circuit technology appears to replace LSI, as a result of improvements in semiconductor technology or other derivative technology, it is of course also possible to integrate function blocks using this technology. The use of biotechnology is also allowed.

Раскрытия сущности заявки на патент (Япония) №2008-72497, поданной 19 марта 2008 года, и заявки на патент (Япония) №2008-274536, поданной 24 октября 2008 года, в том числе подробное описание, чертежи и реферат, полностью содержатся в данном документе по ссылке.Disclosure of the essence of patent application (Japan) No. 2008-72497, filed March 19, 2008, and patent application (Japan) No. 2008-274536, filed October 24, 2008, including a detailed description, drawings and abstract, are fully contained in this document by reference.

Промышленная применимостьIndustrial applicability

Настоящее изобретение является подходящим для использования, например, в устройстве кодирования, которое кодирует речевые сигналы и аудиосигналы, и в устройстве декодирования, которое декодирует кодированные сигналы.The present invention is suitable for use, for example, in an encoding device that encodes speech signals and audio signals, and in a decoding device that decodes encoded signals.

Claims

1. A device for encoding stereo signals, comprising:
- a module for calculating the sum and difference, which generates a monophonic signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and generates a side signal associated with the difference between the signal of the first channel and the signal of the second channel;
a mode information generating unit that generates mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and
coding modules of layers 1 through N, which perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information related to the monophonic signal, or perform stereo coding in the i-th layer using both information related to the monaural signal and information related to the side signal based on the mode information and provide encoded information of the i-th layer.

2. The stereo coding device according to claim 1, in which:
a mode information generating unit generates mode information from N bits indicating an encoding mode using each of the bits; and
the encoding module of the i-th layer performs monophonic encoding in the i-th layer or performs stereo coding in the i-th layer based on the value of the i-th bit of mode information.

3. The stereo signal encoding device according to claim 2, wherein the first layer encoding module comprises:
a monophonic coding module of the first layer, which, when the value of the first bit of mode information indicates monophonic coding, performs monophonic coding in the first layer using a monophonic signal and outputs coding distortion associated with the monophonic signal in the first layer and a side signal to the coding module of the second layer ; and
a stereo coding module of the first layer, which, when the value of the first bit of mode information indicates stereo coding, performs stereo coding in the first layer using both a monaural signal and a side signal and outputs coding distortion associated with the monaural signal in the first layer and distortion when encoding, associated with a side signal in the first layer, to the encoding module of the second layer.

4. The encoding device for stereo signals according to claim 3, in which the encoding module of the nth (n = 2, 3, ..., N-1) layer contains:
a monophonic encoding module of the nth layer, which, when the value of the nth bit of the mode information indicates monophonic encoding, performs monophonic encoding in the nth layer using information associated with the monophonic signal and outputs coding distortion associated with the monophonic signal in the nth layer, and the information associated with the side signal, taken as input from the (n-1) th layer, into the coding module of the (n + 1) th layer; and
a stereo coding unit of the nth layer, which, when the value of the nth bit of the mode information indicates stereo coding, performs stereo coding in the nth layer using both information related to the monaural signal and information related to the side signal, and outputs the coding distortion associated with the monophonic signal in the nth layer, and the coding distortion associated with the side signal in the nth layer to the coding module of the (n + 1) th layer.

5. The stereo signal encoding device according to claim 4, wherein the Nth layer encoding module comprises:
a monophonic coding module of the Nth layer, which, when the value of the Nth bit of mode information indicates monophonic coding, performs monophonic coding in the Nth layer using information associated with the monophonic signal; and a stereo coding unit of the Nth layer, which, when the value of the Nth bit of mode information indicates stereo coding, performs stereo coding in the Nth layer using both information related to the monaural signal and information associated with the side signal.

6. The stereo signal encoding device according to claim 5, in which the stereo encoding module of the i-th layer contains:
a first conversion module that converts information associated with the monophonic signal into the frequency domain and provides a first spectrum;
a second conversion module that converts information associated with the side signal into the frequency domain and provides a second spectrum;
an integration module that integrates the first spectrum and the second spectrum to provide an integrated spectrum; and a spectrum coding unit that performs spectrum coding with respect to the integrated spectrum.

7. The stereo signal encoding device according to claim 6, in which the integration module integrates the first spectrum and the second spectrum so that the spectra of the same frequency are adjacent to each other.

8. The stereo signal encoding device according to claim 6, wherein the integration module integrates the first spectrum and the second spectrum so that the first spectrum is adjacent before or after the second spectrum.

9. The stereo signal encoding device according to claim 1, wherein the mode information generating unit generates mode information to be applied to the (i + 1) th layer using a monaural signal and a side signal received as input in the encoding unit i th layer.

10. The stereo signal encoding device according to claim 9, in which the mode information generating unit calculates the power of the monaural signal and side signal received as input in the i-layer layer encoding unit, and generates mode information based on the relative relationship between the calculated powers.

11. A device for decoding stereo signals, comprising:
a receiving module that receives mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of monophonic encoding and stereo encoding is performed when encoding is processed in i- m layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) of the stereo signal encoding device, which performs encoding using the signal of the first channel and the signal of the second channel, forming x stereo signal;
first to Nth layer decoding modules that perform monophonic decoding or stereo decoding using encoded information of the i-th layer based on mode information and provide the result of decoding the monaural signal in the i-th layer and the result of decoding the side signal in the i-th layer wherein the monaural signal is associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and
a sum and difference calculator that calculates a decoded signal of the first channel and a decoded signal of the second channel using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.

12. A method for encoding stereo signals, comprising the steps of:
form a monaural signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and form a side signal associated with the difference between the signal of the first channel and the signal of the second channel;
generating mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and
perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using the information associated with the monophonic signal, or perform stereo coding in the i-th layer with both the information associated with the monophonic signal and the information associated with the side signal based on the mode information provide encoded information of the ith layer.

13. A method for decoding stereo signals, comprising the steps of:
receive mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of the monophonic encoding and stereo encoding is performed in the encoding processing in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) a stereo signal encoding device that performs encoding using the signal of the first channel and the signal of the second channel forming a stereo signal l;
perform monophonic decoding or stereo decoding using the encoded information of the i-th layer based on the mode information and provide the result of decoding the monophonic signal in the i-th layer and the result of decoding the side signal in the i-th layer, the monaural signal being associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and
the decoded signal of the first channel and the decoded signal of the second channel are calculated using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.