RU2484542C2 - Device for encoding stereophonic signals, device for decoding stereophonic signals and methods realised by said devices - Google Patents
Device for encoding stereophonic signals, device for decoding stereophonic signals and methods realised by said devices Download PDFInfo
- Publication number
- RU2484542C2 RU2484542C2 RU2010138572A RU2010138572A RU2484542C2 RU 2484542 C2 RU2484542 C2 RU 2484542C2 RU 2010138572 A RU2010138572 A RU 2010138572A RU 2010138572 A RU2010138572 A RU 2010138572A RU 2484542 C2 RU2484542 C2 RU 2484542C2
- Authority
- RU
- Russia
- Prior art keywords
- signal
- encoding
- layer
- stereo
- module
- Prior art date
Links
- 238000001228 spectrum Methods 0.000 claims description 164
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000005516 engineering process Methods 0.000 abstract description 7
- 230000000694 effects Effects 0.000 abstract description 3
- 239000000126 substance Substances 0.000 abstract 1
- 238000004364 calculation method Methods 0.000 description 27
- 241001442055 Vipera berus Species 0.000 description 24
- 238000010586 diagram Methods 0.000 description 20
- 230000002194 synthesizing Effects 0.000 description 14
- 230000015572 biosynthetic process Effects 0.000 description 8
- 230000003595 spectral Effects 0.000 description 8
- 238000003786 synthesis reaction Methods 0.000 description 8
- 230000003321 amplification Effects 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 5
- 238000000034 method Methods 0.000 description 5
- 238000010845 search algorithm Methods 0.000 description 5
- 230000000875 corresponding Effects 0.000 description 4
- 238000000354 decomposition reaction Methods 0.000 description 4
- 238000001914 filtration Methods 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 210000003702 immature single positive T cell Anatomy 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000007781 pre-processing Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000037242 Cmax Effects 0.000 description 1
- 241000382509 Vania Species 0.000 description 1
- 210000004027 cells Anatomy 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
Images
Abstract
Description
Область техники, к которой относится изобретениеFIELD OF THE INVENTION
Настоящее изобретение относится к устройству кодирования стереофонических сигналов, устройству декодирования стереофонических сигналов и способам кодирования и декодирования, которые используются для того, чтобы кодировать стереофоническую речь.The present invention relates to a stereo signal encoding apparatus, stereo signal decoding apparatus, and encoding and decoding methods that are used to encode stereo speech.
Предшествующий уровень техникиState of the art
В мобильной связи кодирование со сжатием для цифровой информации по речи и изображениям является важнейшим для эффективного использования полос частот передачи. В частности, с технологиями речевого кодека (кодирования и декодирования), широко используемыми в мобильных телефонах, связаны большие ожидания, и постоянно растет потребность в дополнительно повышенном качестве звука при традиционном высокоэффективном кодировании с высокой эффективностью сжатия.In mobile communications, compression coding for digital speech and image information is essential for the efficient use of transmission frequency bands. In particular, the technology of the speech codec (encoding and decoding), widely used in mobile phones, has high expectations, and the need for additionally increased sound quality is constantly growing with traditional high-performance encoding with high compression efficiency.
В последнее время с расширением полосы пропускания сетей связи возникает потребность в реализации и высоком качестве звука в речевой связи, и для того, чтобы удовлетворять этой потребности, разработаны системы речевой связи с использованием технологий кодирования стереофонической речи.Recently, with the expansion of the bandwidth of communication networks, a need arises for realizing high sound quality in voice communication, and in order to satisfy this need, voice communication systems using stereo coding technologies have been developed.
В качестве способа кодирования стереофонической речи предусмотрен известный традиционный способ обнаружения монофонического и бокового сигналов и кодирования этих сигналов, при этом монофонический сигнал - это сумма сигнала левого канала и сигнала правого канала, и при этом боковой сигнал - это разность между сигналом левого канала и сигналом правого канала (см. патентный документ 1).As a method of encoding stereophonic speech, a conventional conventional method for detecting monophonic and side signals and encoding these signals is provided, wherein the monophonic signal is the sum of the left channel signal and the right channel signal, and the side signal is the difference between the left channel signal and the right signal channel (see patent document 1).
Сигнал левого канала и сигнал правого канала представляют звук, который прослушивают левое и правое ухо человека, монофонический сигнал может представлять общие элементы между сигналом левого канала и сигналом правого канала, а боковой сигнал может представлять пространственную разность между сигналом левого канала и сигналом правого канала.The left channel signal and the right channel signal represent the sound that the human left and right ears listen to, the monaural signal can represent common elements between the left channel signal and the right channel signal, and the side signal can represent the spatial difference between the left channel signal and the right channel signal.
Имеется высокая корреляция между сигналом левого канала и сигналом правого канала. Следовательно, по сравнению со случаем, когда сигнал правого канала и сигнал левого канала кодируются непосредственно, можно выполнять более надлежащее кодирование в соответствии с признаками монофонического сигнала и бокового сигнала посредством преобразования сигнала правого канала и сигнала левого канала в монофонический и боковой сигнал и последующего кодирования этих преобразованных сигналов так, что можно реализовывать кодирование с меньшей избыточностью, низкой битовой скоростью (битрейтом) и высоким качеством.There is a high correlation between the left channel signal and the right channel signal. Therefore, compared with the case where the right channel signal and the left channel signal are directly encoded, more appropriate coding can be performed in accordance with the characteristics of the monophonic signal and the side signal by converting the right channel signal and the left channel signal into a monophonic and side signal and then encoding these converted signals so that it is possible to implement coding with less redundancy, low bit rate (bit rate) and high quality.
В последнее время стандартизация масштабируемого кодека, имеющего многослойную конфигурацию, изучается, например, в ITU-T (сектор стандартизации связи международного союза по телекоммуникациям) и MPEG (экспертная группа по киноизображению), и более эффективный и более высококачественный речевой кодек требуется.Recently, the standardization of a scalable codec having a multilayer configuration has been studied, for example, in ITU-T (the telecommunication standardization sector of the International Telecommunication Union) and MPEG (motion picture expert group), and a more efficient and higher-quality speech codec is required.
Например, масштабируемое устройство кодирования на основе ITU-T G.729.1 выполняет кодирование на основе рекомендации ITU-T G.729.1 на 8 кбит/с и посредством дополнительного кодирования улучшающего слоя может выполнять кодирование на двенадцати типах битрейтов, к примеру 8 кбит/с, 12 кбит/с, 14 кбит/с, 16 кбит/с, 18 кбит/с, 20 кбит/с, 22 кбит/с, 24 кбит/с, 26 кбит/с, 28 кбит/с, 30 кбит/с и 32 кбит/с. Эта масштабируемость реализуется посредством последовательного кодирования искажения при кодировании нижнего слоя в верхнем слое. Таким образом, масштабируемое устройство кодирования G.729.1 формируется с помощью одного базового слоя с битрейтом 8 кбит/с, одного улучшающего слоя с битрейтом 4 кбит/с и десяти улучшающих слоев с битрейтом 2 кбит/с.For example, a scalable encoding device based on ITU-T G.729.1 performs encoding based on ITU-T G.729.1 recommendation at 8 kbps and, through additional encoding of the enhancement layer, can perform encoding on twelve types of bitrates, for example 8 kbps, 12 kbps, 14 kbps, 16 kbps, 18 kbps, 20 kbps, 22 kbps, 24 kbps, 26 kbps, 28 kbps, 30 kbps and 32 kbps This scalability is realized by sequentially coding distortion when coding the lower layer in the upper layer. Thus, the scalable G.729.1 coding device is formed using one base layer with a bit rate of 8 kbps, one enhancement layer with a bitrate of 4 kbps and ten enhancement layers with a bitrate of 2 kbps.
Кроме того, в качестве технологии выполнения масштабируемого кодирования стереофонических сигналов предусмотрено устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2. Это устройство кодирования стереофонических сигналов выражает дополнительную информацию для каждого слоя посредством заранее определенного числа битов и с помощью заранее определенной вероятностной модели выполняет арифметическое кодирование битовых последовательностей в порядке от старшей битовой последовательности к младшей битовой последовательности. Здесь, данное устройство кодирования стереофонических сигналов имеет признак переключения между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодирования этих сигналов.In addition, as a technology for performing scalable encoding of stereo signals, a stereo signal encoding device is disclosed in
Патентный документ 1. Выложенная заявка на патент (Япония) номер 2001-255892
Патентный документ 2. Выложенная заявка на патент (Япония) номер HEI11-317672
Сущность изобретенияSUMMARY OF THE INVENTION
Проблемы, разрешаемые изобретениемProblems Resolved by the Invention
Тем не менее, как описано выше, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, выполнено с возможностью переключаться между сигналом левого канала и сигналом правого канала согласно заранее определенному правилу и кодировать эти сигналы, т.е. это кодирование не зависит от корреляции между сигналом левого канала и сигналом правого канала и от значимости информации. Кроме того, имеется проблема в том, что, хотя предпочтительно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования посредством пользовательских операций в устройстве кодирования стереофонических сигналов, которое выполняет масштабируемое кодирование, устройство кодирования стереофонических сигналов, раскрытое в патентном документе 2, не может поддерживать это задание.However, as described above, the stereo signal encoding apparatus disclosed in
Следовательно, цель настоящего изобретения заключается в том, чтобы предоставить устройство кодирования стереофонических сигналов, устройство декодирования стереофонических сигналов и способы кодирования и декодирования для выполнения масштабируемого кодирования на основе корреляции между сигналом левого канала и сигналом правого канала и значимости информации и для задания слоя для выполнения монофонического кодирования и слоя для выполнения стереофонического кодирования.Therefore, it is an object of the present invention to provide a stereo signal encoding apparatus, stereo signal decoding apparatus, and encoding and decoding methods for performing scalable encoding based on the correlation between the left channel signal and the right channel signal and the significance of the information and for defining a layer for performing monaural encoding and layer for performing stereo encoding.
Средство решения проблемыProblem Solver
Устройство кодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: модуль вычисления суммы и разности, который формирует монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала; модуль формирования информации режима, который формирует информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и модули кодирования слоев с первого по N-й, которые выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - это целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.The stereo signal encoding apparatus of the present invention uses a configuration having: a sum and difference calculation module that generates a monophonic signal associated with the sum of the first channel signal and the second channel signal forming the stereo signal and generates a side signal associated with the difference between the signal of the first channel and the signal of the second channel; a mode information generating unit that generates mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and coding modules of the first through Nth layers, which perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information related to monophonic signal, or perform stereo coding in the i-th layer using both information related to the monaural signal and information associated with the side signal based on the mode information and provide encoded information of the i-th layer.
Устройство декодирования стереофонических сигналов настоящего изобретения использует конфигурацию, имеющую: приемный модуль, который принимает информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; модули декодирования слоев с первого по N-й, которые выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и модуль вычисления суммы и разности, который вычисляет декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.The stereo signal decoding apparatus of the present invention uses a configuration having: a receiving module that receives mode information and encoded
Способ кодирования настоящего изобретения включает в себя этапы: формирования монофонического сигнала, связанного с суммой сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал, и формирования бокового сигнала, связанного с разностью между сигналом первого канала и сигналом второго канала; формирования информации режима в расчете на слой, указывающей режим кодирования одного из монофонического кодирования и стереофонического кодирования; и выполнения монофонического кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполнения стереофонического кодирования в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставления кодированной информации i-го слоя.The encoding method of the present invention includes the steps of: generating a monophonic signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and generating a side signal associated with the difference between the signal of the first channel and the signal of the second channel; generating mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and performing monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information associated with the monophonic signal, or performing stereo coding in the i-th layer with using both information related to the monophonic signal and information related to the side signal based on the mode information and providing encoded information of the i-th layer.
Способ декодирования настоящего изобретения включает в себя этапы: приема информации режима и кодированной информации слоев с первого по N-й, обнаруживаемой посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, формирующих стереофонический сигнал; выполнения монофонического декодирования или стереофонического декодирования с использованием кодированной информации i-го слоя на основе информации режима и предоставления результата декодирования монофонического сигнала в i-м слое и результата декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и вычисления декодированного сигнала первого канала и декодированного сигнала второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.The decoding method of the present invention includes the steps of: receiving mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of the monophonic encoding and stereo encoding is performed when encoding processing in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) of the stereo signal encoding device, which performs encoding using the signal of the first the signal and the second channel signal forming a stereo signal; performing monophonic decoding or stereo decoding using the encoded information of the i-th layer based on the mode information and providing the result of decoding the monophonic signal in the i-th layer and the result of decoding the side signal in the i-th layer, the monaural signal being associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and computing a decoded signal of the first channel and a decoded signal of the second channel using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.
Преимущества изобретенияAdvantages of the Invention
Согласно настоящему изобретению, посредством выполнения масштабируемого кодирования монофонического сигнала (M-сигнала) и бокового сигнала (S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, и задания режима кодирования для каждого слоя в масштабируемом кодировании на основе информации режима можно выполнять масштабируемое кодирование, согласно корреляции между сигналом левого канала и сигналом правого канала и на основе значимости информации. Кроме того, согласно настоящему изобретению, можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования, так что можно повышать степень свободы в управлении точностью кодирования.According to the present invention, by performing scalable encoding of a monaural signal (M signal) and side signal (S signal) calculated from the L signal and the R signal of the stereo signal, and setting the encoding mode for each layer in scalable encoding based on the mode information scalable coding can be performed according to the correlation between the left channel signal and the right channel signal and based on the significance of the information. Furthermore, according to the present invention, it is possible to define a layer for performing monophonic encoding and a layer for performing stereo encoding, so that the degree of freedom in controlling the accuracy of encoding can be increased.
Краткое описание чертежейBrief Description of the Drawings
Фиг.1 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;1 is a block diagram showing the main components of a stereo signal encoding apparatus according to
Фиг.2 является блок-схемой, показывающей основные компоненты в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;FIG. 2 is a block diagram showing main components in a base layer encoding module according to
Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;FIG. 3 illustrates operations in the case where a monaural encoding mode is set in a base layer encoding module according to
Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле кодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;4 illustrates operations in the case where a stereo coding mode is set in a base layer coding unit according to
Фиг.5 является блок-схемой, показывающей основные компоненты в модуле монофонического кодирования согласно варианту осуществления 1 настоящего изобретения;5 is a block diagram showing the main components in a monophonic coding module according to
Фиг.6 является блок-схемой последовательности операций способа, показывающей алгоритм поиска в модуле зонального поиска согласно варианту осуществления 1 настоящего изобретения;6 is a flowchart showing a search algorithm in a zone search module according to
Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска, согласно варианту осуществления 1 настоящего изобретения;7 shows an example of a spectrum represented by pulses that are searched in the zone search module according to
Фиг.8 является блок-схемой последовательности операций способа, показывающей предварительную обработку алгоритма поиска в модуле полного поиска согласно варианту осуществления 1 настоящего изобретения;FIG. 8 is a flowchart showing preprocessing a search algorithm in a full search module according to
Фиг.9 является блок-схемой последовательности операций способа, показывающей поиск посредством алгоритма поиска модуля полного поиска согласно варианту осуществления 1 настоящего изобретения;FIG. 9 is a flowchart showing a search by the search algorithm of the full search module according to
Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле зонального поиска и модуле полного поиска, согласно варианту осуществления 1 настоящего изобретения;10 illustrates an example of a spectrum represented by pulses that are searched in the zone search module and the full search module according to
Фиг.11 является блок-схемой, показывающей основные компоненты в модуле монофонического декодирования согласно варианту осуществления 1 настоящего изобретения;11 is a block diagram showing main components in a monaural decoding module according to
Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля декодирования спектра согласно варианту осуществления 1 настоящего изобретения;12 is a flowchart showing a decoding algorithm of a spectrum decoding module according to
Фиг.13 является блок-схемой, показывающей основные компоненты в модуле стереофонического кодирования согласно варианту осуществления 1 настоящего изобретения;13 is a block diagram showing main components in a stereo coding unit according to
Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле интегрирования согласно варианту осуществления 1 настоящего изобретения;Fig. 14 illustrates a state where an M-signal spectrum and an S-signal spectrum are integrated in an integration module according to
Фиг.15 иллюстрирует выделение битов в модуле кодирования спектра согласно варианту осуществления 1 настоящего изобретения;Fig. 15 illustrates bit allocation in a spectrum encoding module according to
Фиг.16 является блок-схемой, показывающей основные компоненты в модуле стереофонического декодирования согласно варианту осуществления 1 настоящего изобретения;16 is a block diagram showing main components in a stereo decoding module according to
Фиг.17 является блок-схемой, показывающей основные компоненты устройства декодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения;17 is a block diagram showing the main components of a stereo signal decoding apparatus according to
Фиг.18 является блок-схемой, показывающей основные компоненты в модуле декодирования базового слоя согласно варианту осуществления 1 настоящего изобретения;Fig. 18 is a block diagram showing main components in a base layer decoding module according to
Фиг.19 является блок-схемой, показывающей основные компоненты в модуле декодирования второго улучшающего слоя согласно варианту осуществления 1 настоящего изобретения; иFig is a block diagram showing the main components in the decoding module of the second enhancement layer according to a
Фиг.20 является блок-схемой, показывающей основные компоненты устройства кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения.20 is a block diagram showing the main components of a stereo signal encoding apparatus according to
Оптимальный режим осуществления изобретенияThe optimal mode of carrying out the invention
Далее подробно пояснены варианты осуществления настоящего изобретения со ссылкой на прилагаемые чертежи.Embodiments of the present invention are explained in detail below with reference to the accompanying drawings.
Первый вариант осуществленияFirst Embodiment
Фиг.1 является блок-схемой, показывающей основные компоненты устройства 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения. Описывается примерный случай, в котором устройство 100 кодирования стереофонических сигналов согласно варианту осуществления 1 настоящего изобретения предоставляет один базовый слой и три улучшающих слоя. Далее поясняется примерный случай, в котором стереофонический сигнал состоит из сигнала левого канала (в дальнейшем "L-сигнала") и сигнала правого канала (в дальнейшем "R-сигнала").1 is a block diagram showing the main components of a stereo signal encoding apparatus 100 according to
На фиг.1 устройство 100 кодирования стереофонических сигналов содержит модуль 101 вычисления суммы и разности, модуль 102 задания режима, модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя, модуль 106 кодирования третьего улучшающего слоя и модуль 107 мультиплексирования.1, a stereo signal encoding apparatus 100 comprises a sum and difference calculator 101, a mode setting module 102, a base
Модуль 101 вычисления суммы и разности вычисляет суммарный сигнал (т.е. монофонический сигнал, в дальнейшем "M-сигнал") и разностный сигнал (т.е. боковой сигнал, в дальнейшем "S-сигнал") с помощью L-сигнала и R-сигнала согласно следующим уравнениям 1 и 2 и выводит результаты в модуль 103 кодирования базового слоя. Здесь, L-сигнал и R-сигнал представляют звук, который прослушивают левое и правое ухо человека, M-сигнал может представлять общие элементы между L-сигналом и R-сигналом, а S-сигнал может представлять пространственную разность между L-сигналом и R-сигналом.The sum and difference calculating unit 101 calculates a sum signal (ie, a monophonic signal, hereinafter “M-signal”) and a difference signal (ie, side signal, hereinafter “S-signal”) using the L signal and R-signal according to the following
Mi=Li+Ri … (уравнение 1)M i = L i + R i ... (equation 1)
Si=Li-Ri … (уравнение 2)S i = L i -R i ... (equation 2)
В уравнениях 1 и 2 нижний индекс "i" представляет номер выборки каждого сигнала, но сигналы могут представляться без "i".In
Например, Mi-сигнал может быть записан просто как M-сигнал.For example, an M i signal may be recorded simply as an M signal.
Информация режима для задания режима кодирования в модулях кодирования из модуля 103 кодирования базового слоя, модуля 104 кодирования первого улучшающего слоя, модуля 105 кодирования второго улучшающего слоя и модуля 106 кодирования третьего улучшающего слоя принимается в качестве ввода в модуле 102 задания режима посредством пользовательских операций и затем выводится в эти модули кодирования и модуль 107 мультиплексирования. Здесь, пользовательские операции включают в себя ввод с клавиатуры, DIP-переключателя и кнопки и загрузку с PC (персонального компьютера) и т.д.The mode information for setting the encoding mode in the encoding units from the base
Режим кодирования в каждом модуле кодирования соответствует режиму монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Здесь, "информация M-сигнала" типично относится к самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, "информация S-сигнала" типично относится к самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.The encoding mode in each encoding module corresponds to a monaural encoding mode for encoding only M-signal information or a stereo encoding mode for encoding both M-signal information and S-signal information. Here, “M-signal information” typically refers to the M-signal itself or coding distortion associated with the M-signal in each layer. In addition, “S-signal information” typically refers to the S-signal itself or coding distortion associated with the S-signal in each layer.
Далее, режим кодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического кодирования, а значение "1" представляет режим стереофонического кодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы кодирования в модуле 103 кодирования базового слоя, модуле 104 кодирования первого улучшающего слоя, модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя.Further, the encoding mode in each layer is shown using each of the bits of the mode information. Thus, in bits, the value “0” represents the monaural encoding mode, and the value “1” represents the stereo encoding mode. More specifically, for example, each of the four bits of mode information is used to sequentially represent encoding modes in the base
Например, информация четырехбитового режима "0000" означает, что монофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал с максимальным качеством. Кроме того, например, информация режима "0011" означает, что режимом кодирования в модуле 103 кодирования базового слоя и модуле 104 кодирования первого улучшающего слоя является режим монофонического кодирования, а режимом кодирования в модуле 105 кодирования второго улучшающего слоя и модуле 106 кодирования третьего улучшающего слоя является режим стереофонического кодирования. Кроме того, например, информация режима "1111" означает, что стереофоническое кодирование выполняется во всех слоях. В этом случае устройство 100 кодирования стереофонических сигналов может кодировать M-сигнал и S-сигнал с равным взвешиванием. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов кодирования в четырех модулях кодирования.For example, the four-bit mode information “0000” means that monophonic coding is performed in all layers. In this case, the stereo signal encoding apparatus 100 can encode the M signal with maximum quality. In addition, for example, the “0011” mode information means that the encoding mode in the base
В настоящем варианте осуществления информация режима, выводимая из модуля 102 задания режима, принимается в каждом модуле кодирования и модуле 107 мультиплексирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль кодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим кодирования, и задает режим кодирования. Таким образом, в четырех битах входной информации режима модуль 103 кодирования базового слоя проверяет первый бит, модуль 104 кодирования первого улучшающего слоя проверяет второй бит, модуль 105 кодирования второго улучшающего слоя проверяет третий бит, а модуль 106 кодирования третьего улучшающего слоя проверяет четвертый бит.In the present embodiment, the mode information output from the mode setting unit 102 is received in each coding unit and the multiplexing unit 107 as identical input information of the four-bit mode. Additionally, each encoding module checks only one bit of the four input bits required to set the encoding mode, and sets the encoding mode. Thus, in four bits of mode input information, the base
Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле кодирования, модуль 102 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим кодирования в каждом модуле кодирования, и выводить один бит в каждый модуль кодирования. Таким образом, в информации четырехбитового режима, модуль 102 задания режима может вводить только первый бит в модуле 103 кодирования базового слоя, только второй бит в модуле 104 кодирования первого улучшающего слоя, только третий бит в модуле 105 кодирования второго улучшающего слоя и только четвертый бит в модуле 106 кодирования третьего улучшающего слоя.However, instead of entering identical four-bit mode information in each encoding unit, the mode setting module 102 can pre-sort one bit required to set the encoding mode in each encoding unit and output one bit to each encoding unit. Thus, in the four-bit mode information, the mode setting module 102 can enter only the first bit in the base
Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 102 задания режима в модуль 107 мультиплексирования, упоминается как информация четырехбитового режима.In addition, in any of the above cases, the mode information received as input from the mode setting unit 102 to the multiplexing unit 107 is referred to as four-bit mode information.
В модуле 103 кодирования базового слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует только M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит и выводит искажение при кодировании базового слоя M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Напротив, после задания режима стереофонического кодирования в модуле 103 кодирования базового слоя модуль 103 кодирования базового слоя кодирует как M-сигнал, так и S-сигнал, принимаемые в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию базового слоя. Дополнительно, модуль 103 кодирования базового слоя находит искажения при кодировании базового слоя M- и S-сигналов, принимаемых в качестве ввода из модуля 101 вычисления суммы и разности, и выводит результаты в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое и информацию S-сигнала в базовом слое. Кроме того, модуль 103 кодирования базового слоя подробнее поясняется ниже.In the base
В модуле 104 кодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует информацию M-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое, принимаемой в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и выводит информацию S-сигнала в базовом слое, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, как есть в модуль 105 кодирования второго улучшающего слоя как информацию S-сигнала в первом улучшающем слое.In the encoding module 104 of the first enhancement layer, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting module 102. After setting the monophonic encoding mode in the encoding module 104 of the first enhancement layer, the encoding module 104 of the first enhancement layer encodes the M-signal information in the base layer received as input from the base
В отличие от этого, после задания режима стереофонического кодирования в модуле 104 кодирования первого улучшающего слоя модуль 104 кодирования первого улучшающего слоя кодирует как информацию M-сигнала в базовом слое, так и информацию S-сигнала в базовом слое, принимаемые в качестве ввода из модуля 103 кодирования базового слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию первого улучшающего слоя. Дополнительно, с помощью информации M-сигнала в базовом слое и информации S-сигнала в базовом слое, принимаемых в качестве ввода из модуля 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя находит и выводит искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами, в модуль 105 кодирования второго улучшающего слоя как информацию M-сигнала в первом улучшающем слое и информацию S-сигнала в первом улучшающем слое. Кроме того, модуль 104 кодирования первого улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 104 of the first enhancement layer, the encoding module 104 of the first enhancement layer encodes both the M-signal information in the base layer and the S-signal information in the base layer received as input from
В модуле 105 кодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует информацию M-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое, принимаемой в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и выводит информацию S-сигнала в первом улучшающем слое, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, как есть в модуль 106 кодирования третьего улучшающего слоя как информацию S-сигнала во втором улучшающем слое.In the encoding unit 105 of the second enhancement layer, the monaural encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting unit 102. After setting the monophonic encoding mode in the encoding module 105 of the second enhancement layer, the encoding module 105 of the second enhancement layer encodes the M signal information in the first enhancement layer received as input from the encoding module 104 of the first enhancement layer and outputs the resulting monophonic encoded information to the multiplexing module 107 as encoded information of the second enhancement layer. Additionally, using the information of the M signal in the first enhancement layer received as input from the encoding module 104 of the first enhancement layer, the encoding module 105 of the second enhancement layer finds and outputs distortion when encoding the second enhancement layer associated with the M signal to module 106 encoding the third enhancement layer as M-signal information in the second enhancement layer and outputs the S-signal information in the first enhancement layer, taken as input from the encoding module 104 of the first enhancement layer, as is the fashion s 106 of the third enhancement layer coding information as the S-signal in the second enhancement layer.
В отличие от этого, после задания режима стереофонического кодирования в модуле 105 кодирования второго улучшающего слоя модуль 105 кодирования второго улучшающего слоя кодирует как информацию M-сигнала в первом улучшающем слое, так и информацию S-сигнала в первом улучшающем слое, принимаемые в качестве ввода из модуля 104 кодирования первого улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию второго улучшающего слоя. Дополнительно, с помощью информации M-сигнала в первом улучшающем слое и информации S-сигнала в первом улучшающем слое, принимаемых в качестве ввода из модуля 104 кодирования первого улучшающего слоя, модуль 105 кодирования второго улучшающего слоя находит и выводит искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами, в модуль 106 кодирования третьего улучшающего слоя как информацию M-сигнала во втором улучшающем слое и информацию S-сигнала во втором улучшающем слое. Кроме того, модуль 105 кодирования второго улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 105 of the second enhancement layer, the encoding module 105 of the second enhancement layer encodes both the M-signal information in the first enhancement layer and the S-signal information in the first enhancement layer, taken as input from a coding unit 104 of the first enhancement layer, and outputs the resulting stereo encoded information to the multiplexing unit 107 as encoded information of the second enhancement layer. Further, by using the M signal information in the first enhancement layer and the S signal information in the first enhancement layer, taken as input from the encoding module 104 of the first enhancement layer, the encoding module 105 of the second enhancement layer finds and outputs distortion when encoding the second enhancement layer, associated with the M and S signals, to the encoding module 106 of the third enhancement layer as the M signal information in the second enhancement layer and the S signal information in the second enhancement layer. In addition, the encoding module 105 of the second enhancement layer is explained in more detail below.
В модуле 106 кодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 102 задания режима. После задания режима монофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует информацию M-сигнала во втором улучшающем слое, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую монофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя.In the encoding module 106 of the third enhancement layer, the monophonic encoding mode or the stereo encoding mode are set based on the mode information received as input from the mode setting module 102. After setting the monophonic coding mode in the encoding module 106 of the third enhancement layer, the encoding module 106 of the third enhancement layer encodes the M-signal information in the second enhancement layer received as input from the encoding module 105 of the second enhancement layer and outputs the resulting monophonic encoded information to the multiplexing module 107 as encoded information of the third enhancement layer.
В отличие от этого, после задания режима стереофонического кодирования в модуле 106 кодирования третьего улучшающего слоя модуль 106 кодирования третьего улучшающего слоя кодирует как информацию M-сигнала во втором улучшающем слое, так и информацию S-сигнала во втором улучшающем слое, принимаемые в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и выводит результирующую стереофоническую кодированную информацию в модуль 107 мультиплексирования как кодированную информацию третьего улучшающего слоя. Кроме того, модуль 106 кодирования третьего улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo coding mode in the encoding module 106 of the third enhancement layer, the encoding module 106 of the third enhancement layer encodes both the M signal information in the second enhancement layer and the S signal information in the second enhancement layer, taken as input from a second enhancement layer encoding unit 105, and outputs the resulting stereo encoded information to the multiplexing unit 107 as encoded information of the third enhancement layer. In addition, the encoding module 106 of the third enhancement layer is explained in more detail below.
Модуль 107 мультиплексирования мультиплексирует информацию режима, принимаемую в качестве ввода из модуля 102 задания режима, кодированную информацию базового слоя, принимаемую в качестве ввода из модуля 103 кодирования базового слоя, кодированную информацию первого улучшающего слоя, принимаемую в качестве ввода из модуля 104 кодирования первого улучшающего слоя, кодированную информацию второго улучшающего слоя, принимаемую в качестве ввода из модуля 105 кодирования второго улучшающего слоя, и кодированную информацию третьего улучшающего слоя, принимаемую в качестве ввода из модуля 106 кодирования третьего улучшающего слоя, и формирует потоки битов, которые должны быть переданы в устройство декодирования стереофонических сигналов.The multiplexing unit 107 multiplexes the mode information received as input from the mode setting unit 102, the encoded base layer information received as an input from the base
В устройстве 100 кодирования стереофонических сигналов модуль 103 кодирования базового слоя, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя имеют идентичную конфигурацию и, следовательно, выполняют в основном идентичные операции, а отличаются друг от друга только своими входными сигналами и выходными сигналами. Модуль 106 кодирования третьего улучшающего слоя не требует конфигурации для нахождения искажения при кодировании и, следовательно, отличается от вышеуказанных трех модулей кодирования в части конфигурации. Таким образом, модуль 106 кодирования третьего улучшающего слоя использует конфигурацию с исключением модуля 303 монофонического декодирования, модуля 306 стереофонического декодирования, переключателя 307, сумматора 308, сумматора 309 и переключателя 310 из конфигурации, показанной на фиг.2. Что касается вышеуказанных трех модулей кодирования, имеющих идентичную конфигурацию, например модуль 103 кодирования базового слоя принимает в качестве ввода M-сигнал и S-сигнал; при выполнении монофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и сам S-сигнал как информацию S-сигнала; и при выполнении стереофонического кодирования выводит в модуль 104 кодирования первого улучшающего слоя искажение при кодировании базового слоя M-сигнала как информацию M-сигнала и искажение при кодировании базового слоя S-сигнала как информацию S-сигнала.In the stereo signal encoding apparatus 100, the base
Кроме того, модуль 104 кодирования первого улучшающего слоя и модуль 105 кодирования второго улучшающего слоя: принимают в качестве ввода информацию M-сигнала в предыдущем слое и информацию S-сигнала в доступном слое; при выполнении монофонического кодирования выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и саму информацию S-сигнала в предыдущем слое; и, при выполнении стереофонического кодирования, выводят в модуль кодирования в последующем слое искажение при кодировании, обнаруживаемое посредством дополнительного кодирования информации M-сигнала в предыдущем слое, и искажение при кодировании, обнаруживаемое посредством дополнительного кодирования S-сигнала в предыдущем слое. Далее, конфигурации и операции вышеуказанных модулей кодирования поясняются с использованием модуля 103 кодирования базового слоя в качестве примера.In addition, the encoding module 104 of the first enhancement layer and the encoding module 105 of the second enhancement layer: take as input the M-signal information in the previous layer and the S-signal information in the available layer; when performing monophonic coding, the coding distortion detected by additionally encoding the M-signal information in the previous layer and the S-signal information itself in the previous layer are output to the coding module in the subsequent layer; and when stereo coding is performed, coding distortion detected by additional encoding of the M-signal information in the previous layer and coding distortion detected by additional encoding of the S-signal in the previous layer are output to the encoding module in the subsequent layer. Further, the configurations and operations of the above encoding modules are explained using the base
Фиг.2 является блок-схемой, показывающей основные компоненты в модуле 103 кодирования базового слоя.2 is a block diagram showing the main components in the base
На фиг.2 модуль 103 кодирования базового слоя содержит переключатель 301, модуль 302 монофонического кодирования, модуль 303 монофонического декодирования, переключатель 304, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования, переключатель 307, сумматор 308, сумматор 309, переключатель 310 и переключатель 311.2, the base
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 301 выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 302 монофонического кодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит M-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the
Модуль 302 монофонического кодирования выполняет кодирование (т.е. монофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и выводит результирующую монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311. Кроме того, модуль 302 монофонического кодирования подробнее поясняется ниже.The
Модуль 303 монофонического декодирования декодирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, и выводит результирующий декодированный сигнал (т.е. монофонический декодированный M-сигнал) в переключатель 307. Кроме того, модуль 303 монофонического декодирования подробнее поясняется ниже.
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 304 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, в модуль 305 стереофонического кодирования.If the value of the first bit of the mode information received as input from the mode setting module 102 is “1”, the
Модуль 305 стереофонического кодирования выполняет кодирование (т.е. стереофоническое кодирование) с помощью M-сигнала, принимаемого в качестве ввода из переключателя 301, и S-сигнала, принимаемого в качестве ввода из переключателя 304, и выводит результирующую стереофоническую кодированную информацию в модуль 306 стереофонического декодирования и переключатель 311. Кроме того, модуль 305 стереофонического кодирования подробнее поясняется ниже.The
Модуль 306 стереофонического декодирования декодирует стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, и выводит два результирующих декодированных сигнала, т.е. стереофонический декодированный M-сигнал и стереофонический декодированный S-сигнал, в переключатель 307 и сумматор 309, соответственно.The
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 307 выводит монофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 303 монофонического декодирования, в сумматор 308, или если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", выводит стереофонический декодированный M-сигнал, принимаемый в качестве ввода из модуля 306 стереофонического декодирования, в сумматор 308.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the
Сумматор 308 вычисляет разность между M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и одним из монофонического декодированного M-сигнала и стереофонического декодированного M-сигнала, принимаемого в качестве ввода из переключателя 307, как искажение при кодировании базового слоя M-сигнала. Дополнительно, сумматор 308 выводит это искажение при кодировании базового слоя M-сигнала в модуль 104 кодирования первого улучшающего слоя как информацию M-сигнала в базовом слое.An
Сумматор 309 вычисляет разность между S-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, и стереофоническим декодированным S-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, как искажение при кодировании базового слоя S-сигнала. Дополнительно, сумматор 309 выводит это искажение при кодировании базового слоя S-сигнала в переключатель 310.An
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя как информацию S-сигнала в базовом слое.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "0", переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима, равно "1", переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.If the value of the first bit of the mode information received as input from the mode setting module 102 is “0”, the
Фиг.3 иллюстрирует операции в случае, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "0" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.FIG. 3 illustrates operations in the case where the monaural encoding mode is set in the base
Как показано на фиг.3, когда режим монофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 не работают, а модуль 302 монофонического кодирования и модуль 303 монофонического декодирования работают. Кроме того, сумматор 308 находит остаточный сигнал между монофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 303 монофонического декодирования через переключатель 307, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит S-сигнал, принимаемый в качестве ввода из модуля 101 вычисления суммы и разности, как есть в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.As shown in FIG. 3, when the monaural encoding mode is set in the base
Фиг.4 иллюстрирует операции в случае, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя на основе значения "1" первого бита информации режима, принимаемой в качестве ввода из модуля 102 задания режима.FIG. 4 illustrates operations in the case where the stereo coding mode is set in the base
Как показано на фиг.4, когда режим стереофонического кодирования задается в модуле 103 кодирования базового слоя, модуль 302 монофонического кодирования и модуль 303 монофонического декодирования не работают, а модуль 305 стереофонического кодирования, модуль 306 стереофонического декодирования и сумматор 309 работают. Кроме того, сумматор 308 находит остаточный сигнал между стереофоническим декодированным M-сигналом, принимаемым в качестве ввода из модуля 306 стереофонического декодирования, и M-сигналом, принимаемым в качестве ввода из модуля 101 вычисления суммы и разности, как искажение при кодировании базового слоя M-сигнала. Кроме того, переключатель 310 выводит искажение при кодировании базового слоя S-сигнала, принимаемого в качестве ввода из сумматора 309, в модуль 104 кодирования первого улучшающего слоя. Переключатель 311 выводит стереофоническую кодированную информацию, принимаемую в качестве ввода из модуля 305 стереофонического кодирования, в модуль 107 мультиплексирования как кодированную информацию базового слоя.As shown in FIG. 4, when the stereo coding mode is set in the base
Фиг.5 является блок-схемой, показывающей основные компоненты в модуле 302 монофонического кодирования.5 is a block diagram showing the main components in
На фиг.5 модуль 302 монофонического кодирования содержит модуль 321 анализа LPC (коэффициентов линейного прогнозирования), модуль 322 LPC-квантования, модуль 323 LPC-деквантования, обратный (инверсный) фильтр 324, модуль 325 MDCT (модифицированного дискретного косинусного преобразования), модуль 326 кодирования спектра и модуль 327 мультиплексирования. Модуль 326 кодирования спектра включает в себя модуль 111 квантования по форме и модуль 112 квантования по усилению, а модуль 111 квантования по форме включает в себя модуль 121 зонального поиска и модуль 122 полного поиска.5, the
Модуль 321 LPC-анализа выполняет анализ с линейным прогнозированием с использованием M-сигнала, принимаемого в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, и предоставляет и выводит LPC-параметры (т.е. параметры линейного прогнозирования), указывающие структуру спектра M-сигнала, в модуль 322 LPC-квантования.
Модуль 322 LPC-квантования преобразует параметры линейного прогнозирования, принимаемые в качестве ввода из модуля 321 LPC-анализа, в параметры с хорошей комплементарностью, такие как LSP (пары спектральных линий или пары спектральных линий) и ISP (пары спектральных иммитансов), и квантует преобразованные параметры посредством такого способа квантования, как VQ (векторное квантование), прогнозирующее VQ, многостадийное VQ и раздельное VQ. Модуль 322 LPC-квантования выводит LPC-квантованные данные, полученные посредством квантования, в модуль 323 LPC-деквантования и модуль 327 мультиплексирования.
Модуль 323 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 322 LPC-квантования, и дополнительно инвертирует результирующие параметры, такие как LSP и ISP, в LPC-параметры.
Обратный фильтр 324 применяет обратную фильтрацию к M-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности через переключатель 301, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323 LPC-деквантования, и выводит в MDCT-модуль 325 фильтрованный M-сигнал, в котором конкретная для спектра структура удаляется и изменяется на плоскую форму. Здесь, функция обратного фильтра 324 представляется посредством следующего уравнения 3.The
[1][one]
… (уравнение 3) ... (equation 3)
В уравнении 3 нижний индекс i представляет номер выборки каждого сигнала, xi представляет входной сигнал обратного фильтра 324, а yi представляет выходной сигнал обратного фильтра 324. Кроме того, αi представляет LPC-параметры, квантованные и деквантованные в модуле 322 LPC-квантования и модуле 323 LPC-деквантования, а J представляет порядок линейного прогнозирования.In
MDCT-модуль 325 выполняет MDCT M-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 324, и преобразует M-сигнал временной области в спектр M-сигнала частотной области. Кроме того, вместо MDCT в равной степени можно использовать FFT (быстрое преобразование Фурье). MDCT-модуль 325 выводит спектр M-сигнала, полученный посредством MDCT, в модуль 326 кодирования спектра.The
Модуль 326 кодирования спектра принимает спектр M-сигнала в качестве ввода из MDCT-модуля 325, квантует спектральную форму и усиление входного спектра отдельно и выводит результирующий импульсный код и код усиления в модуль 327 мультиплексирования. Модуль 111 квантования по форме квантует форму входного спектра в позициях и полярностях небольшого числа импульсов, и модуль 112 квантования по усилению вычисляет и квантует усиления импульсов, для которых выполняется поиск в модуле 111 квантования по форме, на основе каждой полосы частот. Модуль 326 кодирования спектра выводит импульсный код, указывающий позиции и полярности искомых импульсов, и код усиления, представляющий усиление искомых импульсов, в модуль 327 мультиплексирования. Кроме того, модуль 111 квантования по форме и модуль 112 квантования по усилению подробнее поясняются ниже.The
Модуль 327 мультиплексирования предоставляет монофоническую кодированную информацию посредством мультиплексирования LPC-квантованных данных, принимаемых в качестве ввода из модуля 322 LPC-квантования, и импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 326 кодирования спектра, и выводит монофоническую кодированную информацию в модуль 303 монофонического декодирования и переключатель 311.The
Далее подробнее поясняются модуль 111 квантования по форме и модуль 112 квантования по усилению. Модуль 111 квантования по форме включает в себя модуль 121 зонального поиска, который выполняет поиск импульсов в каждой из множества из полос частот, на которые заранее определенная зона поиска разделяется, и модуль 122 полного поиска, который выполняет поиск импульсов по всей зоне поиска.Next, a
Следующее уравнение 4 предоставляет исходную точку поиска. Здесь, в уравнении 4, E представляет искажение при кодировании, si представляет входной спектр, g представляет оптимальное усиление, δ - это дельта-функция, а p представляет позицию импульса.The
[2][2]
… (уравнение 4) ... (equation 4)
Из вышеприведенного уравнения 4 позицией импульса для того, чтобы минимизировать функцию затрат, является позиция, в которой абсолютное значение |sp| входного спектра в каждой полосе частот является максимальным, а полярность имеет значение входного спектра в этой позиции импульса.From
Ниже поясняется примерный случай, в котором длина вектора входного спектра составляет восемьдесят выборок, число полос частот составляет пять, и спектр кодируется с помощью всего восьми импульсов, состоящих из одного импульса в расчете на полосу частот и трех импульсов во всей зоне. В этом случае длина каждой полосы частот составляет шестнадцать выборок. Дополнительно, амплитуда импульсов, для которых следует выполнять поиск, задается фиксированно равной "1", а их полярность является "+" или "-".The following illustrates an exemplary case in which the input spectrum vector is eighty samples long, the number of frequency bands is five, and the spectrum is encoded using a total of eight pulses consisting of a single pulse per frequency band and three pulses in the entire zone. In this case, the length of each frequency band is sixteen samples. Additionally, the amplitude of the pulses for which to search is fixedly set to "1", and their polarity is "+" or "-".
Модуль 121 зонального поиска выполняет поиск позиции максимальной энергии и ее полярности (+/-) в каждой полосе частот и дает возможность появляться одному импульсу в расчете на полосу частот. В этом примере число полос частот пять, и каждая полоса частот требует четырех битов, чтобы показывать позицию импульса (записи позиций: 16), и один бит, чтобы показывать полярность (+/-), требуя всего 25 информационных битов.The zonal search module 121 searches for the position of the maximum energy and its polarity (+/-) in each frequency band and allows one pulse to appear per frequency band. In this example, the number of frequency bands is five, and each frequency band requires four bits to indicate the position of the pulse (record positions: 16), and one bit to indicate polarity (+/-), requiring a total of 25 information bits.
Последовательность операций алгоритма поиска модуля 121 зонального поиска показана на фиг.6. Здесь, символы, используемые на блок-схеме последовательности операций способа фиг.6, означают следующее:The sequence of operations of the search algorithm module 121 zone search shown in Fig.6. Here, the symbols used in the flowchart of FIG. 6 mean the following:
i: позицияi: position
b: номер полосы частотb: frequency band number
max: максимальное значениеmax: maximum value
c: счетчикc: counter
pos[b]: результат поиска (позиция)pos [b]: search result (position)
pol[b]: результат поиска (полярность)pol [b]: search result (polarity)
s[i]: входной спектрs [i]: input spectrum
Как показано на фиг.6, модуль 121 зонального поиска вычисляет входной спектр s[i] каждой выборки (0≤c≤15) в расчете на полосу частот (0≤b≤4) и вычисляет максимальное значение "max".As shown in FIG. 6, the zonal search module 121 calculates an input spectrum s [i] of each sample (0≤c≤15) per frequency band (0≤b≤4) and calculates a maximum value of "max".
Фиг.7 показывает пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска. Как показано на фиг.7, один импульс, имеющий амплитуду "1" и полярность "+" или "-", размещается в каждой из пяти полос частот, каждая из которых имеет полосу пропускания в шестнадцать выборок.7 shows an example of a spectrum represented by pulses that are searched in the area search module 121. As shown in FIG. 7, one pulse having an amplitude of “1” and a polarity of “+” or “-” is located in each of the five frequency bands, each of which has a bandwidth of sixteen samples.
Модуль 122 полного поиска выполняет поиск позиций, чтобы размещать три импульса, по всей зоне поиска и кодирует позиции импульсов и их полярности. В модуле 122 полного поиска поиск выполняется согласно следующим четырем условиям для кодирования точных позиций с небольшим числом информационных битов и небольшим объемом вычислений.The
(1) Два или более импульсов не размещаются в одной позиции. В этом примере импульсы не размещаются в позициях, в которых импульс каждой полосы частот размещается в модуле 121 зонального поиска. С помощью данного изобретения информационные биты не используются для того, чтобы представлять амплитудные компоненты, так что можно эффективно использовать информационные биты.(1) Two or more pulses are not placed in one position. In this example, the pulses are not located at positions in which the pulse of each frequency band is located in the area search module 121. With the present invention, information bits are not used to represent amplitude components, so that information bits can be effectively used.
(2) Поиск импульсов выполняется по порядку, один за другим, в разомкнутом контуре. Во время поиска, согласно правилу (1), определенные позиции импульсов не подлежат поиску.(2) The search for pulses is performed in order, one after another, in an open loop. During the search, according to rule (1), certain pulse positions cannot be searched.
(3) При поиске позиции позиция, в которой импульс менее предпочтительно должен размещаться, также кодируется как информация позиции один.(3) When searching for a position, the position in which the impulse should be less preferably placed is also encoded as position information alone.
(4) С учетом того, что усиление кодируется на основе каждой полосы частот, поиск импульсов выполняется посредством оценки искажения при кодировании относительно идеального усиления каждой полосы частот.(4) Given that the gain is encoded based on each frequency band, the pulse search is performed by coding distortion estimation relative to the ideal gain of each frequency band.
Модуль 122 полного поиска выполняет следующую двухэтапную оценку затрат, чтобы выполнять поиск одиночного импульса по всему входному спектру. Во-первых, на первом этапе, модуль 122 полного поиска оценивает затраты в каждой полосе частот и находит позицию и полярность так, чтобы минимизировать функцию затрат. Затем, на второй стадии, модуль 122 полного поиска оценивает полные затраты каждый раз, когда вышеуказанный поиск завершен в полосе частот, и сохраняет позицию и полярность импульса, чтобы минимизировать затраты, как конечный результат. Этот поиск выполняется в расчете на полосу частот, по порядку. Дополнительно, этот поиск выполняется для того, чтобы удовлетворять вышеуказанным условиям (1)-(4). Затем, когда поиск одного импульса завершен, при условии присутствия этого импульса в искомой позиции, поиск следующего импульса выполняется. Этот поиск выполняется до тех пор, пока заранее определенного числа импульсов (три импульса в этом примере) не обнаружено, посредством повторения вышеуказанной обработки.The
Последовательность операций алгоритма поиска в модуле 122 полного поиска показана на фиг.8.The flow of the search algorithm in the
Фиг.8 является блок-схемой последовательности операций способа предварительной обработки поиска, а фиг.9 является блок-схемой последовательности операций способа поиска. Дополнительно, части, соответствующие вышеуказанным условиям (1), (2) и (4), показаны на блок-схеме последовательности операций способа фиг.9.FIG. 8 is a flowchart of a search preprocessing method, and FIG. 9 is a flowchart of a search method. Additionally, parts corresponding to the above conditions (1), (2) and (4) are shown in the flowchart of FIG. 9.
Символы, используемые на блок-схеме последовательности операций способа фиг.8, означают следующее:The symbols used in the flowchart of FIG. 8 mean the following:
c: счетчикc: counter
pf[*]: флаг присутствия/отсутствия импульсаpf [*]: flag presence / absence of an impulse
b: номер полосы частотb: frequency band number
pos[*]: результат поиска (позиция)pos [*]: search result (position)
n_s[*]: значение корреляцииn_s [*]: correlation value
n_max[*]: максимальное значение корреляцииn_max [*]: maximum correlation value
n2_s[*]: значение квадрата корреляцииn2_s [*]: correlation squared value
n2_max[*]: максимальное значение квадрата корреляцииn2_max [*]: maximum value of the correlation square
d_s[*]: значение мощностиd_s [*]: power value
d_max[*]: максимальное значение мощностиd_max [*]: maximum power value
s[*]: входной спектрs [*]: input spectrum
Символы, используемые на блок-схеме последовательности операций способа фиг.9, означают следующее:The symbols used in the flowchart of FIG. 9 mean the following:
i: номер импульсаi: pulse number
i0: позиция импульсаi0: pulse position
cmax: максимальное значение функции затратcmax: maximum value of the cost function
pf[*]: флаг присутствия/отсутствия импульса (0: отсутствие, 1: присутствие)pf [*]: flag of presence / absence of an impulse (0: absence, 1: presence)
ii0: относительная позиция импульса в полосе частотii0: relative position of the pulse in the frequency band
nom: спектральная амплитудаnom: spectral amplitude
nom2: член числителя (спектральная мощность)nom2: numerator term (spectral power)
den: член знаменателяden: denominator
n_s[*]: относительное значениеn_s [*]: relative value
d_s[*]: значение мощностиd_s [*]: power value
s[*]: входной спектрs [*]: input spectrum
n2_s[*]: значение квадрата корреляцииn2_s [*]: correlation squared value
n_max[*]: максимальное значение корреляцииn_max [*]: maximum correlation value
n2_max[*]: максимальное значение квадрата корреляцииn2_max [*]: maximum value of the correlation square
idx_max[*]: результат поиска каждого импульса (позиция) (здесь, idx_max[*] от 0 до 4 эквивалентно pos[b] на фиг.6)idx_max [*]: search result of each impulse (position) (here, idx_max [*] from 0 to 4 is equivalent to pos [b] in Fig.6)
fd0, fd1, fd2: буфер для временного хранения (тип вещественных чисел)fd0, fd1, fd2: buffer for temporary storage (type of real numbers)
id0, id1: буфер для временного хранения (тип целых чисел)id0, id1: buffer for temporary storage (integer type)
id0_s, id1_s: буфер для временного хранения (тип целых чисел)id0_s, id1_s: buffer for temporary storage (integer type)
>>: битовый сдвиг (вправо)>>: bit shift (right)
&: "и" как битовая последовательность&: "and" as a bit sequence
Здесь, при поиске на фиг.8 и фиг.9, случай, в котором idx_max[*] равно "-1", соответствует случаю вышеуказанного условия (3), когда импульс менее предпочтительно должен размещаться. Конкретным примером этого является то, когда спектр достаточно аппроксимируется только с помощью импульсов, для которых выполняется поиск в расчете на полосу частот, и импульсов, для которых выполняется поиск по всей зоне, и когда дополнительное прибавление импульсов с идентичной величиной пропорционально увеличивает искажение при кодировании.Here, when searching in FIG. 8 and FIG. 9, the case in which idx_max [*] is “-1” corresponds to the case of the above condition (3), when the pulse is less preferably to be placed. A concrete example of this is when the spectrum is sufficiently approximated only by pulses for which a search is performed per frequency band, and pulses for which a search is performed over the entire zone, and when the additional addition of pulses with an identical value proportionally increases the coding distortion.
Полярности искомых импульсов соответствуют полярностям входного спектра в этих позициях, и модуль 122 полного поиска кодирует эти полярности с помощью 3 (импульсов) × 1=3 битов. Здесь, когда позиция - это "-1", т.е. когда импульс не должен размещаться, любая полярность может использоваться. Тем не менее, полярность может использоваться для того, чтобы обнаруживать битовую ошибку, и, в общем, задается фиксированно равной "+" или "-".The polarities of the desired pulses correspond to the polarities of the input spectrum at these positions, and the
Дополнительно, модуль 122 полного поиска кодирует информацию позиций импульсов на основе числа комбинаций позиций импульсов. В этом примере, поскольку входной спектр содержит восемьдесят выборок, и пять импульсов уже обнаружены в пяти отдельных полосах частот, если случаи, в которых импульсы не размещаются, также принимаются во внимание, варьирования позиций могут представляться с помощью семнадцати битов посредством вычисления следующего уравнения 5.Additionally, the
[3][3]
75+1C3=(75+1)*(74+1)*(73+1)/3/2/175 + 1C3 = (75 + 1) * (74 + 1) * (73 + 1) / 3/2/1
=70300= 70300
<131072<131072
=2^17 … (уравнение 5)= 2 ^ 17 ... (equation 5)
Здесь, согласно правилу запрета размещения двух или более импульсов в одной позиции можно сокращать число комбинаций, так что эффект этого правила становится большим, когда число импульсов, для которых выполняется полный поиск, увеличивается.Here, according to the rule prohibiting the placement of two or more pulses in one position, the number of combinations can be reduced, so that the effect of this rule becomes large when the number of pulses for which a full search is performed increases.
Способ кодирования позиций импульсов, для которых выполняется поиск в модуле 122 полного поиска, описывается ниже подробно.A method for encoding pulse positions for which a search is performed in the
(1) Три позиции импульсов сортируются на основе своей величины и размещаются в порядке от наименьшего числового значения к наибольшему числовому значению. Здесь, "-1" - это влево, как есть.(1) Three pulse positions are sorted based on their magnitude and arranged in order from the smallest numerical value to the largest numerical value. Here, “-1” is left as it is.
(2) Номера импульсов выровнены по левой границе посредством числа импульсов, возникающих в отдельных полосах частот, чтобы уменьшать числовые значения позиций импульсов. Числовые значения, вычисляемые таким образом, упоминаются "как номера позиций". Здесь, "-1" - это влево, как есть. Например, при обращении к позиции импульса "66", когда по одному импульсу предоставляется между 0 и 15, между 16 и 31, между 32 и 47 и между 48 и 64, номер позиции изменяется на "66-4=62".(2) The pulse numbers are aligned to the left boundary by the number of pulses occurring in the individual frequency bands in order to reduce the numerical values of the pulse positions. The numerical values calculated in this way are referred to “as item numbers”. Here, “-1” is left as it is. For example, when referring to the position of the pulse "66", when one pulse is provided between 0 and 15, between 16 and 31, between 32 and 47 and between 48 and 64, the position number changes to "66-4 = 62".
(3) "-1" задается равным номеру позиции, представленному посредством "максимального значения импульса+1". В этом случае порядок значений регулируется и определяется так, что заданный номер позиции не путается с номером позиции, в котором фактически присутствует импульс. Посредством этого номер импульса для импульса #0 ограничен диапазоном 0-73, номер позиции для импульса #1 ограничен диапазоном между номером позиции для импульса #0-74, а номер позиции для импульса #2 ограничен диапазоном между номером позиции для импульса #1-75, т.е. номер позиции меньшего импульса сконфигурирован не превышать номер позиции большего импульса.(3) “-1” is set equal to the position number represented by “maximum pulse value + 1”. In this case, the order of values is adjusted and determined so that the specified position number is not confused with the position number in which the pulse is actually present. By this, the pulse number for
(4) Затем, согласно обработке интегрирования, показанной в следующем уравнении 6, чтобы вычислять комбинированный код, номера позиций (i0, i1, i2) интегрируются, чтобы формировать код (c). Эта обработка интегрирования упоминается как обработка вычисления интегрирования всех комбинаций в случае, когда имеется порядок величины.(4) Then, according to the integration processing shown in the following equation 6, to calculate the combined code, the position numbers (i0, i1, i2) are integrated to form the code (c). This integration processing is referred to as integration calculation processing of all combinations in the case where there is an order of magnitude.
[4][four]
c=((76-0)*(77-0)*(153-2*0)/3+(74-0)*(75-0))/4c = ((76-0) * (77-0) * (153-2 * 0) / 3 + (74-0) * (75-0)) / 4
-((76-i0)*(77-i0)*(153-2*i0)/3+(74-i0)*(75-i0))/4;- ((76-i0) * (77-i0) * (153-2 * i0) / 3 + (74-i0) * (75-i0)) / 4;
c=c+(76-i0)*(77-i0)/2-(76-i1)*(77-i1)/2;c = c + (76-i0) * (77-i0) / 2- (76-i1) * (77-i1) / 2;
c=c+75-i2; … (уравнение 6)c = c + 75-i2; ... (equation 6)
(5) Затем, посредством комбинирования семнадцати битов этого c и трех битов для полярности код из двадцати битов формируется.(5) Then, by combining seventeen bits of this c and three bits for polarity, a code of twenty bits is generated.
Здесь, в вышеуказанных номерах позиций, импульс #0 в "73", импульс #1 в "74" и импульс #2 в "75" являются номерами позиций, в которых импульсы не размещаются. Например, если имеется три номера позиций (73,-1,-1) согласно вышеуказанной взаимосвязи между номером позиции один и номером позиции, в которой импульс не размещается, эти номера позиций переупорядочиваются как (-1, 73,-1) и становятся следующими (73, 73, 74).Here, in the above position numbers,
Таким образом, с помощью модели для того, чтобы представлять входной спектр посредством последовательности из восьми импульсов (пять импульсов в отдельных полосах частот и три импульса во всей зоне), как показано в этом примере, можно выполнять кодирование посредством 45 информационных битов.Thus, using the model, in order to represent the input spectrum by means of a sequence of eight pulses (five pulses in separate frequency bands and three pulses in the entire zone), as shown in this example, encoding can be performed using 45 information bits.
Фиг.10 иллюстрирует пример спектра, представленного посредством импульсов, для которых выполняется поиск в модуле 121 зонального поиска и модуле 122 полного поиска. Кроме того, на фиг.10 импульсы, представленные посредством полужирных линий, являются импульсами, для которых выполняется поиск в модуле 122 полного поиска.10 illustrates an example of a spectrum represented by pulses that are searched in the area search module 121 and the
Модуль 112 квантования по усилению квантует усиление каждой полосы частот. Восемь импульсов размещаются в полосах частот, и модуль 112 квантования по усилению вычисляет усиления посредством анализа корреляции между этими импульсами и входным спектром.
Если модуль 112 квантования по усилению вычисляет идеальные усиления и затем выполняет кодирование посредством скалярного или векторного квантования, во-первых, модуль 112 квантования по усилению вычисляет идеальные усиления согласно следующему уравнению 7. Здесь, в уравнении 7, gn - это идеальное усиление полосы частот n, s(i+16n) - это входной спектр полосы частот n, vn(i)- это вектор, обнаруживаемый посредством декодирования формы полосы частот n.If the
[5][5]
… (уравнение 7) ... (equation 7)
Дополнительно, модуль 112 квантования по усилению выполняет кодирование посредством совместного выполнения скалярного квантования (SQ) идеальных усилений или совместного выполнения векторного квантования этих пяти усилений. В случае выполнения векторного квантования можно выполнять эффективное кодирование посредством прогнозирующего квантования, многостадийного VQ, раздельного VQ и т.д. Здесь, усиление может прослушиваться перцепционно на основе логарифмического масштаба, и, следовательно, посредством выполнения SQ или VQ после выполнения логарифмического преобразования усиления можно предоставлять перцепционно хороший синтезирующий звук.Additionally, gain
Дополнительно, вместо вычисления идеальных усилений, предусмотрен способ прямой оценки искажения при кодировании. Например, в случае выполнения VQ для пяти усилений искажение при кодировании вычисляется так, чтобы минимизировать следующее уравнение 8. Здесь, в уравнении 8, Ek - это искажение вектора k-го усиления, s(i+16n) - это входной спектр полосы частот n, g(k)n - это n-й элемент вектора k-го усиления, а vn(i) - это вектор формы, обнаруживаемый посредством декодирования формы полосы частот n.Additionally, instead of calculating ideal gains, a method for directly assessing coding distortion is provided. For example, if VQ is performed for five amplifications, the coding distortion is calculated so as to minimize the following equation 8. Here, in equation 8, E k is the distortion of the kth gain vector, s (i + 16n) is the input spectrum of the frequency band n, g (k) n is the nth element of the kth gain vector, and v n (i) is the shape vector detected by decoding the shape of the frequency band n.
[6][6]
… (уравнение 8) ... (equation 8)
Фиг.11 является блок-схемой, показывающей основные компоненты в модуле 303 монофонического декодирования. Модуль 303 монофонического декодирования, показанный на фиг.11, содержит модуль 331 демультиплексирования, модуль 332 LPC-деквантования, модуль 333 декодирования спектра, модуль 334 IMDCT (обратного модифицированного дискретного косинусного преобразования) и синтезирующий фильтр 335.11 is a block diagram showing the main components in the
На фиг.11 модуль 331 демультиплексирования демультиплексирует монофоническую кодированную информацию, принимаемую в качестве ввода из модуля 302 монофонического кодирования, в LPC-квантованные данные, импульсный код и код усиления, выводит LPC-квантованные данные в модуль 332 LPC-деквантования и выводит импульсный код и код усиления в модуль 333 декодирования спектра.11, the
Модуль 332 LPC-деквантования деквантует LPC-квантованные данные, принимаемые в качестве ввода из модуля 331 демультиплексирования, и выводит результирующие LPC-параметры в синтезирующий фильтр 335.
Модуль 333 декодирования спектра декодирует вектор формы и усиление при декодировании посредством способа, поддерживающего способ кодирования в модуле 326 кодирования спектра, показанном на фиг.5, с помощью импульсного кода и кода усиления, принимаемых в качестве ввода из модуля 331 демультиплексирования. Дополнительно, модуль 333 декодирования спектра предоставляет декодированный спектр посредством умножения декодированного вектора формы на усиление при декодировании и выводит этот декодированный спектр в IMDCT-модуль 334.The
IMDCT-модуль 334 преобразует декодированный спектр, принимаемый в качестве ввода из модуля 333 декодирования спектра, противоположным способом относительно преобразования в MDCT-модуле 325, показанном на фиг.5, и выводит M-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 335.The
Синтезирующий фильтр 335 предоставляет монофонический декодированный M-сигнал посредством применения синтезирующего фильтра к M-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 334, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332 LPC-деквантования.Synthesizing
Далее поясняется способ декодирования трех импульсов в модуле 333 декодирования спектра, для которых выполняется полный поиск.Next, a method for decoding three pulses in a
В модуле 122 полного поиска из модуля 326 кодирования спектра номера позиций (i0, i1, i2) интегрируются в один код с помощью вышеприведенного уравнения 5. В модуле 333 декодирования спектра выполняется противоположная обработка. Таким образом, модуль 333 декодирования спектра последовательно вычисляет значение уравнения интегрирования при изменении каждого номера позиции, фиксированно задает номер позиции, когда номер позиции меньше значения интегрирования, и выполняет декодирование посредством выполнения этой обработки от номера позиции нижнего слоя до номера позиции высшего порядка один за другим. Фиг.12 является блок-схемой последовательности операций способа, показывающей алгоритм декодирования модуля 333 декодирования спектра.In the
Дополнительно, на фиг.12, когда введенный код "k" интегрированной позиции заключает в себе ошибку вследствие битовой ошибки, последовательность операций переходит к этапу обработки ошибок. Следовательно, в этом случае позиция должна быть обнаружена посредством заранее определенной обработки ошибок.Additionally, in FIG. 12, when the integrated position code “k” entered contains an error due to a bit error, the process proceeds to the error processing step. Therefore, in this case, the position must be detected by the predetermined error handling.
Дополнительно, поскольку декодер выполняет контурную обработку, объем вычислений в декодере больше, чем в кодере. Здесь, каждый контур является разомкнутым контуром, и, следовательно, по сравнению с общим объемом обработки в устройстве кодирования объем вычислений в декодере не является настолько большим.Additionally, since the decoder performs loop processing, the amount of computation in the decoder is greater than in the encoder. Here, each loop is an open loop, and therefore, compared to the total processing amount in the encoding device, the amount of computation in the decoder is not so large.
Фиг.13 является блок-схемой, показывающей основные компоненты в модуле 305 стереофонического кодирования. Модуль 305 стереофонического кодирования, показанный на фиг.13, имеет в основном идентичную конфигурацию и выполняет в основном операции, идентичные модулю 302 монофонического кодирования, показанному на фиг.5. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.5 и фиг.13, "a" назначается ссылкам с номерами модулей на фиг.13. Например, модуль на фиг.13, соответствующий модулю 321 LPC-анализа на фиг.5, выражается как модуль 32a1 LPC-анализа. Кроме того, модуль 305 стереофонического кодирования на фиг.13 отличается от модуля 302 монофонического кодирования на фиг.5 включением дополнительного обратного фильтра 351, MDCT-модуля 352 и модуля 353 интегрирования. Кроме того, модуль 356 кодирования спектра из модуля 305 стереофонического кодирования на фиг.13 отличается от модуля 326 кодирования спектра из модуля 302 монофонического кодирования на фиг.5 входными сигналами, и, следовательно, ему назначается другая ссылка с номером.13 is a block diagram showing major components in a
Обратный фильтр 351 применяет обратную фильтрацию к S-сигналу, принимаемому в качестве ввода из модуля 101 вычисления суммы и разности, с использованием LPC-параметров, принимаемых в качестве ввода из модуля 323a LPC-деквантования, чтобы сглаживать конкретную для спектра структуру, и выводит фильтрованный S-сигнал в MDCT-модуль 352. Здесь, функция обратного фильтра 324a представляется посредством вышеприведенного уравнения 3. Строго говоря, хотя LPC-коэффициенты, полученные из M-сигнала, не совпадают со спектральной структурой S-сигнала с учетом того, что M-сигнал и S-сигнал, в общем, имеют аналогичные спектральные структуры и что объем вычислений и объем ROM, требуемый для LPC-анализа, квантования и деквантования S-сигнала, экономится, LPC-параметры, принимаемые в качестве ввода из модуля 323a LPC-деквантования, используются при обработке обратной фильтрации в обратном фильтре 351.The
MDCT-модуль 352 выполняет MDCT S-сигнала, подвергнутого обратной фильтрации, принимаемого в качестве ввода из обратного фильтра 351, и преобразует S-сигнал временной области в спектр S-сигнала частотной области. Здесь, вместо MDCT в равной степени можно использовать FFT. MDCT-модуль 352 выводит спектр S-сигнала, обнаруживаемый посредством MDCT, в модуль 353 интегрирования.The
Модуль 353 интегрирования интегрирует спектр M-сигнала, принимаемый в качестве ввода из MDCT-модуля 325a, и спектр S-сигнала, принимаемый в качестве ввода из MDCT-модуля 352 так, что спектры одной частоты являются смежными друг с другом, и выводит результирующий интегрированный спектр в модуль 356 кодирования спектра.The
Фиг.14 иллюстрирует состояние, когда спектр M-сигнала и спектр S-сигнала интегрируются в модуле 353 интегрирования. Модуль 356 кодирования спектра использует интегрированный спектр, обнаруживаемый посредством интегрирования двух спектров, как показано на фиг.14, как один целевой спектр кодирования, и, следовательно, выделяет большее число битов важным частям при кодировании спектра M-сигнала и спектра S-сигнала.FIG. 14 illustrates a state where an M-signal spectrum and an S-signal spectrum are integrated in an
Возвращаемся к фиг.13, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра использованием интегрированного спектра, принимаемого в качестве ввода из модуля 353 интегрирования, в качестве входного спектра. Кроме того, модуль 356 кодирования спектра отличается от модуля 326 кодирования спектра числом импульсов, для которых выполняется поиск по всему входному спектру.Returning to FIG. 13, the
В ассоциации с числом импульсов, для которых выполняется полный поиск, выделение битов в модуле 356 кодирования спектра поясняется в отношении фиг.15.In association with the number of pulses for which a full search is performed, bit allocation in the
Модуль 356 кодирования спектра использует интегрированный спектр как входной спектр, и, следовательно, число выборок во входном спектре в два раза превышает число выборок во входном спектре в модуле 326 кодирования спектра, и число выборок в каждой из пяти полос частот, обнаруживаемых посредством деления входного спектра, в два раза превышает число выборок в модуле 326 кодирования спектра. С учетом того, что общее число битов кода формы составляет 45 битов в модуле 302 монофонического кодирования, модуль 356 кодирования спектра выполняет выделение битов, как показано на фиг.15. Как показано на фиг.15, число импульсов, для которых выполняется полный поиск, составляет "2" в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число импульсов, для которых выполняется полный поиск, составляет "3".The
Кроме того, как показано на фиг.15, число битов, которое следует использовать при кодировании спектра, составляет "46" всего в модуле 356 кодирования спектра, что отличается от модуля 326 кодирования спектра, в котором число битов, которое следует использовать при кодировании спектра, составляет "45" всего.In addition, as shown in FIG. 15, the number of bits to be used in spectrum coding is “46” in total in the
Здесь, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Например, диапазон поиска для одного из двух импульсов, для которых выполняется полный поиск в модуле 356 кодирования спектра, может быть ограничен от 0-159 выборок до 0-50 выборок. Посредством этого можно выражать 160×51<8192 видов результатов поиска посредством 13 битов, так что можно подавлять общее число битов, которые следует использовать при кодировании спектра, пределами 45 битов. Альтернативно, например, после поиска импульса в расчете на полосу частот, посредством ограничения диапазона поиска пятой полосы частот (т.е. наивысшей полосы частот) от 0-31 выборки до 0-15 выборок, в равной степени можно полностью сопоставлять общее число битов, которое следует использовать при кодировании спектра в модуле 356 кодирования спектра, с общим числом битов, которое следует использовать при кодировании спектра в модуле 326 кодирования спектра. Это обусловлено тем, что в этом случае можно представлять позиции импульсов полосы частот в пяти полосах частот посредством 5×4+4=24 битов.Here, it is equally possible to fully compare the total number of bits that should be used when coding the spectrum in
Если модуль 356 кодирования спектра кодирует интегрированный спектр, интегрирующий спектр M-сигнала и спектр S-сигнала, выделение битов автоматически выполняется на основе признаков M-сигнала и S-сигнала, так что можно выполнять эффективное кодирование согласно значимости информации.If the
Например, если L-сигнал и R-сигнал являются полностью идентичными, спектр S-сигнала равен "0", и импульсы размещаются только в позициях спектра M-сигнала в интегрированном спектре. Следовательно, спектр M-сигнала кодируется точно.For example, if the L-signal and the R-signal are completely identical, the spectrum of the S-signal is "0", and the pulses are placed only in the positions of the spectrum of the M-signal in the integrated spectrum. Therefore, the spectrum of the M signal is encoded accurately.
В отличие от этого, если фаза L-сигнала и фаза R-сигнала являются приблизительно противоположными, спектр S-сигнала становится значимым, и больше импульсов размещается в позициях спектра S-сигнала в интегрированном спектре. Следовательно, спектр S-сигнала кодируется точно. Таким образом, без специальной классификации на основе решений или случаев выделение битов выполняется автоматически, и спектр M-сигнала и спектр S-сигнала кодируются эффективно.In contrast, if the phase of the L-signal and the phase of the R-signal are approximately opposite, the spectrum of the S-signal becomes significant, and more pulses are placed in the positions of the spectrum of the S-signal in the integrated spectrum. Therefore, the spectrum of the S signal is encoded accurately. Thus, without special classification based on decisions or cases, bit allocation is performed automatically, and the spectrum of the M signal and the spectrum of the S signal are encoded efficiently.
Кроме того, если имеются большие элементы на определенной частоте, и фаза L-сигнала и фаза R-сигнала не являются приблизительно противоположными, то один из спектра M-сигнала и спектра S-сигнала с большой вероятностью должен иметь большие элементы. Здесь, спектр M-сигнала и спектр S-сигнала элементов с одной частотой интегрируются рядом в интегрированный спектр, и интегрированный спектр разделяется на множество полос частот и кодируется в модуле 356 кодирования спектра, так что выполняется поиск и кодирование только одного из спектра M-сигнала и спектра S-сигнала частоты со значимыми элементами. Посредством этого можно не допускать кодирования двух импульсов элемента с одной частотой и реализовывать эффективное кодирование.In addition, if there are large elements at a certain frequency, and the phase of the L signal and the phase of the R signal are not approximately opposite, then one of the spectrum of the M signal and the spectrum of the S signal is likely to have large elements. Here, the M-signal spectrum and the S-signal spectrum of elements with the same frequency are integrated side by side in the integrated spectrum, and the integrated spectrum is divided into a plurality of frequency bands and encoded in the
Фиг.16 является блок-схемой, показывающей основные компоненты в модуле 306 стереофонического декодирования. Модуль 306 стереофонического декодирования содержит модуль 331a демультиплексирования, модуль 332a LPC-деквантования, модуль 333a декодирования спектра, IMDCT-модуль 334a и синтезирующий фильтр 335a, которые выполняют операции, идентичные операциям модуля 331 демультиплексирования, модуля 332 LPC-деквантования, модуля 333 декодирования спектра, IMDCT-модуля 334 и синтезирующего фильтра 335 из модуля 303 монофонического декодирования, показанного на фиг.11. Дополнительно, модуль 306 стереофонического декодирования содержит модуль 361 разложения, IMDCT-модуль 362 и синтезирующий фильтр 363. Кроме того, на фиг.16 выходной сигнал синтезирующего фильтра 335a является стереофоническим декодированным M-сигналом, а выходной сигнал синтезирующего фильтра 363 является стереофоническим декодированным S-сигналом.Fig is a block diagram showing the main components in the
Модуль 361 разложения раскладывает декодированный спектр, принимаемый в качестве ввода из модуля 333a декодирования спектра, в декодированный спектр M-сигнала и декодированный спектр S-сигнала посредством противоположной обработки относительно обработки в модуле 353 интегрирования на фиг.13. Дополнительно, модуль 361 разложения выводит декодированный спектр M-сигнала в IMDCT-модуль 334a и выводит декодированный спектр S-сигнала в IMDCT-модуль 362.The decomposition unit 361 decomposes the decoded spectrum received as input from the
IMDCT-модуль 362 преобразует декодированный спектр S-сигнала, принимаемый в качестве ввода из модуля 361 разложения, противоположным способом относительно MDCT-модуля 352, показанного на фиг.13, и выводит S-сигнал временных рядов, обнаруживаемый посредством преобразования, в синтезирующий фильтр 363.The
Синтезирующий фильтр 363 предоставляет стереофонический декодированный S-сигнал посредством применения синтезирующего фильтра к S-сигналу временных рядов, принимаемому в качестве ввода из IMDCT-модуля 362, при использовании LPC-параметров, принимаемых в качестве ввода из модуля 332a LPC-деквантования.Synthesizing
Далее поясняется конфигурация и операции устройства декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов, показанное на чертеже 1.Next, the configuration and operations of the stereo signal decoding apparatus supporting the stereo signal encoding apparatus 100 shown in FIG. 1 are explained.
Фиг.17 является блок-схемой, показывающей основные компоненты устройства 200 декодирования стереофонических сигналов, поддерживающего устройство 100 кодирования стереофонических сигналов.17 is a block diagram showing the main components of a stereo
На фиг.17 устройство 200 декодирования стереофонических сигналов содержит модуль 201 демультиплексирования, модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя, модуль 206 декодирования третьего улучшающего слоя и модуль 207 вычисления суммы и разности.17, the stereo
Модуль 201 демультиплексирования демультиплексирует потоки битов, принимаемые в качестве ввода из устройства 100 кодирования стереофонических сигналов, в информацию режима, кодированную информацию базового слоя, кодированную информацию первого улучшающего слоя, кодированную информацию второго улучшающего слоя и кодированную информацию третьего улучшающего слоя, и выводит их в модуль 202 задания режима, модуль 203 декодирования базового слоя, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, соответственно.The
Модуль 202 задания режима выводит информацию режима для задания режимов декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя, принимаемую в качестве ввода из модуля 201 демультиплексирования, в эти модули декодирования.The
Режим декодирования в каждом модуле декодирования упоминается как режим монофонического декодирования для декодирования только информации M-сигнала или режим стереофонического декодирования для декодирования как информации M-сигнала, так и информации S-сигнала. Здесь, информация M-сигнала типично соответствует самому M-сигналу или искажению при кодировании, связанному с M-сигналом, в каждом слое. Кроме того, информация S-сигнала типично соответствует самому S-сигналу или искажению при кодировании, связанному с S-сигналом в каждом слое.The decoding mode in each decoding unit is referred to as a monaural decoding mode for decoding only M-signal information or a stereo decoding mode for decoding both M-signal information and S-signal information. Here, the information of the M signal typically corresponds to the M signal itself or coding distortion associated with the M signal in each layer. In addition, S-signal information typically corresponds to the S-signal itself or coding distortion associated with the S-signal in each layer.
Далее, режим декодирования в каждом слое показан с помощью каждого из битов информации режима. Таким образом, в битах значение "0" представляет режим монофонического декодирования, а значение "1" представляет режим стереофонического декодирования. Более конкретно, например, каждый из четырех битов информации режима используется для того, чтобы последовательно представлять режимы декодирования в модуле 203 декодирования базового слоя, модуле 204 декодирования первого улучшающего слоя, модуле 205 декодирования второго улучшающего слоя и модуле 206 декодирования третьего улучшающего слоя. Например, информация четырехбитового режима "0000" означает, что монофоническое декодирование выполняется во всех слоях. Кроме того, например, информация режима "0011" означает, что модуль 203 декодирования базового слоя и модуль 204 декодирования первого улучшающего слоя выполняют монофоническое декодирование, а модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя выполняют стереофоническое декодирование. Таким образом, с помощью информации четырехбитового режима можно представлять шестнадцать типов режимов декодирования в четырех модулях декодирования.Further, the decoding mode in each layer is shown using each of the mode information bits. Thus, in bits, the value “0” represents the mono decoding mode, and the value “1” represents the stereo decoding mode. More specifically, for example, each of the four bits of mode information is used to sequentially represent decoding modes in the base
В настоящем варианте осуществления информация режима, выводимая из модуля 202 задания режима, принимается в каждом модуле декодирования как идентичная входная информация четырехбитового режима. Дополнительно, каждый модуль декодирования проверяет только один бит из этих четырех входных битов, требуемых для того, чтобы задавать режим декодирования, и задает режим декодирования. Таким образом, во входной информации четырехбитового режима модуль 203 декодирования базового слоя проверяет первый бит, модуль 204 декодирования первого улучшающего слоя проверяет второй бит, модуль 205 декодирования второго улучшающего слоя проверяет третий бит, а модуль 206 декодирования третьего улучшающего слоя проверяет четвертый бит.In the present embodiment, the mode information output from the
Тем не менее, вместо ввода идентичной информации четырехбитового режима в каждом модуле декодирования, модуль 202 задания режима может заранее сортировать один бит, требуемый для того, чтобы задавать режим декодирования в каждом модуле декодирования и выводить один бит в каждый модуль декодирования. Таким образом, в четырех битах информации режима модуль 202 задания режима может вводить только первый бит в модуле 203 декодирования базового слоя, только второй бит в модуле 204 декодирования первого улучшающего слоя, только третий бит в модуле 205 декодирования второго улучшающего слоя и только четвертый бит в модуле 206 декодирования третьего улучшающего слоя.However, instead of entering identical four-bit mode information in each decoding unit, the
Кроме того, в любом из вышеописанных случаев информация режима, принимаемая в качестве ввода из модуля 201 демультиплексирования в модуль 202 задания режима, упоминается как информация четырехбитового режима.In addition, in any of the above cases, the mode information received as input from the
В модуле 203 декодирования базового слоя режим монофонического декодирования или режим стереофонического декодирования задается на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 203 декодирования базового слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. В этом случае информация S-сигнала не декодируется, и, следовательно, нулевой сигнал, видимо, выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя.In the base
Напротив, после задания режима стереофонического декодирования модуль 203 декодирования базового слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, и выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в модуль 204 декодирования первого улучшающего слоя. Здесь, модуль 203 декодирования базового слоя полностью сбрасывает M-сигнал и S-сигнал (т.е. задает значения 0 для этих сигналов) перед декодированием. Кроме того, модуль 203 декодирования базового слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the base
В модуле 204 декодирования первого улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажение при кодировании базового слоя M-сигнала. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Декодированный S-сигнал базового слоя, принимаемый в качестве ввода из модуля 203 декодирования базового слоя, выводится как есть в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя.In the
Напротив, после задания режима стереофонического декодирования модуль 204 декодирования первого улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию первого улучшающего слоя, и обнаруживает искажения при кодировании базового слоя M- и S-сигналов. Модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя M-сигнала и декодированный M-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный M-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя суммирует искажение при кодировании базового слоя S-сигнала и декодированный S-сигнал базового слоя, принимаемые в качестве ввода из модуля 203 декодирования базового слоя, и выводит результат суммирования в модуль 205 декодирования второго улучшающего слоя как декодированный S-сигнал первого улучшающего слоя. Кроме того, модуль 204 декодирования первого улучшающего слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the first enhancement
В модуле 205 декодирования второго улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажение при кодировании первого улучшающего слоя, связанное с M-сигналом. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, выводится как есть в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.In the second enhancement
Напротив, после задания режима стереофонического декодирования модуль 205 декодирования второго улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, и обнаруживает искажения при кодировании первого улучшающего слоя, связанные с M- и S-сигналами. Модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал первого улучшающего слоя, принимаемые в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя. Кроме того, модуль 205 декодирования второго улучшающего слоя подробнее поясняется ниже.In contrast, after setting the stereo decoding mode, the second enhancement
В модуле 206 декодирования третьего улучшающего слоя режим монофонического кодирования или режим стереофонического кодирования задаются на основе информации режима, принимаемой в качестве ввода из модуля 202 задания режима. Более конкретно, после задания режима монофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажение при кодировании второго улучшающего слоя, связанное с M-сигналом. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Декодированный S-сигнал второго улучшающего слоя, принимаемый в качестве ввода из модуля 205 декодирования второго улучшающего слоя, выводится как есть в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя.In the third enhancement
Напротив, после задания режима стереофонического декодирования модуль 206 декодирования третьего улучшающего слоя декодирует стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию третьего улучшающего слоя, и обнаруживает искажения при кодировании второго улучшающего слоя, связанные с M- и S-сигналами. Модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с M-сигналом, и декодированный M-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный M-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя суммирует искажение при кодировании второго улучшающего слоя, связанное с S-сигналом, и декодированный S-сигнал второго улучшающего слоя, принимаемые в качестве ввода из модуля 205 декодирования второго улучшающего слоя, и выводит результат суммирования в модуль 207 вычисления суммы и разности как декодированный S-сигнал третьего улучшающего слоя. Кроме того, модуль 206 декодирования третьего улучшающего слоя подробнее поясняется ниже.On the contrary, after setting the stereo decoding mode, the third enhancement
Модуль 207 вычисления суммы и разности вычисляет декодированный L-сигнал и декодированный R-сигнал согласно следующим уравнениям 9 и 10 с помощью декодированного M-сигнала третьего улучшающего слоя и декодированного S-сигнала третьего улучшающего слоя, принимаемых в качестве ввода из модуля 206 декодирования третьего улучшающего слоя.The sum and
Li'=(Mi'+Si')/2 … (уравнение 9)Li '= (Mi' + Si ') / 2 ... (equation 9)
Ri'=(Mi'-Si')/2 … (уравнение 10)Ri '= (Mi'-Si') / 2 ... (equation 10)
В уравнениях 9 и 10 Mi' представляет декодированный M-сигнал третьего улучшающего слоя, si' представляет декодированный S-сигнал третьего улучшающего слоя, Li' представляет декодированный L-сигнал, а Ri' представляет декодированный R-сигнал.In
Фиг.18 является блок-схемой, показывающей основные компоненты в модуле 203 декодирования базового слоя.Fig is a block diagram showing the main components in the
Модуль 203 декодирования базового слоя, показанный на фиг.18, содержит переключатель 231, модуль 232 монофонического декодирования, модуль 233 стереофонического декодирования, переключатель 234 и переключатель 235.The base
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 231 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 232 монофонического декодирования, а если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию базового слоя, в модуль 233 стереофонического декодирования.If the value of the first bit of the mode information received as input from the
Модуль 232 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, и выводит результирующий декодированный M-сигнал базового слоя в переключатель 234. Кроме того, конфигурация и операции в модуле 232 монофонического декодирования являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, показанном на фиг.11, и, следовательно, их конкретное пояснение опускается.
Модуль 233 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 231, выводит результирующий декодированный M-сигнал базового слоя и декодированный S-сигнал базового слоя в переключатель 234 и переключатель 235, соответственно. Кроме того, конфигурация и операции в модуле 233 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.The
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 232 монофонического декодирования, в модуль 204 декодирования первого улучшающего слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 234 выводит декодированный M-сигнал базового слоя, принимаемый в качестве ввода из модуля 233 стереофонического декодирования, в модуль 204 декодирования первого улучшающего слоя.If the value of the first bit of the mode information received as input from the
Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 235 отключается и не выводит сигнал. Здесь, в качестве эквивалентной обработки, фактически сигнал из всех нулевых значений (т.е. нулевой сигнал) выводится в модуль 204 декодирования первого улучшающего слоя как декодированный S-сигнал базового слоя. Если значение первого бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", принимаемый декодированный S-сигнал базового слоя в качестве ввода из модуля 233 стереофонического декодирования выводится в модуль 204 декодирования первого улучшающего слоя.If the value of the first bit of the mode information received as input from the
Фиг.19 является блок-схемой, показывающей основные компоненты в модуле 205 декодирования второго улучшающего слоя. Здесь, модуль 204 декодирования первого улучшающего слоя, модуль 205 декодирования второго улучшающего слоя и модуль 206 декодирования третьего улучшающего слоя, показанные на фиг.17, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 205 декодирования второго улучшающего слоя.19 is a block diagram showing the main components in the
На фиг.19 модуль 205 декодирования второго улучшающего слоя содержит переключатель 251, модуль 252 монофонического декодирования, модуль 253 стереофонического декодирования, переключатель 254, сумматор 255, переключатель 256 и сумматор 257.19, the
Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 251 выводит монофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 252 монофонического декодирования. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 251 выводит стереофоническую кодированную информацию, принимаемую из модуля 201 демультиплексирования как входную кодированную информацию второго улучшающего слоя, в модуль 253 стереофонического декодирования.If the value of the third bit of the mode information received as input from the
Модуль 252 монофонического декодирования выполняет монофоническое декодирование с помощью монофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, в переключатель 254. Кроме того, конфигурация и операции в модуле 252 монофонического декодирования, показанном на фиг.11, являются идентичными конфигурации и операциям в модуле 303 монофонического декодирования, и, следовательно, их конкретное пояснение опускается.
Модуль 253 стереофонического декодирования выполняет стереофоническое декодирование с помощью стереофонической кодированной информации, принимаемой в качестве ввода из переключателя 251, и выводит результирующее искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, и искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, в переключатель 254 и переключатель 257, соответственно. Кроме того, конфигурация и операции в модуле 253 стереофонического декодирования являются идентичными конфигурации и операциям в модуле 306 стереофонического декодирования, показанном на фиг.16, и, следовательно, их конкретное пояснение опускается.The
Если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 252 монофонического декодирования, в сумматор 255. Кроме того, если значение третьего бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 254 выводит искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, в сумматор 255.If the value of the third bit of the mode information received as input from the
Сумматор 255 суммирует искажение при кодировании первого улучшающего слоя, связанное с M-сигналом, принимаемым в качестве ввода из переключателя 254, и декодированный M-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат суммирования в модуль 206 декодирования третьего улучшающего слоя как декодированный M-сигнал второго улучшающего слоя.An
Сумматор 257 суммирует искажение при кодировании первого улучшающего слоя, связанное с S-сигналом, принимаемым в качестве ввода из модуля 253 стереофонического декодирования, и декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, и выводит результат в переключатель 256.An
Если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "0", переключатель 256 выводит декодированный S-сигнал первого улучшающего слоя, принимаемый в качестве ввода из модуля 204 декодирования первого улучшающего слоя, как есть в модуль 206 декодирования третьего улучшающего слоя. Кроме того, если значение второго бита информации режима, принимаемой в качестве ввода из модуля 202 задания режима, равно "1", переключатель 256 выводит результат суммирования, принимаемый в качестве ввода из сумматора 257, в модуль 206 декодирования третьего улучшающего слоя как декодированный S-сигнал второго улучшающего слоя.If the value of the second bit of the mode information received as input from the
Таким образом, согласно настоящему варианту осуществления, масштабируемое кодирование выполняется для монофонического сигнала (т.е. M-сигнала) и бокового сигнала (т.е. S-сигнала), вычисляемых из L-сигнала и R-сигнала стереофонического сигнала, так что можно выполнять масштабируемое кодирование с использованием корреляции между L-сигналом и R-сигналом. Дополнительно, согласно настоящему варианту осуществления, режим кодирования в каждом слое в масштабируемом кодировании задается на основе информации режима, так что можно задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и повышать степень свободы в управлении точностью кодирования.Thus, according to the present embodiment, scalable encoding is performed for the mono signal (i.e., the M signal) and the side signal (i.e., the S signal) calculated from the L signal and the R signal of the stereo signal, so that scalable coding can be performed using the correlation between the L signal and the R signal. Further, according to the present embodiment, the encoding mode in each layer in scalable encoding is set based on the mode information, so that a layer for performing monaural encoding and a layer for performing stereo encoding can be defined and the degree of freedom in controlling the encoding accuracy can be increased.
Кроме того, согласно настоящему варианту осуществления, спектр M-сигнала и спектр S-сигнала интегрируются и кодируются таким образом, что спектры одной частоты являются смежными друг с другом, так что можно выполнять автоматическое выделение битов без специальной классификации на основе решений или случаев при стереофоническом кодировании и выполнять эффективное кодирование согласно значимости информации L-сигнала и R-сигнала.Furthermore, according to the present embodiment, the M-signal spectrum and the S-signal spectrum are integrated and encoded so that the spectra of the same frequency are adjacent to each other, so that it is possible to perform automatic bit allocation without special classification based on decisions or cases in stereo encoding and performing efficient encoding according to the significance of the L-signal and R-signal information.
Второй вариант осуществленияSecond Embodiment
Фиг.20 является блок-схемой, показывающей основные компоненты устройства 110 кодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения. Устройство 110 кодирования стереофонических сигналов, показанное на фиг.20, имеет в основном идентичную конфигурацию и выполняет в основном идентичные операции устройству 100 кодирования стереофонических сигналов, показанному на фиг.1. Следовательно, что касается модулей, которые выполняют идентичные операции для фиг.1 и фиг.20, "a" назначается ссылкам с номерами модулей на фиг.20. Например, модуль на фиг.20, соответствующий модулю 101 вычисления суммы и разности на фиг.1, выражается как модуль 101a вычисления суммы и разности. Кроме того, устройство 110 кодирования стереофонических сигналов на фиг.20 отличается от устройства 100 кодирования стереофонических сигналов на фиг.1 включением дополнительных модулей 112-114 задания режима. Кроме того, модуль 111 задания режима устройства 110 кодирования стереофонических сигналов на фиг.20 отличается от модуля 102 задания режима устройства 100 кодирования стереофонических сигналов на фиг.1 входными сигналами, и, следовательно, ему назначается другая ссылка с номером. Здесь, модули 111-114 задания режима, показанные на фиг.20, имеют идентичную внутреннюю конфигурацию и операции, но различаются по входным сигналам и выходным сигналам. Следовательно, примерный случай поясняется с помощью только модуля 111 задания режима.FIG. 20 is a block diagram showing the main components of a stereo
Модуль 111 задания режима вычисляет мощность M-сигнала и S-сигнала, принимаемых в качестве ввода из модуля 101a вычисления суммы и разности, и на основе вычисленной мощности и заранее определенных условных уравнений задает режим монофонического кодирования для кодирования только информации M-сигнала или режим стереофонического кодирования для кодирования как информации M-сигнала, так и информации S-сигнала. Например, режим стереофонического кодирования задается, если мощность S-сигнала превышает мощность M-сигнала, или режим монофонического кодирования задается, если мощность S-сигнала ниже мощности M-сигнала. Кроме того, если мощность M-сигнала и мощность S-сигнала является низкой, режим монофонического кодирования задается. Это учитывает то, что когда кодеры разрабатываются, кодер стереофонических сигналов, который обрабатывает два типа сигналов, предоставляет более высокий битрейт, чем кодер монофонических сигналов, который обрабатывает один тип сигнала. Кроме того, информация о заданном режиме выводится в модуль 103a кодирования базового слоя и модуль 107a мультиплексирования.The
Вычисление мощности в модуле 111 задания режима выполняется согласно следующим уравнениям 11 и 12.The power calculation in the
[7][7]
… (уравнение 11) ... (equation 11)
… (уравнение 12) ... (equation 12)
В уравнениях 11 и 12 i представляет номер выборки, PowM представляет мощность M-сигнала, а Mi представляет M-сигнал. Кроме того, PowS представляет мощность S-сигнала, а si представляет S-сигнал.In equations 11 and 12, i represents the sample number, PowM represents the power of the M signal, and M i represents the M signal. In addition, PowS represents the power of the S signal, and s i represents the S signal.
Заранее определенное условное уравнение в модуле 111 задания режима показано в следующем уравнении 13.A predetermined conditional equation in the
[8][8]
В уравнении 13 α представляет константу для оценки полной мощности и может приспосабливать верхнее предельное значение мощности сигнала, который не воспринимается. Кроме того, β представляет константу для оценки мощности S-сигнала. Способ вычисления константы β для оценки мощности S-сигнала описывается ниже. Кроме того, m представляет режим. Здесь, например, константа α для оценки полной мощности и константа β для оценки мощности S-сигнала сохраняются в ROM.In equation 13, α represents a constant for estimating the total power and can fit the upper limit value of the power of the signal, which is not perceived. In addition, β represents a constant for estimating the power of the S signal. A method for calculating the constant β for estimating the power of an S signal is described below. In addition, m represents a mode. Here, for example, the constant α for estimating the total power and the constant β for estimating the power of the S-signal are stored in ROM.
Что касается константы β для оценки мощности S-сигнала, если сигнал меньшего искажения при кодировании выбирается из L-сигнала и R-сигнала, способ статистического вычисления и сохранения соответствующих β в модулях 111-114 задания режима является возможным. Конкретный способ вычисления константы для оценки мощности S-сигнала β поясняется ниже.As for the constant β for estimating the power of the S-signal, if the signal of less distortion during encoding is selected from the L-signal and the R-signal, a method for calculating and storing corresponding β in the mode setting modules 111-114 is possible. A specific method for calculating the constant for estimating the power of the S-signal β is explained below.
Здесь поясняется способ вычисления константы β для оценки мощности S-сигнала в модуле 111 задания режима. Во-первых, большой объем стереофонических речевых данных принимается в качестве ввода в модуле 111 задания режима для обучения, и отношение между мощностью M-сигнала и мощностью S-сигнала вычисляется согласно следующему уравнению 14.Here, a method for calculating the constant β for estimating the power of the S signal in the
[9][9]
… (уравнение 14) ... (equation 14)
В уравнении 14 i представляет номер выборки каждого сигнала, а j представляет номер обучающих стереофонических речевых данных. Кроме того, Mi представляет M-сигнал, а si представляет S-сигнал. Кроме того, PowMj представляет мощность M-сигнала J-х обучающих стереофонических речевых данных, а PowSj представляет мощность S-сигнала J-х обучающих стереофонических речевых данных.In equation 14, i represents the sample number of each signal, and j represents the number of training stereo speech data. In addition, M i represents the M signal, and s i represents the S signal. In addition, PowM j represents the power of the M-signal of the J-x training stereo speech data, and PowS j represents the power of the S-signal of the J-x training stereo speech data.
Затем, противоположная обработка относительно понижающего микширования выполняется для декодированного M-сигнала и декодированного S-сигнала, обнаруживаемых посредством кодирования и декодирования в двух режимах в модуле 103a кодирования базового слоя, чтобы находить декодированный L-сигнал и декодированный R-сигнал. Вычисляются суммы отношений "сигнал-шум" результирующего декодированного L-сигнала и декодированного R-сигнала (т.е. отношения "сигнал-шум" в случае, когда искажение при кодировании L-сигнала и R-сигнала, принимаемых в качестве ввода в устройстве 110 кодирования стереофонических сигналов, рассматривается как шум), т.е. E0j и E1j.Then, the opposite processing with respect to the downmix is performed for the decoded M signal and the decoded S signal detected by two-mode encoding and decoding in the base
Затем, посредством постепенного изменения значения β между 0 и 1,0 полное отношение "сигнал-шум" Eβ, показанное в следующем уравнении 15, вычисляется.Then, by gradually changing the value of β between 0 and 1.0, the total signal-to-noise ratio E β shown in the following
[10][10]
Значение β, чтобы максимизировать вышеприведенное Eβ, вычисляется. Это значение сохраняется в модуле 111 задания режима и используется как константа для оценки мощности S-сигнала β. Аналогично модулю 111 задания режима, модули 112-114 задания режима вычисляют и сохраняют константу для оценки мощности S-сигнала β.The value of β in order to maximize the above E β is calculated. This value is stored in the
Кроме того, устройство декодирования стереофонических сигналов согласно варианту осуществления 2 настоящего изобретения имеет конфигурацию, идентичную конфигурации на фиг.17 варианта осуществления 1, и, следовательно, пояснение опускается.In addition, the stereo signal decoding apparatus according to
Таким образом, согласно настоящему варианту осуществления, по мере того как проходит обработка кодирования в каждом слое, режим кодирования в каждом слое при масштабируемом кодировании задается на основе локальных признаков речи, так что можно автоматически задавать слой для выполнения монофонического кодирования и слой для выполнения стереофонического кодирования и предоставлять декодированные сигналы высокого качества. Кроме того, если битрейт варьируется между режимами, управление скоростью передачи осуществляется автоматически, так что можно экономить число информационных битов.Thus, according to the present embodiment, as encoding processing in each layer proceeds, the encoding mode in each layer for scalable encoding is set based on local speech features, so that a layer for performing monophonic encoding and a layer for performing stereo encoding can be automatically set. and provide high quality decoded signals. In addition, if the bit rate varies between modes, the transmission rate is controlled automatically, so that the number of information bits can be saved.
Выше описаны варианты осуществления настоящего изобретения.Embodiments of the present invention are described above.
Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых стереофонические сигналы главным образом используются как речевые сигналы, разумеется, что стереофонические сигналы могут использоваться как аудиосигналы.In addition, although the embodiments described above describe cases in which stereo signals are mainly used as speech signals, it is understood that stereo signals can be used as audio signals.
Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых модуль 353 интегрирования интегрирует спектр M-сигнала и спектр S-сигнала так, что спектры одной частоты являются смежными друг с другом, настоящее изобретение не ограничено этим, и в равной степени можно интегрировать эти спектры в модуле 353 интегрирования так, что спектр S-сигнала простым способом размещается смежно до или после спектра M-сигнала.Furthermore, although exemplary cases have been described in the embodiments above, in which the
Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых два типа стереофонических сигналов представляются с помощью названий "сигнал левого канала" и "сигнал правого канала", в равной степени можно использовать более общие названия, к примеру "сигнал первого канала" и "сигнал второго канала". Кроме того, ассоциирование между битовыми значениями "0" и "1" и режимами кодирования "режим монофонического кодирования" и "режим стереофонического кодирования" не ограничено.In addition, although the embodiments described above describe cases in which two types of stereo signals are represented by the names “left channel signal” and “right channel signal”, more general names such as “first channel signal” and "second channel signal". In addition, the association between the bit values “0” and “1” and the encoding modes “monaural encoding mode” and “stereo encoding mode” is not limited.
Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых настоящее изобретение применяется к техническим требованиям, в которых частота дискретизации составляет 16 кГц, а длина кадра составляет 20 мс, настоящее изобретение не ограничено этим, и в равной степени можно применять настоящее изобретение к другим техническим требованиям, в которых частота дискретизации составляет 8 кГц, 24 кГц, 32 кГц, 44,1 кГц, 48 кГц и т.д., а длина кадра составляет 10 мс, 30 мс, 40 мс и т.д. Настоящее изобретение не зависит от частоты дискретизации или длины кадра.In addition, although the embodiments described above exemplary cases in which the present invention is applied to technical requirements in which the sampling frequency is 16 kHz and the frame length is 20 ms, the present invention is not limited to this, and the present invention can be equally applied. other technical requirements in which the sampling frequency is 8 kHz, 24 kHz, 32 kHz, 44.1 kHz, 48 kHz, etc., and the frame length is 10 ms, 30 ms, 40 ms, etc. The present invention is independent of sample rate or frame length.
Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых конфигурация с четырьмя слоями используется в масштабируемом кодировании, настоящее изобретение не ограничено этим, и в равной степени можно использовать другие числа слоев, отличные от четырех. Настоящее изобретение не зависит от числа слоев.In addition, although the embodiments described above describe cases in which the four-layer configuration is used in scalable coding, the present invention is not limited to this, and other numbers of layers other than four can equally be used. The present invention is independent of the number of layers.
Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых импульсное кодирование используется для того, чтобы кодировать спектр сигнала возбуждения, настоящее изобретение не ограничено этим, и для того, чтобы кодировать спектр сигнала возбуждения, в равной степени можно использовать VQ, прогнозирующее VQ, раздельное VQ, многостадийное VQ, технологии расширения полосы частот, межканальное прогнозирующее декодирование и т.д. Настоящее изобретение не зависит от схем кодирования спектра.In addition, although the embodiments described above exemplary cases in which pulse coding is used to encode the spectrum of the excitation signal, the present invention is not limited to this, and in order to encode the spectrum of the excitation signal, predicting VQ can equally be used VQ, split VQ, multi-stage VQ, bandwidth extension technologies, inter-channel predictive decoding, etc. The present invention is independent of spectrum coding schemes.
Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонические сигналы кодируются, чтобы передавать кодированную информацию, настоящее изобретение не ограничено этим, и в равной степени можно сохранять кодированную информацию на носителе хранения данных. Например, хотя кодированная информация аудиосигналов зачастую сохраняется в запоминающем устройстве или на диске и используется, настоящее изобретение одинаково эффективно в этом случае. Настоящее изобретение не зависит от того, передается кодированная информация или хранится.In addition, although exemplary cases have been described in the embodiments above in which stereo signals are encoded to transmit encoded information, the present invention is not limited to this, and encoded information can equally be stored on a storage medium. For example, although encoded information of audio signals is often stored in a storage device or on a disk and used, the present invention is equally effective in this case. The present invention does not depend on whether encoded information is transmitted or stored.
Кроме того, хотя в вариантах осуществления выше описаны примерные случаи, в которых стереофонический сигнал формируется с помощью двух каналов, настоящее изобретение не ограничено этим, и в равной степени можно формировать стереофонический сигнал с помощью множества каналов, к примеру, каналов 5.1.In addition, although exemplary cases have been described in the embodiments above in which a stereo signal is generated using two channels, the present invention is not limited thereto, and a stereo signal can be generated equally using a plurality of channels, for example, 5.1 channels.
Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых кодирование выполняется с использованием только размера спектров M-сигнала и S-сигнала в качестве меры расстояния, настоящее изобретение не ограничено этим, и в равной степени можно выполнять кодирование с использованием разности фаз или энергетического отношения между M-сигналом и S-сигналом в качестве меры расстояния. Настоящее изобретение не зависит от меры расстояния, которую следует использовать при кодировании спектра.In addition, although the embodiments described above describe cases in which encoding is performed using only the size of the spectra of the M signal and S signal as a measure of distance, the present invention is not limited thereto, and encoding using a phase difference or energy ratio between the M-signal and the S-signal as a measure of distance. The present invention is independent of the distance measure that should be used when coding the spectrum.
Кроме того, хотя в вариантах осуществления выше описаны случаи, в которых устройство декодирования стереофонических сигналов принимает и обрабатывает потоки битов, передаваемые от устройства кодирования стереофонических сигналов, настоящее изобретение не ограничено этим, и устройство декодирования стереофонических сигналов может принимать и обрабатывать потоки битов до тех пор, пока эти потоки битов передаются из устройства кодирования, которое может формировать потоки битов, которые могут обрабатываться в этом устройстве декодирования.In addition, although the embodiments described above describe cases in which a stereo signal decoding apparatus receives and processes bit streams transmitted from a stereo signal encoding apparatus, the present invention is not limited thereto, and a stereo signal decoding apparatus can receive and process bit streams until while these bitstreams are transmitted from an encoding device that can generate bitstreams that can be processed in this decoding device vania.
Кроме того, устройство кодирования стереофонических сигналов и устройство декодирования стереофонических сигналов согласно настоящему изобретению могут быть установлены на устройстве терминала связи и устройстве базовой станции в системе мобильной связи, так что можно предоставлять устройство терминала связи, устройство базовой станции и систему мобильной связи, имеющую функциональные эффекты, идентичные указанным выше.In addition, the stereo signal encoding device and stereo signal decoding device according to the present invention can be installed on the communication terminal device and the base station device in the mobile communication system, so that it is possible to provide the communication terminal device, the base station device and the mobile communication system having functional effects identical to the above.
Хотя в вышеприведенных вариантах осуществления описаны примерные случаи, в которых настоящее изобретение реализуется с помощью аппаратных средств, настоящее изобретение может быть реализовано с помощью программного обеспечения. Например, посредством описания алгоритма, согласно настоящему изобретению на языке программирования - сохранения этой программы в запоминающем устройстве и предписания модулю обработки информации выполнять эту программу можно реализовывать функцию, идентичную функции в устройстве кодирования стереофонических сигналов согласно настоящему изобретению.Although the above embodiments describe exemplary cases in which the present invention is implemented using hardware, the present invention can be implemented using software. For example, by describing the algorithm according to the present invention in a programming language — storing this program in a memory and instructing the information processing module to execute this program, it is possible to implement a function identical to that in the stereo signal encoding device according to the present invention.
Более того, каждый функциональный блок, используемый в пояснении каждого из вышеприведенных вариантов осуществления, типично может быть реализован как LSI, состоящая из интегральной схемы. Это могут быть отдельные микросхемы, либо они могут частично или полностью содержаться на одной микросхеме.Moreover, each function block used in the explanation of each of the above embodiments may typically be implemented as an LSI consisting of an integrated circuit. It can be separate microcircuits, or they can be partially or completely contained on one microcircuit.
В данном документе употребляется термин LSI, но она также может упоминаться как IC, "системная LSI", "супер-LSI" или "ультра-LSI", в зависимости от отличающейся степени интеграции.The term LSI is used throughout this document, but it may also be referred to as IC, “system LSI”, “super-LSI” or “ultra-LSI”, depending on the varying degree of integration.
Более того, способ интеграции микросхем не ограничен LSI, и реализация с помощью специализированных схем или процессора общего назначения также возможна. После изготовления LSI использование FPGA (программируемой пользователем вентильной матрицы) или реконфигурируемого процессора, где соединения или разъемы ячеек схемы в LSI могут быть переконфигурированы, также возможно.Moreover, the method of integrating microcircuits is not limited to LSI, and implementation using specialized circuits or a general-purpose processor is also possible. After manufacturing an LSI, the use of an FPGA (Field Programmable Gate Array) or reconfigurable processor where the connections or connectors of the circuit cells in LSI can be reconfigured is also possible.
Кроме того, если появится технология интегральных микросхем, чтобы заменять LSI, в результате усовершенствования полупроводниковой технологии или другой производной технологии, разумеется, также можно выполнять интеграцию функциональных блоков с помощью этой технологии. Применение биотехнологии также допускается.In addition, if integrated circuit technology appears to replace LSI, as a result of improvements in semiconductor technology or other derivative technology, it is of course also possible to integrate function blocks using this technology. The use of biotechnology is also allowed.
Раскрытия сущности заявки на патент (Япония) №2008-72497, поданной 19 марта 2008 года, и заявки на патент (Япония) №2008-274536, поданной 24 октября 2008 года, в том числе подробное описание, чертежи и реферат, полностью содержатся в данном документе по ссылке.Disclosure of the essence of patent application (Japan) No. 2008-72497, filed March 19, 2008, and patent application (Japan) No. 2008-274536, filed October 24, 2008, including a detailed description, drawings and abstract, are fully contained in this document by reference.
Промышленная применимостьIndustrial applicability
Настоящее изобретение является подходящим для использования, например, в устройстве кодирования, которое кодирует речевые сигналы и аудиосигналы, и в устройстве декодирования, которое декодирует кодированные сигналы.The present invention is suitable for use, for example, in an encoding device that encodes speech signals and audio signals, and in a decoding device that decodes encoded signals.
Claims (13)
- модуль вычисления суммы и разности, который формирует монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал, и формирует боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала;
модуль формирования информации режима, который формирует информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и
модули кодирования слоев с первого по N-й, которые выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.1. A device for encoding stereo signals, comprising:
- a module for calculating the sum and difference, which generates a monophonic signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and generates a side signal associated with the difference between the signal of the first channel and the signal of the second channel;
a mode information generating unit that generates mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and
coding modules of layers 1 through N, which perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using information related to the monophonic signal, or perform stereo coding in the i-th layer using both information related to the monaural signal and information related to the side signal based on the mode information and provide encoded information of the i-th layer.
модуль формирования информации режима формирует информацию режима из N битов, указывающую режим кодирования, с помощью каждого из битов; и
модуль кодирования i-го слоя выполняет монофоническое кодирование в i-м слое или выполняет стереофоническое кодирование в i-м слое на основе значения i-го бита информации режима.2. The stereo coding device according to claim 1, in which:
a mode information generating unit generates mode information from N bits indicating an encoding mode using each of the bits; and
the encoding module of the i-th layer performs monophonic encoding in the i-th layer or performs stereo coding in the i-th layer based on the value of the i-th bit of mode information.
модуль монофонического кодирования первого слоя, который, когда значение первого бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в первом слое с использованием монофонического сигнала и выводит искажение при кодировании, связанное с монофоническим сигналом в первом слое, и боковой сигнал в модуль кодирования второго слоя; и
модуль стереофонического кодирования первого слоя, который, когда значение первого бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в первом слое с использованием как монофонического сигнала, так и бокового сигнала и выводит искажение при кодировании, связанное с монофоническим сигналом в первом слое, и искажение при кодировании, связанное с боковым сигналом в первом слое, в модуль кодирования второго слоя.3. The stereo signal encoding device according to claim 2, wherein the first layer encoding module comprises:
a monophonic coding module of the first layer, which, when the value of the first bit of mode information indicates monophonic coding, performs monophonic coding in the first layer using a monophonic signal and outputs coding distortion associated with the monophonic signal in the first layer and a side signal to the coding module of the second layer ; and
a stereo coding module of the first layer, which, when the value of the first bit of mode information indicates stereo coding, performs stereo coding in the first layer using both a monaural signal and a side signal and outputs coding distortion associated with the monaural signal in the first layer and distortion when encoding, associated with a side signal in the first layer, to the encoding module of the second layer.
модуль монофонического кодирования n-го слоя, который, когда значение n-го бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в n-м слое с использованием информации, связанной с монофоническим сигналом, и выводит искажение при кодировании, связанное с монофоническим сигналом в n-м слое, и информацию, связанную с боковым сигналом, принимаемую в качестве ввода из (n-1)-го слоя, в модуль кодирования (n+1)-го слоя; и
модуль стереофонического кодирования n-го слоя, который, когда значение n-го бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в n-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, и выводит искажение при кодировании, связанное с монофоническим сигналом в n-м слое, и искажение при кодировании, связанное с боковым сигналом в n-м слое, в модуль кодирования (n+1)-го слоя.4. The encoding device for stereo signals according to claim 3, in which the encoding module of the nth (n = 2, 3, ..., N-1) layer contains:
a monophonic encoding module of the nth layer, which, when the value of the nth bit of the mode information indicates monophonic encoding, performs monophonic encoding in the nth layer using information associated with the monophonic signal and outputs coding distortion associated with the monophonic signal in the nth layer, and the information associated with the side signal, taken as input from the (n-1) th layer, into the coding module of the (n + 1) th layer; and
a stereo coding unit of the nth layer, which, when the value of the nth bit of the mode information indicates stereo coding, performs stereo coding in the nth layer using both information related to the monaural signal and information related to the side signal, and outputs the coding distortion associated with the monophonic signal in the nth layer, and the coding distortion associated with the side signal in the nth layer to the coding module of the (n + 1) th layer.
модуль монофонического кодирования N-го слоя, который, когда значение N-го бита информации режима указывает монофоническое кодирование, выполняет монофоническое кодирование в N-м слое с использованием информации, связанной с монофоническим сигналом; и модуль стереофонического кодирования N-го слоя, который, когда значение N-го бита информации режима указывает стереофоническое кодирование, выполняет стереофоническое кодирование в N-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом.5. The stereo signal encoding device according to claim 4, wherein the Nth layer encoding module comprises:
a monophonic coding module of the Nth layer, which, when the value of the Nth bit of mode information indicates monophonic coding, performs monophonic coding in the Nth layer using information associated with the monophonic signal; and a stereo coding unit of the Nth layer, which, when the value of the Nth bit of mode information indicates stereo coding, performs stereo coding in the Nth layer using both information related to the monaural signal and information associated with the side signal.
первый модуль преобразования, который преобразует информацию, связанную с монофоническим сигналом, в частотную область и предоставляет первый спектр;
второй модуль преобразования, который преобразует информацию, связанную с боковым сигналом, в частотную область и предоставляет второй спектр;
модуль интегрирования, который интегрирует первый спектр и второй спектр, чтобы предоставлять интегрированный спектр; и модуль кодирования спектра, который выполняет кодирование спектра в отношении интегрированного спектра.6. The stereo signal encoding device according to claim 5, in which the stereo encoding module of the i-th layer contains:
a first conversion module that converts information associated with the monophonic signal into the frequency domain and provides a first spectrum;
a second conversion module that converts information associated with the side signal into the frequency domain and provides a second spectrum;
an integration module that integrates the first spectrum and the second spectrum to provide an integrated spectrum; and a spectrum coding unit that performs spectrum coding with respect to the integrated spectrum.
приемный модуль, который принимает информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал;
модули декодирования слоев с первого по N-й, которые выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и
модуль вычисления суммы и разности, который вычисляет декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое.11. A device for decoding stereo signals, comprising:
a receiving module that receives mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of monophonic encoding and stereo encoding is performed when encoding is processed in i- m layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) of the stereo signal encoding device, which performs encoding using the signal of the first channel and the signal of the second channel, forming x stereo signal;
first to Nth layer decoding modules that perform monophonic decoding or stereo decoding using encoded information of the i-th layer based on mode information and provide the result of decoding the monaural signal in the i-th layer and the result of decoding the side signal in the i-th layer wherein the monaural signal is associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and
a sum and difference calculator that calculates a decoded signal of the first channel and a decoded signal of the second channel using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.
формируют монофонический сигнал, связанный с суммой сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал, и формируют боковой сигнал, связанный с разностью между сигналом первого канала и сигналом второго канала;
формируют информацию режима в расчете на слой, указывающую режим кодирования одного из монофонического кодирования и стереофонического кодирования; и
выполняют монофоническое кодирование в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) с помощью информации, связанной с монофоническим сигналом, или выполняют стереофоническое кодирование в i-м слое с помощью как информации, связанной с монофоническим сигналом, так и информации, связанной с боковым сигналом, на основе информации режима и предоставляют кодированную информацию i-го слоя.12. A method for encoding stereo signals, comprising the steps of:
form a monaural signal associated with the sum of the signal of the first channel and the signal of the second channel forming the stereo signal, and form a side signal associated with the difference between the signal of the first channel and the signal of the second channel;
generating mode information per layer indicating a coding mode of one of monophonic coding and stereo coding; and
perform monophonic coding in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) using the information associated with the monophonic signal, or perform stereo coding in the i-th layer with both the information associated with the monophonic signal and the information associated with the side signal based on the mode information provide encoded information of the ith layer.
принимают информацию режима и кодированную информацию слоев с первого по N-й, обнаруживаемую посредством обработки кодирования в слоях с первого по N-й, причем информация режима указывает, какое из монофонического кодирования и стереофонического кодирования выполняется при обработке кодирования в i-м слое (i=1, 2, …, N, где N - целое число, равное или превышающее 2) устройства кодирования стереофонических сигналов, которое выполняет кодирование с использованием сигнала первого канала и сигнала второго канала, образующих стереофонический сигнал;
выполняют монофоническое декодирование или стереофоническое декодирование с использованием кодированной информации i-го слоя на основе информации режима и предоставляют результат декодирования монофонического сигнала в i-м слое и результат декодирования бокового сигнала в i-м слое, причем монофонический сигнал связан с суммой сигнала первого канала и сигнала второго канала, а боковой сигнал связан с разностью между сигналом первого канала и сигналом второго канала; и
вычисляют декодированный сигнал первого канала и декодированный сигнал второго канала с использованием результата декодирования монофонического сигнала в N-м слое и результата декодирования бокового сигнала в N-м слое. 13. A method for decoding stereo signals, comprising the steps of:
receive mode information and encoded information of the first through Nth layers detected by encoding processing in the first through Nth layers, the mode information indicating which of the monophonic encoding and stereo encoding is performed in the encoding processing in the i-th layer (i = 1, 2, ..., N, where N is an integer equal to or greater than 2) a stereo signal encoding device that performs encoding using the signal of the first channel and the signal of the second channel forming a stereo signal l;
perform monophonic decoding or stereo decoding using the encoded information of the i-th layer based on the mode information and provide the result of decoding the monophonic signal in the i-th layer and the result of decoding the side signal in the i-th layer, the monaural signal being associated with the sum of the signal of the first channel and the signal of the second channel, and the side signal is associated with the difference between the signal of the first channel and the signal of the second channel; and
the decoded signal of the first channel and the decoded signal of the second channel are calculated using the result of decoding the monaural signal in the Nth layer and the result of decoding the side signal in the Nth layer.
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008072497 | 2008-03-19 | ||
JP2008-072497 | 2008-03-19 | ||
JP2008-274536 | 2008-10-24 | ||
JP2008274536 | 2008-10-24 |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2010138572A RU2010138572A (en) | 2012-03-27 |
RU2484542C2 true RU2484542C2 (en) | 2013-06-10 |
Family
ID=
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8386267B2 (en) | Stereo signal encoding device, stereo signal decoding device and methods for them | |
RU2764287C1 (en) | Method and system for encoding left and right channels of stereophonic sound signal with choosing between models of two and four subframes depending on bit budget | |
EP1876585B1 (en) | Audio encoding device and audio encoding method | |
EP1876586B1 (en) | Audio encoding device and audio encoding method | |
US8463414B2 (en) | Method and apparatus for estimating a parameter for low bit rate stereo transmission | |
EP2209114B1 (en) | Speech coding/decoding apparatus/method | |
EP2030199B1 (en) | Linear predictive coding of an audio signal | |
JP4583093B2 (en) | Bit rate extended speech encoding and decoding apparatus and method | |
JP5053849B2 (en) | Multi-channel acoustic signal processing apparatus and multi-channel acoustic signal processing method | |
WO2007052612A1 (en) | Stereo encoding device, and stereo signal predicting method | |
WO2007088853A1 (en) | Audio encoding device, audio decoding device, audio encoding system, audio encoding method, and audio decoding method | |
RU2463674C2 (en) | Encoding device and encoding method | |
WO2006022308A1 (en) | Multichannel signal coding equipment and multichannel signal decoding equipment | |
KR20090117876A (en) | Encoding device and encoding method | |
CN117136406A (en) | Combining spatial audio streams | |
US8271275B2 (en) | Scalable encoding device, and scalable encoding method | |
US20070253481A1 (en) | Scalable Encoder, Scalable Decoder,and Scalable Encoding Method | |
WO2006059567A1 (en) | Stereo encoding apparatus, stereo decoding apparatus, and their methods | |
EP1801783B1 (en) | Scalable encoding device, scalable decoding device, and method thereof | |
JP5313967B2 (en) | Bit rate extended speech encoding and decoding apparatus and method | |
US20080162148A1 (en) | Scalable Encoding Apparatus And Scalable Encoding Method | |
RU2484542C2 (en) | Device for encoding stereophonic signals, device for decoding stereophonic signals and methods realised by said devices | |
US9111527B2 (en) | Encoding device, decoding device, and methods therefor | |
WO2023198383A1 (en) | Method for quantizing line spectral frequencies | |
WO2018130742A1 (en) | Method for determining line spectral frequencies |