RU2383941C2

RU2383941C2 - Method and device for encoding and decoding audio signals

Info

Publication number: RU2383941C2
Application number: RU2008103314/09A
Authority: RU
Inventors: Хее Сук ПАНГ (KR); Хее Сук ПАНГ; Хиен О ОХ (KR); Хиен О ОХ; Донг Соо КИМ (KR); Донг Соо КИМ; Дзае Хиун ЛИМ (KR); Дзае Хиун ЛИМ; Йанг Вон ДЗУНГ (KR); Йанг Вон ДЗУНГ
Original assignee: ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date: 2005-06-30
Filing date: 2006-06-30
Publication date: 2010-03-10
Also published as: RU2008103314A

Abstract

FIELD: physics; acoustics.

SUBSTANCE: invention relates to audio signal processing and more specifically to a method and a device for encoding and decoding audio signals. The invention involves a step for receiving an audio signal which contains a reduced signal and a spatial information signal and if a header is included in the spatial information signal, a step for extracting configuration information from the header on which spatial information contained in the spatial information signal is extracted, and a step for converting the reduced signal to a multichannel signal using configuration information and spatial information. Accordingly, the header can be selectively included in the spatial information signal. If the header is repeatedly included in the spatial information signal, decoding spatial information becomes possible if the audio signal is played from a random position.

EFFECT: possibility of decoding audio signals from a random point by creating several headers selectively included in a spatial information signal.

8 cl, 9 dwg

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение относится к обработке аудиосигнала и, более конкретно, к способу и устройству для кодирования и декодирования аудиосигнала.The present invention relates to processing an audio signal, and more particularly, to a method and apparatus for encoding and decoding an audio signal.

Предшествующий уровень техникиState of the art

В целом, устройство кодирования аудиосигналов сжимает аудиосигнал в сведенный сигнал моно или стерео типа, вместо сжатия каждого канала многоканального аудиосигнала. Устройство кодирования аудиосигналов передает сжатый сведенный сигнал на устройство декодирования совместно с сигналом пространственной информации (или вспомогательным информационным сигналом) или сохраняет сжатый сведенный сигнал совместно с сигналом пространственной информации на носителе данных.In general, an audio encoding apparatus compresses an audio signal into a mono or stereo type mixed signal, instead of compressing each channel of a multi-channel audio signal. The audio signal encoding device transmits the compressed mixed signal to the decoding device together with the spatial information signal (or auxiliary information signal) or stores the compressed mixed signal together with the spatial information signal on the storage medium.

В этом случае сигнал пространственной информации, извлеченный при сведении многоканального аудиосигнала, используется при восстановлении исходного многоканального аудиосигнала из сжатого сведенного сигнала.In this case, the spatial information signal extracted from the multi-channel audio signal is used to reconstruct the original multi-channel audio signal from the compressed mixed signal.

Сигнал пространственной информации включает в себя заголовок и пространственную информацию. Кроме того, в заголовок включена информация конфигурации. Заголовок является информацией для интерпретирования пространственной информации.The spatial information signal includes a header and spatial information. In addition, configuration information is included in the header. The header is information for interpreting spatial information.

Устройство декодирования аудиосигналов декодирует пространственную информацию с использованием включенной в заголовок информации конфигурации. Включенная в заголовок информация конфигурации передается на устройство декодирования или сохраняется на носителе данных совместно с пространственной информацией.The audio signal decoding apparatus decodes spatial information using the configuration information included in the header. The configuration information included in the header is transmitted to a decoding device or stored on a storage medium together with spatial information.

Устройство кодирования аудиосигналов мультиплексирует закодированный сведенный сигнал с сигналом пространственной информации в форму битового потока, а затем передает мультиплексированный сигнал на устройство декодирования. Поскольку, в целом, информация конфигурации является неизменной, заголовок, включающий в себя информацию конфигурации, вставляется в битовый поток однократно. Так как информация конфигурации передается для однократной первоначальной вставки в аудиосигнал, устройство декодирования аудиосигналов имеет проблему при декодировании пространственной информации из-за отсутствия информации конфигурации в случае воспроизведения аудиосигнала из случайной временной точки. А именно, поскольку аудиосигнал воспроизводится из требуемой пользователем определенной временной точки, вместо воспроизведения с начальной части в случае трансляции, VOD (видео по требованию) или подобного, использование передающейся в аудиосигнале информации конфигурации невозможно. Следовательно, может быть невозможным и декодирование пространственной информации.The audio signal encoding device multiplexes the encoded downmix signal with the spatial information signal into a bitstream form, and then transmits the multiplexed signal to the decoding device. Since, in general, the configuration information is unchanged, a header including configuration information is inserted into the bitstream once. Since the configuration information is transmitted for a single initial insertion into the audio signal, the audio signal decoding apparatus has a problem in decoding spatial information due to the lack of configuration information in the case of reproducing the audio signal from a random time point. Namely, since the audio signal is reproduced from a specific time point required by the user, instead of playing from the initial part in the case of broadcasting, VOD (video on demand) or the like, it is not possible to use configuration information transmitted in the audio signal. Therefore, it may not be possible to decode spatial information.

Раскрытие изобретенияDisclosure of invention

Цель настоящего изобретения заключается в обеспечении способа и устройства для кодирования и декодирования аудиосигналов, декодирующих аудиосигнал посредством создания заголовка, выборочно включаемого в кадр сигнала пространственной информации.An object of the present invention is to provide a method and apparatus for encoding and decoding audio signals decoding an audio signal by creating a header selectively included in a spatial information signal frame.

Другая цель настоящего изобретения заключается в обеспечении способа и устройства для кодирования и декодирования аудиосигналов, декодирующих аудиосигнал даже в случае, если аудиосигнал воспроизводится устройством декодирования аудиосигналов из случайной точки, посредством создания множества заголовков, включенных в сигнал пространственной информации.Another objective of the present invention is to provide a method and apparatus for encoding and decoding audio signals decoding an audio signal even if the audio signal is reproduced by the random signal decoding apparatus of the audio signals by creating a plurality of headers included in the spatial information signal.

Для достижения этих и других преимуществ, а также в соответствии с целью настоящего изобретения, как воплощено и описано в широком аспекте, способ декодирования аудиосигналов согласно настоящему изобретению включает в себя этап приема аудиосигнала, включающего в себя сведенный сигнал и сигнал пространственной информации, если заголовок включен в сигнал пространственной информации, этап извлечения информации конфигурации из заголовка, этап извлечения пространственной информации, включенной в сигнал о пространственной информации, и этап преобразования сведенного сигнала в многоканальный сигнал с использованием информации конфигурации и пространственной информации.To achieve these and other advantages, and also in accordance with the purpose of the present invention, as embodied and described in a broad aspect, a method for decoding audio signals according to the present invention includes the step of receiving an audio signal including a mixed signal and a spatial information signal, if the header is included in the spatial information signal, the step of extracting configuration information from the header, the step of extracting spatial information included in the spatial information signal, and up converting the mixed signal into the multichannel signal using the spatial information and configuration information.

Краткое описание чертежейBrief Description of the Drawings

Фиг.1 изображает конфигурационную диаграмму аудиосигнала согласно одному варианту осуществления настоящего изобретения.Figure 1 depicts a configuration diagram of an audio signal according to one embodiment of the present invention.

Фиг.2 изображает конфигурационную диаграмму аудиосигнала согласно другому варианту осуществления настоящего изобретения.2 is a configuration diagram of an audio signal according to another embodiment of the present invention.

Фиг.3 изображает блок-схему устройства для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.Figure 3 depicts a block diagram of an apparatus for decoding audio signals according to one embodiment of the present invention.

Фиг.4 изображает блок-схему устройства для декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.4 is a block diagram of an apparatus for decoding audio signals according to another embodiment of the present invention.

Фиг.5 изображает графическое представление способа декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.5 is a graphical representation of a method for decoding audio signals according to one embodiment of the present invention.

Фиг.6 изображает графическое представление способа декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.6 is a graphical representation of a method for decoding audio signals according to another embodiment of the present invention.

Фиг.7 изображает графическое представление способа декодирования аудиосигналов согласно дополнительному варианту осуществления настоящего изобретения.7 is a graphical representation of an audio decoding method according to a further embodiment of the present invention.

Фиг.8 изображает графическое представление способа получения позиционной информации, представляющей количественный параметр, согласно одному варианту осуществления настоящего изобретения.FIG. 8 is a graphical representation of a method for obtaining positional information representing a quantitative parameter, according to one embodiment of the present invention.

Фиг.9 изображает графическое представление способа декодирования аудиосигналов согласно другому дополнительному варианту осуществления настоящего изобретения.FIG. 9 is a graphical representation of a method for decoding audio signals according to another further embodiment of the present invention.

Предпочтительные варианты осуществления изобретенияPreferred Embodiments

Далее даются ссылки на предпочтительные варианты осуществления настоящего изобретения, примеры которых проиллюстрированы на чертежах.The following are references to preferred embodiments of the present invention, examples of which are illustrated in the drawings.

Для понимания настоящего изобретения устройство и способ кодирования аудиосигналов разъясняются перед описанием устройства и способа декодирования аудиосигналов. Несмотря на это, устройство и способ декодирования согласно настоящему изобретению не ограничиваются следующим устройством и способом кодирования. Более того, настоящее изобретение применимо к схеме кодирования аудиосигналов для формирования многоканального сигнала с использованием пространственной информации, а также MP3 (MPEG 1/2-layer III) и AAC (усовершенствованное кодирование аудиосигнала).To understand the present invention, an apparatus and method for encoding audio signals are explained before describing a device and method for decoding audio signals. Despite this, the decoding apparatus and method according to the present invention is not limited to the following encoding apparatus and method. Moreover, the present invention is applicable to an audio coding scheme for generating a multi-channel signal using spatial information, as well as MP3 (MPEG 1/2-layer III) and AAC (advanced audio coding).

Фиг.1 изображает конфигурационную диаграмму аудиосигнала, передаваемого на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, согласно одному варианту осуществления настоящего изобретения.1 is a configuration diagram of an audio signal transmitted to an audio signal decoding apparatus from an audio signal encoding apparatus according to one embodiment of the present invention.

Изображенный на фиг.1 аудиосигнал включает в себя идентификатор 101 аудиосигнала, сведенный сигнал 103 и сигнал 105 пространственной информации.The audio signal shown in FIG. 1 includes an audio signal identifier 101, a flattened signal 103, and a spatial information signal 105.

При использовании схемы кодирования для воспроизведения аудиосигнала для трансляции или подобного, аудиосигнал может включать в себя вспомогательные данные, а также идентификатор 101 аудиосигнала и сведенный сигнал 103. Настоящее изобретение может включать в себя сигнал 105 пространственной информации в качестве вспомогательных данных. Для информирования устройства декодирования аудиосигналов об основной информации аудиокодека без анализа аудиосигнала, аудиосигнал может выборочно включать в себя идентификатор 101 аудиосигнала. Идентификатор 101 аудиосигнала состоит из небольшого объема основной информации, необходимой для декодирования аудиосигнала, такой как скорость передачи передаваемого аудиосигнала, количество каналов, частота выборки сжатых данных, идентификатор, указывающий на используемый в текущий момент аудиокодек, и т.п.When using a coding scheme for reproducing an audio signal for broadcast or the like, the audio signal may include auxiliary data as well as an audio signal identifier 101 and a mixed signal 103. The present invention may include a spatial information signal 105 as auxiliary data. To inform the audio decoding apparatus of the basic information of the audio codec without analyzing the audio signal, the audio signal may selectively include an audio identifier 101. The audio identifier 101 consists of a small amount of basic information necessary for decoding the audio signal, such as the transmission rate of the transmitted audio signal, the number of channels, the sampling rate of the compressed data, an identifier indicating the currently used audio codec, and the like.

С помощью идентификатора 101 аудиосигнала устройство декодирования аудиосигналов может быть информировано о типе используемого аудиосигналом кодека. В частности, с помощью идентификатора 101 аудиосигнала устройство декодирования аудиосигналов может быть информировано о том, является ли принятый аудиосигнал сигналом, восстанавливающим многоканальный сигнал с использованием сигнала 105 пространственной информации и сведенного сигнала 103. В этом случае многоканальный сигнал может включать в себя сигнал виртуального трехмерного объемного звучания, а также фактический многоканальный сигнал. С помощью технологии виртуального трехмерного объемного звучания аудиосигнал, содержащий сигнал 105 пространственной информации, объединенный со сведенным сигналом 103, сделан прослушиваемым через один или два канала.Using the identifier 101 of the audio signal, the audio decoding apparatus can be informed about the type of codec used by the audio signal. In particular, using the audio signal identifier 101, the audio signal decoding apparatus can be informed whether the received audio signal is a signal reconstructing a multi-channel signal using the spatial information signal 105 and the mixed signal 103. In this case, the multi-channel signal may include a virtual three-dimensional surround signal sounds as well as the actual multi-channel signal. Using virtual three-dimensional surround sound technology, an audio signal comprising a spatial information signal 105 combined with a mixed signal 103 is made audible through one or two channels.

Идентификатор 101 аудиосигнала располагается независимо от сведенного сигнала 103 или сигнала 105 пространственной информации, включенных в аудиосигнал. К примеру, идентификатор 101 аудиосигнала располагается в пределах отдельного поля, указывающего аудиосигнал.The audio signal identifier 101 is located independently of the combined signal 103 or spatial information signal 105 included in the audio signal. For example, the identifier 101 of the audio signal is located within a separate field indicating the audio signal.

В случае если заголовок не предусмотрен в сведенном сигнале 103, то устройство декодирования аудиосигналов может декодировать сведенный сигнал 103 с использованием идентификатора 101 аудиосигнала.If the header is not provided in the mixed signal 103, the audio signal decoding apparatus may decode the mixed signal 103 using the audio signal identifier 101.

Сведенный сигнал 103 является сигналом, сформированным при сведении многоканального сигнала. Сведенный сигнал 103 может быть либо сформирован в блоке сведения (не показан на чертеже) включенном в устройство кодирования аудиосигналов (не показан на чертеже), либо сформирован искусственно.The flattened signal 103 is a signal formed by mixing a multi-channel signal. The flattened signal 103 can either be generated in the information unit (not shown in the drawing) included in the audio signal encoding device (not shown in the drawing), or it can be generated artificially.

Сведенный сигнал 103 может классифицироваться на случай включения сигнала 105 пространственной информации и на случай невключения заголовка.The flattened signal 103 may be classified in the case of the inclusion of the spatial information signal 105 and in the case of not including the header.

В случае если сведенный сигнал 103 включает в себя заголовок, то заголовок включается в каждый блок от кадра к кадру. В случае если сведенный сигнал 103 не включает в себя заголовок, как упомянуто в предшествующем описании, то сведенный сигнал 103 может быть декодирован с использованием идентификатора 101 аудиосигнала посредством устройства декодирования аудиосигналов. Сведенный сигнал 103 принимает либо форму с включением заголовка для каждого кадра, либо форму без включения заголовка. Более того, сведенный сигнал 103 включается в аудиосигнал аналогичным способом до конца контента.If the mixed signal 103 includes a header, then the header is included in each block from frame to frame. If the mixed signal 103 does not include a header, as mentioned in the previous description, then the mixed signal 103 can be decoded using the identifier 101 of the audio signal by the audio decoding apparatus. The flattened signal 103 takes either a form with a header for each frame or a form without a header. Moreover, the mixed signal 103 is included in the audio signal in a similar manner to the end of the content.

Сигнал 105 пространственной информации также может либо включать в себя заголовок и пространственную информацию, либо может включать в себя пространственную информацию без заголовка. Заголовок сигнала 105 пространственной информации отличается от заголовка сведенного сигнала 103 тем, что он необязательно должен вставляться в каждый кадр идентичным образом. В частности, сигнал 105 пространственной информации может использовать кадр, включающий в себя заголовок, и кадр, не включающий в себя заголовок. Большая часть информации, включенной в заголовок сигнала 105 пространственной информации, является информацией конфигурации, которая декодирует пространственную информацию посредством интерпретирования пространственной информации.The spatial information signal 105 may also either include a header and spatial information, or may include spatial information without a header. The header of the spatial information signal 105 differs from the header of the mixed signal 103 in that it does not have to be inserted into each frame in the same way. In particular, the spatial information signal 105 may use a frame including a header and a frame not including a header. Most of the information included in the header of the spatial information signal 105 is configuration information that decodes the spatial information by interpreting the spatial information.

Фиг.2 изображает конфигурационную диаграмму аудиосигнала, передаваемого на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, согласно другому варианту осуществления настоящего изобретения.2 is a configuration diagram of an audio signal transmitted to an audio decoding apparatus from an audio encoding apparatus according to another embodiment of the present invention.

Изображенный на фиг.2 аудиосигнал включает в себя сведенный сигнал 103 и сигнал 105 пространственной информации. Более того, аудиосигнал имеет форму ES (элементарного потока) размещения кадров.The audio signal shown in FIG. 2 includes a flattened signal 103 and a spatial information signal 105. Moreover, the audio signal has the form of an ES (elementary stream) placement of frames.

Каждый сведенный сигнал 103 и сигнал 105 пространственной информации иногда передается в качестве отдельной формы ES на устройство декодирования аудиосигналов. Как сведенный сигнал 103, так и сигнал 105 пространственной информации, как изображено на фиг.2, могут быть объединены в одну форму ES, которая передается на устройство декодирования аудиосигналов.Each flattened signal 103 and spatial information signal 105 are sometimes transmitted as a separate ES form to an audio signal decoding apparatus. Both the flattened signal 103 and the spatial information signal 105, as shown in FIG. 2, can be combined into one ES form, which is transmitted to the audio signal decoding apparatus.

В случае если сведенный сигнал 103 и сигнал 105 пространственной информации, объединенные в одну форму ES, передаются на устройство декодирования аудиосигналов, то сигнал 105 пространственной информации может быть включен во вспомогательные данные (вспомогательные данные) или в дополнительные данные (данные расширения) сведенного сигнала 103.If the mixed signal 103 and the spatial information signal 105 combined into one ES form are transmitted to the audio signal decoding device, the spatial information signal 105 can be included in the auxiliary data (auxiliary data) or in the additional data (extension data) of the mixed signal 103 .

Более того, аудиосигнал может включать в себя идентификационную информацию сигнала, указывающую на то, объединен ли сигнал 105 пространственной информации со сведенным сигналом 103.Moreover, the audio signal may include signal identification information indicating whether the spatial information signal 105 is combined with the flattened signal 103.

Кадр сигнала 105 пространственной информации может включать в себя либо заголовок 201 и пространственную информацию 203, либо может включать в себя только пространственную информацию 203. В частности, сигнал 105 пространственной информации может использовать кадр, включающий в себя заголовок 201, совместно с кадром, не включающим в себя заголовок 201.The frame of the spatial information signal 105 may include either a header 201 and spatial information 203, or may include only spatial information 203. In particular, the spatial information signal 105 may use a frame including a header 201 in conjunction with a frame not including heading 201.

В настоящем изобретении заголовок 201 вставляется в сигнал 105 пространственной информации, по меньшей мере, однократно. В частности, устройство кодирования аудиосигналов может вставлять заголовок 201 в каждый кадр сигнала 105 пространственной информации, периодически вставлять заголовок 201 в каждый фиксированный интервал кадров в сигнале 105 пространственной информации или не периодически вставлять заголовок 201 в каждый случайный интервал кадров в сигнале 105 пространственной информации.In the present invention, a header 201 is inserted into the spatial information signal 105 at least once. In particular, the audio signal encoding apparatus may insert a header 201 into each frame of the spatial information signal 105, periodically insert the header 201 at each fixed frame interval in the spatial information signal 105, or not periodically insert the header 201 into each random frame interval in the spatial information signal 105.

Аудиосигнал может включать в себя информацию (в дальнейшем названную «идентификационная информация заголовка») указывающую на то, включен ли заголовок 201 в кадр 201.The audio signal may include information (hereinafter referred to as “header identification information”) indicating whether header 201 is included in frame 201.

В случае если заголовок 201 включен в сигнал 105 пространственной информации, то устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201, а затем декодирует пространственную информацию 203, передающуюся после заголовка 201, согласно информации 205 конфигурации. Поскольку заголовок 201 является информацией для декодирования посредством интерпретирования пространственной информации 203, заголовок 201 передается на раннем этапе передачи аудиосигнала.If the header 201 is included in the spatial information signal 105, the audio decoding apparatus extracts configuration information 205 from the header 201, and then decodes the spatial information 203 transmitted after the header 201 according to the configuration information 205. Since the header 201 is information for decoding by interpreting the spatial information 203, the header 201 is transmitted at an early stage of the transmission of the audio signal.

В случае если заголовок 201 не включен в сигнал 105 пространственной информации, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием заголовка 201, передаваемого на раннем этапе.If the header 201 is not included in the spatial information signal 105, then the audio signal decoding apparatus decodes the spatial information 203 using the header 201 transmitted at an early stage.

В случае потери заголовка 201 во время передачи аудиосигнала на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, либо в случае декодирования передаваемого в потоковом формате аудиосигнала с его средней части, используемой для трансляции или подобного, использование предварительно переданного заголовка 201 невозможно. В этом случае устройство для декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201, отличного от изначально вставленного в аудиосигнал вышеупомянутого заголовка 201, а затем может декодировать аудиосигнал с использованием извлеченной информации 205 конфигурации. В этом случае информация 205 конфигурации, извлеченная из вставленного в аудиосигнал заголовка 201, может быть идентична вышеупомянутой информации 205 конфигурации, извлеченной из заголовка 201, который был передан на раннем этапе.If the header 201 is lost during the transmission of the audio signal to the audio signal decoding device from the audio signal encoding device, or in the case of decoding the streamed audio signal from its middle part used for broadcast or the like, the previously transmitted header 201 is not possible. In this case, the device for decoding audio signals extracts configuration information 205 from a header 201 other than the aforementioned header 201 originally inserted into the audio signal, and then can decode the audio signal using the extracted configuration information 205. In this case, the configuration information 205 extracted from the header 201 inserted into the audio signal may be identical to the above configuration information 205 extracted from the header 201, which was transmitted at an early stage.

Если заголовок 201 является изменяемым, то информация 205 конфигурации извлекается из нового заголовка 201, извлеченная информация 205 конфигурации декодируется, а затем декодируется пространственная информация 203, переданная после заголовка 201. Если заголовок 201 является неизменяемым, то решается, идентичен ли новый заголовок 201 предварительно переданному старому заголовку 201. Если эти два заголовка 201 отличаются друг от друга, может быть обнаружено, что на пути передачи аудиосигнала в нем произошла ошибка.If the header 201 is mutable, then the configuration information 205 is retrieved from the new header 201, the extracted configuration information 205 is decoded, and then the spatial information 203 transmitted after the header 201 is decoded. If the header 201 is immutable, it is decided whether the new header 201 is identical to the previously transmitted old header 201. If these two headers 201 are different from each other, it may be found that an error occurred in the audio transmission path.

Информация 205 конфигурации, извлеченная из заголовка 201 сигнала 105 пространственной информации, является информацией для интерпретирования пространственной информации 203.Configuration information 205 extracted from the header 201 of the spatial information signal 105 is information for interpreting the spatial information 203.

Сигнал 105 пространственной информации может включать в себя информацию (в дальнейшем названную «информацией временного выравнивания) для определения разницы во времени задержки между двумя сигналами при формировании многоканального сигнала с использованием сведенного сигнала 103 и сигнала 105 пространственной информации с помощью устройства декодирования аудиосигналов.The spatial information signal 105 may include information (hereinafter referred to as “time alignment information”) for determining a difference in the delay time between the two signals when generating a multi-channel signal using the mixed signal 103 and the spatial information signal 105 using an audio signal decoding device.

Аудиосигнал, передаваемый на устройство декодирования аудиосигналов с устройства кодирования аудиосигналов, анализируется (синтаксически) блоком демультиплексирования (не показан на чертеже), а затем разделяется на сведенный сигнал 103 и сигнал 105 пространственной информации.The audio signal transmitted to the audio signal decoding apparatus from the audio signal encoding apparatus is analyzed (syntactically) by a demultiplexing unit (not shown in the drawing), and then divided into a mixed signal 103 and a spatial information signal 105.

Сведенный сигнал 103, отделенный блоком демультиплексирования, декодируется. Декодированный сведенный сигнал 103 формирует многоканальный сигнал с использованием сигнала 105 пространственной информации. При формировании многоканального сигнала посредством объединения сведенного сигнала 103 и сигнала 105 пространственной информации устройство декодирования аудиосигналов может подстроить синхронизацию между двумя сигналами, позицию начальной точки объединения двух сигналов и т.п. с использованием информации временного выравнивания (не показана на чертеже), включенной в информацию 205 конфигурации, извлеченную из заголовка 201 сигнала 105 пространственной информации.The flattened signal 103, separated by the demultiplexing unit, is decoded. The decoded downmix signal 103 generates a multi-channel signal using the spatial information signal 105. When generating a multi-channel signal by combining the mixed signal 103 and the spatial information signal 105, the audio signal decoding apparatus can adjust the synchronization between the two signals, the position of the starting point of the union of the two signals, and the like. using time alignment information (not shown in the drawing) included in the configuration information 205 extracted from the header 201 of the spatial information signal 105.

Позиционная информация 207 временного интервала, к которому будет применен параметр, включается в пространственную информацию 203, включенную в сигнал 105 пространственной информации. Пространственным параметром (пространственным признаком) могут являться CLD (разности уровней каналов), указывающие на разность энергии между аудиосигналами, ICC (межканальные помехи), указывающие на близость или сходство между аудиосигналами, CPC (коэффициенты предсказания канала), указывающие на коэффициент, предсказывающий параметр аудиосигнала с использованием других сигналов. В дальнейшем каждый пространственный признак или группа пространственных признаков будет называться «параметром».The position information 207 of the time interval to which the parameter will be applied is included in the spatial information 203 included in the spatial information signal 105. The spatial parameter (spatial sign) can be CLD (channel level differences), indicating the energy difference between the audio signals, ICC (inter-channel interference), indicating the proximity or similarity between the audio signals, CPC (channel prediction coefficients), indicating the coefficient predicting the audio signal parameter using other signals. In the future, each spatial feature or group of spatial features will be called a “parameter”.

В случае если N параметры присутствуют в кадре, включенном в сигнал 105 пространственной информации, то N параметров применяются к определенным позициям временного интервала кадров, соответственно. Если информация, указывающая параметр, будет применена к одному из временных интервалов, включенных в кадр, как позиционная информация 207 временного интервала, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием позиционной информации 207 временного интервала, к которому будет применен параметр. В этом случае параметр включается в пространственную информацию 203.If N parameters are present in the frame included in the spatial information signal 105, then N parameters are applied to certain positions of the frame time interval, respectively. If the information indicating the parameter is applied to one of the time intervals included in the frame as the position information of the time interval 207, the audio signal decoding apparatus decodes the spatial information 203 using the position information of the time interval 207 to which the parameter will be applied. In this case, the parameter is included in the spatial information 203.

Фиг.3 изображает структурную схему устройства для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения.FIG. 3 is a block diagram of an apparatus for decoding audio signals according to one embodiment of the present invention.

Изображенное на фиг.3 устройство для декодирования аудиосигналов согласно одному варианту осуществления настоящего изобретения включает в себя блок 301 приема и блок 303 извлечения.3, an apparatus for decoding audio signals according to one embodiment of the present invention includes a reception unit 301 and an extraction unit 303.

Блок 301 приема устройства декодирования аудиосигналов принимает аудиосигнал, передающийся в форме ES устройством кодирования аудиосигналов через вход IN1.An audio decoding apparatus reception unit 301 receives an audio signal transmitted in ES form by an audio encoding apparatus via an input IN1.

Аудиосигнал, принимаемый устройством декодирования аудиосигналов, включает в себя идентификатор 101 аудиосигнала и сведенный сигнал 103, а также может дополнительно включать в себя сигнал 105 пространственной информации в качестве вспомогательных данных (вспомогательные данные) или дополнительных данных (данные расширения).The audio signal received by the audio signal decoding apparatus includes an audio signal identifier 101 and a mixed signal 103, and may also further include a spatial information signal 105 as auxiliary data (auxiliary data) or additional data (extension data).

Блок 303 извлечения устройства декодирования аудиосигналов извлекает информацию 205 конфигурации из включенного в принятый аудиосигнал заголовка 201, а затем выводит извлеченную информацию 205 конфигурации через выход OUT1.The audio decoding apparatus extraction unit 303 extracts configuration information 205 from the header 201 included in the received audio signal, and then outputs the extracted configuration information 205 through the output OUT1.

Аудиосигнал может включать в себя идентификационную информацию заголовка для определения, включен ли заголовок 201 в кадр.The audio signal may include header identification information to determine if header 201 is included in the frame.

Устройство декодирования аудиосигналов определяет, включен ли заголовок 201 в кадр, с использованием включенной в аудиосигнал идентификационной информации заголовка. Если заголовок 201 включен в аудиосигнал, то устройство декодирования извлекает информацию 205 конфигурации из заголовка 201. В настоящем изобретении, по меньшей мере, один заголовок 201 включается в сигнал 105 пространственной информации.The audio decoding apparatus determines whether the header 201 is included in the frame using the header identification information included in the audio signal. If the header 201 is included in the audio signal, the decoding device extracts configuration information 205 from the header 201. In the present invention, at least one header 201 is included in the spatial information signal 105.

Изображенное на фиг.4 устройство для декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения включает в себя блок 301 приема, блок 401 демультиплексирования, основной блок 403 декодирования, блок 405 формирования многоканальных сигналов, блок 407 декодирования пространственной информации и блок 303 извлечения.4, an apparatus for decoding audio signals according to another embodiment of the present invention includes a receiving unit 301, a demultiplexing unit 401, a decoding main unit 403, a multi-channel signal generating unit 405, a spatial information decoding unit 407, and an extraction unit 303.

Блок 301 приема устройства декодирования аудиосигналов принимает аудиосигнал, передающийся в форме битового потока с устройства кодирования аудиосигналов, через вход IN2. Более того, блок 301 приема посылает принятый аудиосигнал на блок 401 демультиплексирования.An audio signal decoding device receiving unit 301 receives an audio signal transmitted in the form of a bit stream from an audio signal encoding device through an input IN2. Moreover, the reception unit 301 sends the received audio signal to the demultiplexing unit 401.

Блок 401 демультиплексирования разделяет посланный блоком 301 приема аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Блок 401 демультиплексирования передает отделенный от битового потока закодированный сведенный сигнал 103 на основной блок 403 декодирования, а также передает отделенный от битового потока закодированный сигнал 105 пространственной информации на блок 303 извлечения.The demultiplexing unit 401 divides the audio signal sent by the receiving unit 301 into an encoded downmix signal 103 and an encoded spatial information signal 105. The demultiplexing unit 401 transmits the encoded mixed signal 103 separated from the bitstream to the decoding main unit 403, and also transmits the encoded spatial information signal 105 separated from the bit stream to the extracting unit 303.

Закодированный сведенный сигнал 103 декодируется основным блоком 403 декодирования, а затем передается на блок 405 формирования многоканальных сигналов. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203.The encoded flattened signal 103 is decoded by the main decoding unit 403, and then transmitted to the multi-channel signal generating unit 405. The encoded spatial information signal 105 includes a header 201 and spatial information 203.

Если заголовок 201 включен в закодированный сигнал 105 пространственной информации, то блок 303 извлечения извлекает информацию 205 конфигурации из заголовка 201. Блок 303 извлечения может определить присутствие заголовка 201, использующего идентификационную информацию заголовка, включенную в аудиосигнал. В частности, идентификационная информация заголовка может отображать, включен ли заголовок 201 в кадр, включенный в сигнал 105 пространственной информации. Идентификационная информация заголовка может указать порядок кадра или битовую последовательность аудиосигнала, в который включена информация 205 конфигурации, извлеченная из заголовка 201, если заголовок 201 включен в кадр.If the header 201 is included in the encoded spatial information signal 105, then the extractor 303 extracts configuration information 205 from the header 201. The extractor 303 can determine the presence of the header 201 using the header identification information included in the audio signal. In particular, the header identification information may indicate whether the header 201 is included in the frame included in the spatial information signal 105. The header identification information may indicate the frame order or bit sequence of the audio signal in which the configuration information 205 extracted from the header 201 is included if the header 201 is included in the frame.

В случае определения через идентификационную информацию заголовка того, что заголовок 201 включен в кадр, блок 303 извлечения извлекает информацию 205 конфигурации из включенного в кадр заголовка 201. Затем извлеченная информация 205 конфигурации декодируется.If the header 201 is determined through the identification information that the header 201 is included in the frame, the extraction unit 303 extracts configuration information 205 from the header 201 included in the frame. Then, the extracted configuration information 205 is decoded.

Блок 407 декодирования пространственной информации декодирует включенную в кадр пространственную информацию 203 согласно декодированной информации 205 конфигурации.The spatial information decoding unit 407 decodes the spatial information 203 included in the frame according to the decoded configuration information 205.

Более того, блок 405 формирования многоканальных сигналов формирует многоканальный сигнал с использованием декодированного сведенного сигнала 103 и декодированной пространственной информации 203, а затем выводит сформированный многоканальный сигнал через выход OUT2.Moreover, the multi-channel signal generating unit 405 generates a multi-channel signal using the decoded flattened signal 103 and the decoded spatial information 203, and then outputs the generated multi-channel signal through the output OUT2.

Изображенное на фиг.5 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передающийся в форме битового потока с устройства кодирования аудиосигналов (этап S501).5, the audio signal decoding apparatus receives the spatial information signal 105 transmitted in the form of a bit stream from the audio encoding apparatus (step S501).

Как упомянуто в вышеизложенном описании, сигнал 105 пространственной информации может быть передан в качестве ES, отдельно от сведенного сигнала 103, а также может быть передан в связке со сведенным сигналом 103.As mentioned in the foregoing description, the spatial information signal 105 may be transmitted as an ES separately from the mixed signal 103, and may also be transmitted in conjunction with the mixed signal 103.

Блок 401 демультиплексирования аудиосигналов разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203. Если заголовок 201 включен в кадр сигнала 105 пространственной информации, то устройство декодирования аудиосигналов идентифицирует заголовок 201 (этап S503).An audio signal demultiplexing unit 401 splits the received audio signal into an encoded downmix signal 103 and an encoded spatial information signal 105. The encoded spatial information signal 105 includes a header 201 and spatial information 203. If the header 201 is included in the frame of the spatial information signal 105, the audio decoding apparatus identifies the header 201 (step S503).

Устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201 (этап S505).The audio signal decoding apparatus extracts configuration information 205 from the header 201 (step S505).

Более того, устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием извлеченной информации 205 конфигурации (этап S507).Moreover, the audio signal decoding apparatus decodes spatial information 203 using the extracted configuration information 205 (step S507).

Изображенное на фиг.6 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передаваемый в форме битового потока с устройства кодирования аудиосигналов (этап S501).The audio decoding apparatus shown in FIG. 6 receives the spatial information signal 105 transmitted in the form of a bit stream from the audio encoding apparatus (step S501).

Как упомянуто в вышеизложенном описании, сигнал 105 пространственной информации может быть передан в качестве ES, отдельно от сведенного сигнала 103, а также может быть передан в связке со вспомогательными данными или данными расширения сведенного сигнала 103.As mentioned in the foregoing description, the spatial information signal 105 may be transmitted as an ES separately from the mixed signal 103, and may also be transmitted in conjunction with auxiliary data or extension data of the mixed signal 103.

Блок демультиплексирования 401 аудиосигнала разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. Закодированный сигнал 105 пространственной информации включает в себя заголовок 201 и пространственную информацию 203. Устройство декодирования аудиосигналов определяет, включен ли заголовок 201 в кадр (этап S601).An audio demultiplexing unit 401 splits the received audio signal into an encoded downmix signal 103 and an encoded spatial information signal 105. The encoded spatial information signal 105 includes a header 201 and spatial information 203. The audio signal decoding apparatus determines whether the header 201 is included in the frame (step S601).

Если заголовок 201 включен в кадр, то устройство декодирования аудиосигналов идентифицирует заголовок 201 (этап S503).If the header 201 is included in the frame, the audio decoding apparatus identifies the header 201 (step S503).

Затем устройство декодирования аудиосигналов извлекает информацию 205 конфигурации из заголовка 201 (этап S505).Then, the audio signal decoding apparatus extracts configuration information 205 from the header 201 (step S505).

Устройство декодирования аудиосигналов определяет, является ли информация 205 конфигурации, извлеченная из заголовка 201, информацией 205 конфигурации, извлеченной из первого заголовка 201, включенного в сигнал 105 пространственной информации (этап S603).The audio signal decoding apparatus determines whether the configuration information 205 extracted from the header 201 is the configuration information 205 extracted from the first header 201 included in the spatial information signal 105 (step S603).

Если информация 205 конфигурации извлечена из ранее извлеченного из аудиосигнала заголовка 201, то устройство декодирования аудиосигналов декодирует информацию 205 конфигурации (этап S611), а также декодирует пространственную информацию 203, передаваемую после информации 205 конфигурации, согласно декодированной информации 205 конфигурации.If the configuration information 205 is extracted from the header 201 previously extracted from the audio signal, the audio signal decoding apparatus decodes the configuration information 205 (step S611), and also decodes the spatial information 203 transmitted after the configuration information 205 according to the decoded configuration information 205.

Если извлеченный из аудиосигнала заголовок 201 не является заголовком 201, извлеченным первым из сигнала 105 пространственной информации, то устройство декодирования аудиосигналов определяет, идентична ли информация 205 конфигурации, извлеченная из заголовка 201, информации 205 конфигурации, извлеченной из первого заголовка 201 (этап S605).If the header 201 extracted from the audio signal is not the header 201 extracted first from the spatial information signal 105, the audio signal decoding apparatus determines whether the configuration information 205 extracted from the header 201 is identical to the configuration information 205 extracted from the first header 201 (step S605).

Если информация 205 конфигурации идентична информации 205 конфигурации, извлеченной из первого заголовка 201, то устройство декодирования аудиосигналов декодирует пространственную информацию 203 с использованием декодированной информации 205 конфигурации, извлеченной из первого заголовка 201.If the configuration information 205 is identical to the configuration information 205 extracted from the first header 201, then the audio signal decoding apparatus decodes the spatial information 203 using the decoded configuration information 205 extracted from the first header 201.

Если извлеченная информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201, то устройство декодирования аудиосигналов определяет, произошла ли ошибка в аудиосигнале на пути передачи от устройства кодирования аудиосигналов до устройства декодирования аудиосигналов (этап S607).If the extracted configuration information 205 is not identical to the configuration information 205 extracted from the first header 201, then the audio decoding apparatus determines whether an error in the audio signal has occurred in the transmission path from the audio encoding apparatus to the audio decoding apparatus (step S607).

Если информация 205 конфигурации является изменяемой, то ошибка не происходит, даже в случае, если информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201. Следовательно, устройство декодирования аудиосигналов обновляет заголовок 201 в новый заголовок 201 (этап S609). Затем устройство декодирования аудиосигналов декодирует информацию 205 конфигурации, извлеченную из обновленного заголовка 201 (этап S611).If the configuration information 205 is mutable, then an error does not occur even if the configuration information 205 is not identical to the configuration information 205 extracted from the first header 201. Therefore, the audio decoding apparatus updates the header 201 to the new header 201 (step S609). Then, the audio signal decoding apparatus decodes the configuration information 205 extracted from the updated header 201 (step S611).

Устройство декодирования аудиосигналов декодирует пространственную информацию 203, передаваемую после информации 205 конфигурации, согласно декодированной информации 205 конфигурации.The audio signal decoding apparatus decodes spatial information 203 transmitted after the configuration information 205 according to the decoded configuration information 205.

Если неизменяемая информация 205 конфигурации не идентична информации 205 конфигурации, извлеченной из первого заголовка 201, это означает, что на пути передачи аудиосигнала произошла ошибка. Следовательно, устройство декодирования аудиосигналов либо удаляет включенную в кадр пространственную информацию 203, включая ошибочную информацию 205 конфигурации, либо исправляет ошибку пространственной информации 203 (этап S613).If the immutable configuration information 205 is not identical to the configuration information 205 extracted from the first header 201, this means that an error has occurred in the transmission path of the audio signal. Therefore, the audio signal decoding apparatus either deletes the spatial information 203 included in the frame, including erroneous configuration information 205, or corrects the spatial information error 203 (step S613).

Изображенное на фиг.7 устройство декодирования аудиосигналов принимает сигнал 105 пространственной информации, передаваемой в форме битового потока с устройства кодирования аудиосигналов (S501).The audio signal decoding apparatus shown in FIG. 7 receives the spatial information signal 105 transmitted in the form of a bit stream from the audio encoding apparatus (S501).

Блок 401 демультиплексирования аудиосигналов разделяет принятый аудиосигнал на закодированный сведенный сигнал 103 и закодированный сигнал 105 пространственной информации. В этом случае позиционная информация 207 временного интервала, к которому будет применен параметр, включается в сигнал 105 пространственной информации.An audio signal demultiplexing unit 401 splits the received audio signal into an encoded downmix signal 103 and an encoded spatial information signal 105. In this case, the position information 207 of the time interval to which the parameter will be applied is included in the spatial information signal 105.

Устройство декодирования аудиосигналов извлекает позиционную информацию 207 временного интервала из пространственной информации 203 (этап S701).The audio signal decoding apparatus extracts position information of a time interval 207 from the spatial information 203 (step S701).

Устройство декодирования аудиосигналов применяет параметр к соответствующему временному интервалу с помощью установления позиции временного интервала, к которому будет применен параметр, с использованием извлеченной позиционной информации временного интервала (этап S703).The audio signal decoding apparatus applies the parameter to the corresponding time interval by setting the position of the time interval to which the parameter will be applied using the extracted position information of the time interval (step S703).

Фиг.8 изображает графическое представление способа получения позиционной информации, представляющей количественный параметр, согласно одному варианту осуществления настоящего изобретения. Позиционная информация, представляющая количественный параметр временного интервала, является количеством битов, выделенных для представления позиционной информации 207 временного интервала.FIG. 8 is a graphical representation of a method for obtaining positional information representing a quantitative parameter, according to one embodiment of the present invention. The positional information representing the quantitative parameter of the time interval is the number of bits allocated to represent the positional information 207 of the time interval.

Позиционная информация, представляющая количественный параметр временного интервала, к которому применяется первый параметр, может быть найдена вычитанием количества параметров из количества временных интервалов, добавлением единицы к результату вычитания, вычислением логарифма по основанию 2 от результата сложения и применением функции ceil к значению логарифма. В частности, позиционная информация, представляющая количественный параметр временного интервала, к которому будет применен первый параметр, может быть найдена посредством ceil(log² (k-i+1)), где «k» и «i» - количество временных интервалов и количество параметров соответственно.Positional information representing the quantitative parameter of the time interval to which the first parameter is applied can be found by subtracting the number of parameters from the number of time intervals, adding one to the subtraction result, calculating the base 2 logarithm of the addition result and applying the ceil function to the logarithm value. In particular, positional information representing the quantitative parameter of the time interval to which the first parameter will be applied can be found using ceil (log ² (k-i + 1)), where “k” and “i” are the number of time intervals and the number parameters, respectively.

Предположим, что «N» является натуральным числом, позиционная информация, представляющая количественный параметр временного интервала, к которому будет применен (N+1)^ый параметр, представляется как позиционная информация 207 временного интервала, к которому применяется N^ыйпараметр. В этом случае позиционная информация 207 временного интервала, к которому применяется N^ый параметр, может быть найдена посредством добавления количества временных интервалов, присутствующих между временным интервалом, к которому применяется N^ый параметр, и временным интервалом, к которому применяется (N-1)^ый параметр, к позиционной информации временного интервала, к которому применяется (N-1)^ый параметр, и добавления единицы к результату сложения (этап S801). В частности, позиционная информация временного интервала, к которому будет применен (N+1)^ый параметр, может быть найдена посредством j(N)+r(N+1)+1, где r(N+1) указывает количество временных интервалов, присутствующих между временным интервалом, к которому применяется (N+1)^ый параметр, и временным интервалом, к которому применяется N^ый параметр.Assume that «N» is a natural number, positional information representing the quantity of the time interval which will be applied to the (N + 1) ^th parameter is represented as the positional information time slot 207, to which the N ^th parameter. In this case, the position information 207 a time slot to which the N ^th parameter can be found by adding the number of slots present between the time slot to which the N ^th parameter, and the time slot to which the (N-1) ^th the parameter, to the positional information of the time interval to which the (N-1) ^th parameter is applied, and adding one to the addition result (step S801). In particular, the positional information of the time interval to which the (N + 1) ^th parameter will be applied can be found by j (N) + r (N + 1) +1, where r (N + 1) indicates the number of time intervals, present between the time slot to which the (N + 1) ^th parameter, and the time slot to which the N ^th parameter.

Если позиционная информация 207 временного интервала, к которому применяется N^ый параметр, найдена, то может быть получена позиционная информация временного интервала, представляющая количественный параметр, представляющий позицию временного интервала, к которому применяется (N+1)^ый параметр. В частности, позиционная информация временного интервала, представляющая количественный параметр, представляющий позицию временного интервала, к которому применяется (N+1)^ый параметр, может быть найдена посредством вычитания количества применяемых к кадру параметров и позиционной информации временного интервала, к которому применяется N^ыйпараметр, из количества временных интервалов, и добавления (N+1) к результату вычитания (этап S803). В частности, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется (N+1)^ый параметр, может быть найдена посредством ceil(log₂ (k-i+N+1-j(N))), где «k», «i» и «j(N)» являются количеством временных интервалов, количеством параметров и позиционной информацией 205 временного интервала, к которому применяется N^ый параметр, соответственно.If the position information 207 time slot to which the N ^th parameter is found, the time slot position information representing a quantitative parameter can be obtained, representing the timeslot position to which the (N + 1) ^th parameter. In particular, the positional information time interval representing a quantitative parameter representing the position of time slot to which the (N + 1) ^th parameter may be found by subtracting the amount applied to the frame parameters and positional information time slot to which the N ^th parameter , from the number of time slots, and adding (N + 1) to the subtraction result (step S803). In particular, positional information representing a quantitative parameter of a time interval to which the (N + 1) ^th parameter is applied can be found by ceil (log ₂ (k-i + N + 1-j (N))), where “k »,« i »and« j (N) »is the number of slots, the number of parameters and positional information time slot 205, to which the N ^th parameter, respectively.

В случае получения позиционной информации, представляющей количественный параметр временного интервала, вышеупомянутым способом, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется (N+1)^ый параметр, имеет количество выделенных битов, обратно пропорциональное «N». А именно, позиционная информация, представляющая количественный параметр временного интервала, к которому применяется параметр, является переменным значением, зависящим от «N».In the case of obtaining positional information representing a quantitative parameter of a time interval in the aforementioned manner, positional information representing a quantitative parameter of a time interval to which the (N + 1) ^th parameter is applied has the number of allocated bits inversely proportional to “N”. Namely, positional information representing a quantitative parameter of a time interval to which the parameter is applied is a variable value depending on “N”.

Фиг.9 изображает графическое представление способа декодирования аудиосигналов согласно другому варианту осуществления настоящего изобретения.FIG. 9 is a graphical representation of an audio decoding method according to another embodiment of the present invention.

Устройство декодирования аудиосигналов принимает аудиосигнал от устройства кодирования аудиосигнала (этап S901). Аудиосигнал включает в себя идентификатор 101 аудиосигнала, сведенный сигнал 103 и сигнал 105 пространственной информации.An audio decoding apparatus receives an audio signal from an audio encoding apparatus (step S901). The audio signal includes an audio signal identifier 101, a mixed signal 103, and a spatial information signal 105.

Устройство декодирования аудиосигналов извлекает включенный в аудиосигнал идентификатор 101 аудиосигнала (этап S903). Идентификатор, указывающий аудиокодек, включен в идентификатор 101 аудиосигнала.The audio signal decoding apparatus extracts the audio signal identifier 101 included in the audio signal (step S903). An identifier indicating an audio codec is included in the identifier 101 of the audio signal.

Устройство декодирования аудиосигналов определяет, что аудиосигнал включает в себя сведенный сигнал 103 и сигнал 105 пространственной информации, используя идентификатор 101 аудиосигнала. В частности, устройство декодирования аудиосигналов может определить, что переданный аудиосигнал является сигналом для формирования многоканального сигнала, используя сигнал 105 пространственной информации (этап S905).The audio signal decoding apparatus determines that the audio signal includes a flattened signal 103 and a spatial information signal 105 using the audio signal identifier 101. In particular, the audio signal decoding apparatus can determine that the transmitted audio signal is a signal for generating a multi-channel signal using the spatial information signal 105 (step S905).

Более того, устройство декодирования аудиосигналов преобразует сведенный сигнал 103 в многоканальный сигнал, используя сигнал 105 пространственной информации. Как было упомянуто в вышеизложенном описании, заголовок 201 может быть включен в сигнал 105 пространственной информации с каждым предварительно определенным интервалом.Moreover, the audio signal decoding apparatus converts the mixed signal 103 into a multi-channel signal using the spatial information signal 105. As mentioned in the foregoing description, the header 201 may be included in the spatial information signal 105 at each predetermined interval.

Промышленная применимостьIndustrial applicability

Как упомянуто в вышеизложенном описании, способ и устройство для кодирования и декодирования аудиосигналов, согласно настоящему изобретению, могут сформировать заголовок, выборочно включаемый в сигнал пространственной информации.As mentioned in the foregoing description, a method and apparatus for encoding and decoding audio signals according to the present invention can form a header selectively included in a spatial information signal.

Более того, в случае если множество заголовков включено в сигнал пространственной информации, способ и устройство для кодирования и декодирования аудиосигналов, согласно настоящему изобретению, могут декодировать пространственную информацию, даже в случае если аудиосигнал воспроизводится устройством декодирования аудиосигналов из случайной точки.Moreover, if a plurality of headers are included in the spatial information signal, the method and apparatus for encoding and decoding audio signals according to the present invention can decode spatial information even if the audio signal is reproduced by the audio signal decoding apparatus from a random point.

Несмотря на то что настоящее изобретение было описано и проиллюстрировано в настоящем документе со ссылкой на предпочтительные варианты осуществления, специалистам в данной области техники будет очевидно, что в изобретении могут быть сделаны различные модификации и изменения, не отступая от сущности и объема изобретения. Таким образом, настоящее изобретение охватывает модификации и изменения, которые находятся в рамках приложенной формулы изобретения и ее эквивалентов.Although the present invention has been described and illustrated herein with reference to preferred embodiments, it will be apparent to those skilled in the art that various modifications and changes can be made to the invention without departing from the spirit and scope of the invention. Thus, the present invention encompasses modifications and changes that are within the scope of the appended claims and their equivalents.

Claims

1. A method of decoding an audio signal, comprising stages in which:
receiving an audio signal and header identification information indicating whether the header is included in the auxiliary signal, wherein the audio signal includes a mixed signal and said auxiliary signal;
retrieving configuration information from the header if the header is included in the auxiliary signal according to the header identification information;
decoding the audio signal based on the configuration information, wherein the configuration information includes at least one of time alignment information and position information of a time interval,
wherein the time equalization information indicates a time delay between the auxiliary signal and the mixed signal if an auxiliary signal embedded in the mixed signal is transmitted.

2. The method according to claim 1, in which the auxiliary signal includes at least one header in each preset time or space interval.

3. The method according to claim 1, in which the auxiliary signal indicates a spatial information signal.

4. The method according to claim 3, further comprising applying the parameter included in the spatial information signal to the corresponding time interval using the positional information of the corresponding time interval included in the spatial information signal.

5. The method of claim 3, wherein the audio signal includes signal identification information indicating whether the spatial information signal is combined with the flattened signal.

6. The method according to claim 1, further comprising identifying the starting position of the auxiliary signal frame using time alignment information.

7. A method for decoding an audio signal comprising the steps of:
receiving an audio signal and header identification information indicating whether the header is included in the auxiliary signal, wherein the audio signal includes a mixed signal and said auxiliary signal;
if the first header is not included in the auxiliary signal according to the header identification information, then an audio signal is decoded based on the configuration information of the second header, the second header being transmitted before the first header,
wherein the configuration information includes at least one of time alignment information and position information of a time interval,
wherein the time equalization information indicates a time delay between the auxiliary signal and the mixed signal if an auxiliary signal embedded in the mixed signal is transmitted.

8. A device for decoding an audio signal containing
a receiving unit receiving an audio signal and header identification information indicating whether the header is included in the auxiliary signal, wherein the audio signal includes a mixed signal and said auxiliary signal;
an extraction unit extracting configuration information from the header if the header is included in the auxiliary signal according to the header identification information;
a multi-channel signal generating unit decoding an audio signal based on configuration information,
wherein the configuration information includes at least one of time alignment information and position information of a time interval,
wherein the time equalization information indicates a time delay between the auxiliary signal and the mixed signal if an auxiliary signal embedded in the mixed signal is transmitted.
Priority on points:

06/30/2005 according to claims 1, 7, 8;

06/02/2006 according to claim 2;

06/22/2006 according to claims 3-6.