RU2380767C2 - Method and device for audio signal decoding - Google Patents

Method and device for audio signal decoding Download PDF

Info

Publication number
RU2380767C2
RU2380767C2 RU2008114388/09A RU2008114388A RU2380767C2 RU 2380767 C2 RU2380767 C2 RU 2380767C2 RU 2008114388/09 A RU2008114388/09 A RU 2008114388/09A RU 2008114388 A RU2008114388 A RU 2008114388A RU 2380767 C2 RU2380767 C2 RU 2380767C2
Authority
RU
Russia
Prior art keywords
channel
spatial information
audio signal
formula
spatial
Prior art date
Application number
RU2008114388/09A
Other languages
Russian (ru)
Other versions
RU2008114388A (en
Inventor
Хее Сук ПАНГ (KR)
Хее Сук ПАНГ
Хиен О ОХ (KR)
Хиен О ОХ
Дзае Хиун ЛИМ (KR)
Дзае Хиун ЛИМ
Донг Соо КИМ (KR)
Донг Соо КИМ
Йанг Вон ДЗУНГ (KR)
Йанг Вон ДЗУНГ
Original Assignee
ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ЭлДжи ЭЛЕКТРОНИКС ИНК. filed Critical ЭлДжи ЭЛЕКТРОНИКС ИНК.
Publication of RU2008114388A publication Critical patent/RU2008114388A/en
Application granted granted Critical
Publication of RU2380767C2 publication Critical patent/RU2380767C2/en

Links

Images

Landscapes

  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

FIELD: information technologies.
SUBSTANCE: method includes receiving audio signal and spatial information, creation of modified spatial information using spatial information and audio signal decoding using modified spatial information. In this process modified spatial information includes at least one thing from partial spatial information, combined spatial information and extended spatial information. At the same time, audio signal is decoded into configuration that differs from configuration defined by decoder. Even when number of loudspeakers is less or greater than multiple channels number before execution of lowering mixing, it is possible to form output channels from lowering mixing audio signal in the quantity equal to the number of loudspeakers.
EFFECT: providing audio signal generation with configuration that differs from predefined tree-shaped configuration by shaping variously configured output signals; and significant decrease in load of operations required for audio signal decoding.
18 cl, 17 dwg

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение относится к обработке аудиосигналов, а более конкретно, к устройству декодирования аудиосигнала и способу для этого. Хотя настоящее изобретение применимо для широкого диапазона применений, оно конкретно применимо для декодирования аудиосигналов.The present invention relates to the processing of audio signals, and more particularly, to an audio decoding apparatus and method thereof. Although the present invention is applicable to a wide range of applications, it is particularly applicable to decoding audio signals.

Уровень техникиState of the art

В общем, когда кодер кодирует аудиосигнал, в случае если аудиосигнал, который должен быть закодирован, является многоканальным аудиосигналом, многоканальный аудиосигнал через понижающее микширование преобразуется на два канала или один канал, чтобы сформировать аудиосигнал понижающего микширования, и из многоканального аудиосигнала извлекается пространственная информация. Пространственная информация - это информация, используемая при повышающем микшировании многоканального аудиосигнала из аудиосигнала понижающего микширования. Между тем, кодер выполняет понижающее микширование многоканального аудиосигнала согласно заранее определенной древовидной конфигурации. В этом случае заранее определенной древовидной конфигурацией может быть структура(ы), согласованная между декодером аудиосигнала и кодером аудиосигнала. В частности, если идентификационная информация, указывающая тип одной из заранее определенных древовидных конфигураций, присутствует, декодер может знать структуру аудиосигнала, для которого выполняется повышающее микширование, к примеру число каналов, позицию каждого из каналов и т.д.In general, when an encoder encodes an audio signal, in case the audio signal to be encoded is a multi-channel audio signal, the multi-channel audio signal is downmixed to two channels or one channel to generate a down-mix audio signal, and spatial information is extracted from the multi-channel audio signal. Spatial information is information used to up-mix a multi-channel audio signal from a down-mix audio signal. Meanwhile, the encoder down-mixes the multi-channel audio signal according to a predetermined tree configuration. In this case, the predetermined tree configuration may be the structure (s) agreed between the audio decoder and the audio encoder. In particular, if identification information indicating the type of one of the predetermined tree configurations is present, the decoder may know the structure of the audio signal for which upmixing is performed, for example, the number of channels, the position of each channel, etc.

Таким образом, если кодер выполняет понижающее микширование многоканального сигнала согласно заранее определенной древовидной конфигурации, пространственная информация, извлекаемая в этом процессе, также зависит от структуры. Таким образом, в случае если декодер выполняет повышающее микширование аудиосигнала понижающего микширования с помощью пространственной информации, зависимой от структуры, то формируется многоканальный аудиосигнал согласно упомянутой структуре. То есть в случае, если декодер использует пространственную информацию, сформированную кодером, как есть, повышающее микширование выполняется согласно структуре, согласованной только между кодером и декодером. Таким образом, невозможно сформировать аудиосигнал выходного канала, если не следовать согласованной структуре. Например, невозможно выполнить повышающее микширование сигнала в аудиосигнал, имеющий номер канала, отличающийся (меньше или больше) от числа каналов, определенных согласно согласованной структуре.Thus, if the encoder down-mixes the multi-channel signal according to a predetermined tree configuration, the spatial information extracted in this process also depends on the structure. Thus, in the event that the decoder up-mixes the down-mix audio signal using spatial information dependent on the structure, a multi-channel audio signal is generated according to the structure. That is, if the decoder uses the spatial information generated by the encoder, as it is, up-mix is performed according to the structure agreed only between the encoder and the decoder. Thus, it is not possible to generate an audio signal of an output channel unless a consistent structure is followed. For example, it is not possible to up-mix a signal into an audio signal having a channel number different (less or more) from the number of channels determined according to the agreed structure.

Сущность изобретенияSUMMARY OF THE INVENTION

Следовательно, настоящее изобретение направлено на устройство декодирования аудиосигнала и способ для этого, которые во многом устраняют одну или более проблем, обусловленных ограничениями и недостатками предшествующего уровня техники.Therefore, the present invention is directed to an apparatus for decoding an audio signal and a method for this, which largely eliminates one or more problems due to limitations and disadvantages of the prior art.

Цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть декодирован так, чтобы иметь структуру, отличающуюся от определенной кодером.An object of the present invention is to provide an audio signal decoding apparatus and method for doing this, by means of which an audio signal can be decoded so as to have a structure different from that defined by the encoder.

Другая цель настоящего изобретения заключается в том, чтобы предоставить устройство декодирования аудиосигнала и способ для этого, посредством которых аудиосигнал может быть декодирован с помощью пространственной информации, сформированной из модификации предыдущей пространственной информации, сформированной из кодирования.Another object of the present invention is to provide an audio signal decoding apparatus and a method for doing this, by means of which an audio signal can be decoded using spatial information generated from a modification of previous spatial information generated from encoding.

Дополнительные признаки и преимущества изобретения будут изложены в последующем описании и частично должны явствовать из описания или могут быть изучены при практическом использовании изобретения. Цели и другие преимущества изобретения должны быть реализованы и достигнуты посредством структуры, в частности, раскрытой в письменном описании и формуле изобретения, а также на прилагаемых чертежах.Additional features and advantages of the invention will be set forth in the description that follows, and in part will be apparent from the description, or may be learned by practice of the invention. The objectives and other advantages of the invention should be realized and achieved through the structure, in particular, disclosed in the written description and claims, as well as in the accompanying drawings.

Чтобы достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, осуществленным и подробно описанным в данном документе, способ декодирования аудиосигнала согласно настоящему изобретению включает в себя прием аудиосигнала и пространственной информации, идентификацию типа модифицированной пространственной информации, формирование модифицированной пространственной информации с использованием пространственной информации и декодирование аудиосигнала с использованием модифицированной пространственной информации, при этом тип модифицированной пространственной информации включает в себя, по меньшей мере, одно из частичной пространственной информации, комбинированной пространственной информации и расширенной пространственной информации.In order to achieve these and other advantages in accordance with the purpose of the present invention, implemented and described in detail herein, an audio signal decoding method according to the present invention includes receiving an audio signal and spatial information, identifying a type of modified spatial information, generating modified spatial information using spatial information and decoding an audio signal using modified spatial information, the type of modified spatial information includes at least one of the partial spatial information, the combined spatial information and the extended spatial information.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием пространственной информации, формирование комбинированной пространственной информации с использованием пространственной информации и декодирование аудиосигнала с использованием комбинированной пространственной информации, при этом комбинированная пространственная информация формируется посредством комбинирования пространственных параметров, включенных в пространственную информацию.To further achieve these and other advantages in accordance with the purpose of the present invention, a method for decoding an audio signal includes receiving spatial information, generating combined spatial information using spatial information, and decoding an audio signal using combined spatial information, wherein the combined spatial information is generated by combining spatial parameters included in the space actual information.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием пространственной информации, включающей в себя, по меньшей мере, одну пространственную информацию, и информации пространственной фильтрации, включающей в себя, по меньшей мере, один параметр фильтрации, формирование комбинированной пространственной информации, имеющей эффект объемного звучания, посредством комбинирования пространственного параметра и параметра фильтрации и преобразование аудиосигнала в виртуальный сигнал объемного звучания с использованием комбинированной пространственной информации.To further achieve these and other advantages in accordance with the purpose of the present invention, a method for decoding an audio signal includes receiving spatial information including at least one spatial information and spatial filtering information including at least one filtering parameter, the formation of combined spatial information having surround sound effect by combining the spatial parameter and the filtering parameter and converting the audio signal and the virtual surround signal using the combined spatial information.

Чтобы дополнительно достичь этих и других преимуществ в соответствии с назначением настоящего изобретения, способ декодирования аудиосигнала включает в себя прием аудиосигнала, прием пространственной информации, включающей в себя информацию древовидной конфигурации и пространственные параметры, формирование модифицированной пространственной информации посредством добавления расширенной пространственной информации к пространственной информации и повышающее микширование аудиосигнала с использованием модифицированной пространственной информации, которое содержит включение преобразования аудиосигнала в первичный подвергнутый повышающему микшированию аудиосигнал на основе пространственной информации и преобразования первичного подвергнутого повышающему микшированию аудиосигнала во вторичный подвергнутый повышающему микшированию аудиосигнал на основе расширенной пространственной информации.To further achieve these and other advantages in accordance with the purpose of the present invention, an audio decoding method includes receiving an audio signal, receiving spatial information including tree configuration information and spatial parameters, generating modified spatial information by adding extended spatial information to the spatial information, and upmixing audio using modified space information, which comprises including converting the audio signal to a primary up-mixed audio signal based on spatial information and converting the primary up-mixed audio signal to a secondary up-mixed audio signal based on the extended spatial information.

Следует понимать, что вышеприведенное общее описание и последующее подробное описание являются примерными и пояснительными и предназначены для того, чтобы предоставить дополнительное пояснение изобретения согласно формуле изобретения.It should be understood that the foregoing general description and the following detailed description are exemplary and explanatory and are intended to provide further explanation of the invention according to the claims.

Краткое описание чертежейBrief Description of the Drawings

Прилагаемые чертежи, которые включены для того, чтобы обеспечить дополнительное понимание изобретения, и включены, и составляют часть данного подробного описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат, чтобы объяснять принципы изобретения.The accompanying drawings, which are included to provide an additional understanding of the invention and are included and form part of this detailed description, illustrate embodiments of the invention and together with the description serve to explain the principles of the invention.

На чертежах:In the drawings:

фиг.1 - блок-схема устройства кодирования аудиосигналов и устройства декодирования аудиосигналов согласно настоящему изобретению;FIG. 1 is a block diagram of an audio signal encoding apparatus and an audio signal decoding apparatus according to the present invention; FIG.

фиг.2 - схематичное представление примера применения частичной пространственной информации;figure 2 - schematic representation of an example of the application of partial spatial information;

фиг.3 - схематичное представление другого примера применения частичной пространственной информации;figure 3 - schematic representation of another example of the application of partial spatial information;

фиг.4 - схематичное представление дополнительного примера применения частичной пространственной информации;4 is a schematic representation of a further example of the application of partial spatial information;

фиг.5 - схематичное представление примера применения комбинированной пространственной информации;5 is a schematic representation of an example of the application of combined spatial information;

фиг.6 - схематичное представление другого примера применения комбинированной пространственной информации;6 is a schematic representation of another example of the application of combined spatial information;

фиг.7 - схема путей звука от громкоговорителей к слушателю, на которой показаны позиции громкоговорителей;7 is a diagram of the paths of sound from the speakers to the listener, which shows the position of the speakers;

фиг.8 - схема для пояснения сигнала, выводимого из каждой позиции громкоговорителя для эффекта объемного звучания;Fig. 8 is a diagram for explaining a signal output from each speaker position for a surround effect;

фиг.9 - концептуальная схема для пояснения способа формирования 3-канального сигнала с помощью 5-канального сигнала;Fig.9 is a conceptual diagram for explaining a method for generating a 3-channel signal using a 5-channel signal;

фиг.10 - схема примера конфигурирования расширенных каналов на основе конфигурационной информации расширенных каналов;10 is a diagram of an example configuration of extended channels based on configuration information of extended channels;

фиг.11 - схема для пояснения конфигурации расширенных каналов, показанной на фиг.10, и взаимосвязь с расширенным пространственным параметром;11 is a diagram for explaining the configuration of the extended channels shown in figure 10, and the relationship with the expanded spatial parameter;

фиг.12 - схема позиций многоканального аудиосигнала для 5.1-каналов и аудиосигнала выходного канала для 6.1-каналов;12 is a position diagram of a multi-channel audio signal for 5.1 channels and an output channel audio signal for 6.1 channels;

фиг.13 - схема для пояснения взаимосвязи между позицией виртуального источника звука и разностью уровней между двумя каналами;13 is a diagram for explaining the relationship between the position of the virtual sound source and the level difference between the two channels;

фиг.14 - схема для пояснения уровней двух задних каналов и уровня заднего центрального канала;14 is a diagram for explaining levels of two rear channels and a level of a rear center channel;

Фиг.15 - схема для пояснения позиции многоканального аудиосигнала для 5.1-каналов и позиции аудиосигнала выходного канала для 7.1-каналов;Fig. 15 is a diagram for explaining a position of a multi-channel audio signal for 5.1 channels and a position of an audio signal of an output channel for 7.1 channels;

фиг.16 - схема для пояснения уровней двух левых каналов и уровня левого переднего бокового канала (Lfs); и16 is a diagram for explaining levels of two left channels and a level of a left front side channel (Lfs); and

фиг.17 - это схема для пояснения уровней трех передних каналов и уровня левого переднего бокового канала (Lfs).17 is a diagram for explaining levels of three front channels and a level of a left front side channel (Lfs).

Оптимальный режим осуществления изобретенияOptimum Mode for Carrying Out the Invention

Далее приводится подробное описание предпочтительных вариантов осуществления настоящего изобретения, примеры которых проиллюстрированы на прилагаемых чертежах.The following is a detailed description of preferred embodiments of the present invention, examples of which are illustrated in the accompanying drawings.

Общие термины, глобально используемые в настоящее время, выбираются в качестве терминов в настоящем изобретении. Кроме того, предусмотрены термины, произвольно выбранные заявителем для специальных случаев, подробное значение которых поясняется детально в описании предпочтительных вариантов осуществления настоящего изобретения. Следовательно, настоящее изобретение следует понимать не с названиями терминов, а со значениями терминов.General terms that are currently globally used are selected as terms in the present invention. In addition, terms are provided that are arbitrarily selected by the applicant for special cases, the detailed meaning of which is explained in detail in the description of the preferred embodiments of the present invention. Therefore, the present invention should not be understood with the names of the terms, but with the meanings of the terms.

Во-первых, настоящее изобретение формирует модифицированную пространственную информацию с помощью пространственной информации, а затем декодирует аудиосигнал с помощью сформированной модифицированной пространственной информации. В этом случае пространственная информация - это пространственная информация, извлеченная в ходе понижающего микширования согласно заранее определенной древовидной конфигурации, а модифицированная пространственная информация - это пространственная информация, вновь сформированная с помощью пространственной информации.First, the present invention generates modified spatial information using spatial information, and then decodes the audio signal using the generated modified spatial information. In this case, spatial information is spatial information extracted during the downmix according to a predetermined tree configuration, and modified spatial information is spatial information newly generated using spatial information.

Настоящее изобретение подробно поясняется со ссылкой на фиг.1 следующим образом.The present invention is explained in detail with reference to figure 1 as follows.

Фиг.1 - это блок-схема устройства кодирования аудиосигналов и устройства декодирования аудиосигналов согласно варианту осуществления настоящего изобретения.FIG. 1 is a block diagram of an audio signal encoding apparatus and an audio signal decoding apparatus according to an embodiment of the present invention.

Ссылаясь на фиг.1, устройство 100 кодирования аудиосигнала (далее сокращенно устройство кодирования) включает в себя блок 110 понижающего микширования и блок 120 извлечения пространственной информации. Помимо этого, устройство 200 декодирования аудиосигнала (далее сокращенно устройство декодирования) включает в себя блок 210 формирования выходного сигнала и блок 220 формирования модифицированной пространственной информации.Referring to FIG. 1, an audio signal encoding apparatus 100 (hereinafter abbreviated as encoding apparatus) includes a downmix unit 110 and a spatial information extraction unit 120. In addition, the audio signal decoding apparatus 200 (hereinafter abbreviated decoding apparatus) includes an output signal generating unit 210 and a modified spatial information generating unit 220.

Блок 110 понижающего микширования устройства 100 кодирования формирует аудиосигнал d понижающего микширования посредством понижающего микширования многоканального аудиосигнала IN_M. Аудиосигналом d понижающего микширования может быть сигнал, сформированный из понижающего микширования многоканального аудиосигнала IN_M посредством блока 110 понижающего микширования, или произвольный аудиосигнал понижающего микширования, произвольно сформированный пользователем из понижающего микширования многоканального аудиосигнала IN_M.The down-mix unit 110 of the encoding apparatus 100 generates the down-mix audio signal d by down-mix the multi-channel audio signal IN_M. The down-mix audio signal d may be a signal generated from the down-mix of the multi-channel audio signal IN_M by the down-mix unit 110, or an arbitrary down-mix audio signal arbitrarily generated by the user from the down-mix of the multi-channel audio signal IN_M.

Блок 120 извлечения пространственной информации устройства 100 кодирования извлекает пространственную информацию s из многоканального аудиосигнала IN_M. В этом случае пространственная информация - это информация, требуемая для того, чтобы выполнить повышающее или понижающее микширование аудиосигнала d в многоканальный аудиосигнал IN_M.The spatial information extraction unit 120 of the encoding apparatus 100 extracts the spatial information s from the multi-channel audio signal IN_M. In this case, the spatial information is the information required to perform the up or down mixing of the audio signal d into the multi-channel audio signal IN_M.

Пространственной информацией может быть информация, извлеченная в ходе понижающего микширования многоканального аудиосигнала IN_M согласно заранее определенной древовидной конфигурации. В этом случае древовидная конфигурация может соответствовать древовидной(ым) конфигурации(ям), согласованной(ым) между устройствами декодирования и кодирования аудиосигналов, которая не ограничивается настоящим изобретением.The spatial information may be information extracted during down-mixing of the multi-channel audio signal IN_M according to a predetermined tree configuration. In this case, the tree configuration may correspond to the tree configuration (s) agreed upon between the audio decoding and encoding devices, which is not limited to the present invention.

Помимо этого, пространственная информация может включать в себя информацию древовидной конфигурации, индикатор, пространственные параметры и т.п. Информация древовидной конфигурации - это информация типа древовидной конфигурации. Таким образом, число каналов в многоканальной конфигурации, последовательность понижающего микширования на канал и т.п. варьируются согласно типу древовидной конфигурации. Индикатор - это информация, указывающая то, присутствует расширенная пространственная информация или нет, и т.п. Помимо этого, пространственные параметры могут включать в себя разность канальных уровней (далее сокращенно CLD) в ходе понижающего микширования, по меньшей мере, двух каналов в самое большее два канала, межканальную корреляцию или когерентность (далее сокращенно ICC), коэффициенты прогнозирования каналов (далее сокращенно CPC) и т.п.In addition, spatial information may include tree configuration information, an indicator, spatial parameters, and the like. Tree configuration information is information such as a tree configuration. Thus, the number of channels in a multi-channel configuration, the down-mix sequence per channel, etc. vary according to the type of tree configuration. An indicator is information indicating whether extended spatial information is present or not, etc. In addition, the spatial parameters may include the difference of the channel levels (hereinafter abbreviated CLD) during down-mixing of at least two channels to at most two channels, inter-channel correlation or coherence (hereinafter abbreviated ICC), channel prediction coefficients (hereinafter abbreviated) CPC), etc.

Блок 120 извлечения пространственной информации может дополнительно извлекать расширенную пространственную информацию, а также пространственную информацию. В этом случае расширенная пространственная информация - это информация, требуемая для того, чтобы дополнительно расширять аудиосигнал d понижающего микширования, подвергнутый повышающему микшированию с помощью пространственного параметра. Помимо этого, расширенная пространственная информация может включать в себя конфигурационную информацию расширенных каналов и расширенные пространственные параметры. Расширенная пространственная информация, которая поясняется ниже, не ограничена информацией, извлекаемой посредством блока 120 извлечения пространственной информации.The spatial information extraction unit 120 may further retrieve the extended spatial information as well as the spatial information. In this case, the expanded spatial information is the information required to further expand the downmix audio signal d subjected to upmixing using the spatial parameter. In addition, the extended spatial information may include extended channel configuration information and extended spatial parameters. The extended spatial information, which is explained below, is not limited to information retrieved by the spatial information extraction unit 120.

Помимо этого, устройство 100 кодирования может дополнительно включать в себя блок кодирования с помощью базового кодека (не показан на чертеже), формирующий поток битов аудио, полученный через понижающее микширование, посредством декодирования аудиосигнала понижающего микширования d, блок кодирования пространственной информации (не показан на чертеже), формирующий поток битов пространственной информации посредством кодирования пространственной информации s, и блок мультиплексирования (не показан на чертеже), формирующий поток битов аудиосигнала посредством мультиплексирования потока битов аудио, полученного через понижающее микширование, и потока битов пространственной информации, на который настоящее изобретение не накладывает ограничений.In addition, the encoding device 100 may further include a coding unit using a basic codec (not shown in the drawing) generating an audio bitstream obtained through downmixing by decoding the downmix audio signal d, a spatial information encoding unit (not shown in the drawing) ), forming a spatial information bitstream by encoding spatial information s, and a multiplexing unit (not shown in the drawing), forming ay bitstream iosignala by multiplexing a bitstream of audio obtained by downmixing, and spatial information bitstream, on which the present invention imposes no restrictions.

Кроме того, устройство 200 декодирования дополнительно может включать в себя блок демультиплексирования (не показан на чертеже), разделяющий поток битов аудиосигнала на поток битов аудио, полученный через понижающее микширование, и поток битов пространственной информации, блок декодирования с помощью базового кодека (не показан на чертеже), декодирующий поток битов аудио, полученный через понижающее микширование, и блок декодирования пространственной информации (не показан на чертеже), декодирующий поток битов пространственной информации, на который настоящее изобретение не накладывает ограничений.In addition, the decoding apparatus 200 may further include a demultiplexing unit (not shown in the drawing) dividing the audio signal bitstream into an audio bitstream obtained through downmixing and a spatial information bitstream, a decoding unit using a base codec (not shown in figure), a decoding audio bitstream obtained through down-mixing, and a spatial information decoding unit (not shown in the drawing), decoding a spatial information bitstream and to which the present invention is not limited.

Блок 220 формирования модифицированной пространственной информации устройства 200 декодирования идентифицирует тип модифицированной пространственной информации с помощью пространственной информации и затем формирует модифицированную пространственную информацию s' типа, который идентифицируется на основе пространственной информации. В этом случае пространственной информацией может быть пространственная информация s, переносимая из устройства 100 кодирования. Помимо этого, модифицированная пространственная информация - это информация, которая вновь сформирована с помощью пространственной информации.The modified spatial information generating unit 220 of the decoding apparatus 200 identifies the type of modified spatial information using the spatial information and then generates the modified spatial information s' of the type that is identified based on the spatial information. In this case, the spatial information may be spatial information s carried from the encoding device 100. In addition, modified spatial information is information that is newly generated using spatial information.

Могут существовать различные типы модифицированной пространственной информации. Кроме того, различные типы модифицированной пространственной информации могут включать в себя, по меньшей мере, одно из: a) частичной пространственной информации, b) комбинированной пространственной информации и c) расширенной пространственной информации, на которые настоящее изобретение не накладывает ограничений.Various types of modified spatial information may exist. In addition, various types of modified spatial information may include at least one of: a) partial spatial information, b) combined spatial information, and c) extended spatial information, to which the present invention is not limited.

Частичная пространственная информация включает в себя частичные пространственные параметры, комбинированная пространственная информация формируется из комбинирования пространственных параметров, а расширенная пространственная информация формируется с помощью пространственной информации и расширенной пространственной информации.Partial spatial information includes partial spatial parameters, combined spatial information is generated from a combination of spatial parameters, and extended spatial information is generated using spatial information and extended spatial information.

Блок 220 формирования модифицированной пространственной информации формирует модифицированную пространственную информацию способом, который может варьироваться согласно типу модифицированной пространственной информации. Помимо этого, способ формирования модифицированной пространственной информации по каждому типу модифицированной пространственной информации подробнее поясняется ниже.The modified spatial information generating unit 220 generates the modified spatial information in a manner that can vary according to the type of the modified spatial information. In addition, the method for generating modified spatial information for each type of modified spatial information is explained in more detail below.

Опорные данные для определения типа модифицированной пространственной информации могут соответствовать древовидной конфигурационной информации в пространственной информации, индикатору в пространственной информации, информации выходного канала и т.п. Древовидная конфигурационная информация и индикатор могут быть включены в пространственную информацию s от устройства кодирования. Информация выходного канала - это информация для громкоговорителей, взаимодействующих с устройством 200 декодирования, и она может включать в себя число выходных каналов, информацию позиции для каждого выходного канала и т.п. Информация выходного канала может быть введена заранее производителем или введена пользователем.The reference data for determining the type of modified spatial information may correspond to tree-like configuration information in spatial information, an indicator in spatial information, output channel information, and the like. Tree configuration information and an indicator may be included in the spatial information s from the encoding device. The output channel information is information for speakers interacting with the decoding device 200, and it may include the number of output channels, position information for each output channel, and the like. The output channel information can be entered in advance by the manufacturer or entered by the user.

Ниже подробно поясняется способ определения типа модифицированной пространственной информации с помощью этих типов информации.The method for determining the type of modified spatial information using these types of information is explained in detail below.

Блок 210 формирования выходного канала устройства 200 декодирования формирует аудиосигнал OUT_N выходного канала из аудиосигнала d понижающего микширования с помощью модифицированной пространственной информации s'.The output channel generating unit 210 of the decoding apparatus 200 generates an output channel audio signal OUT_N from the down-mix audio signal d using the modified spatial information s ′.

Информация 230 пространственного фильтра - это информация для путей звука, и она предоставляется в блок 220 формирования модифицированной пространственной информации. В случае если блок 220 формирования модифицированной пространственной информации формирует комбинированную пространственную информацию, имеющую эффект объемного звучания, может быть использована информация пространственной фильтрации.The spatial filter information 230 is information for sound paths, and it is provided to the modified spatial information generating unit 220. If the modified spatial information generating unit 220 generates combined spatial information having a surround effect, spatial filtering information may be used.

Далее поясняется способ декодирования аудиосигнала посредством формирования модифицированной пространственной информации по типу модифицированной пространственной информации в порядке (1) частичная пространственная информация, (2) комбинированная пространственная информация и (3) более детализированная пространственная информация.Next, a method for decoding an audio signal by generating modified spatial information by the type of modified spatial information in the order of (1) partial spatial information, (2) combined spatial information and (3) more detailed spatial information is explained.

(1) Частичная пространственная информация(1) Partial spatial information

Поскольку пространственные параметры вычисляются в ходе понижающего микширования многоканального аудиосигнала согласно заранее определенной древовидной конфигурации, исходный многоканальный аудиосигнал до понижающего микширования может быть восстановлен, если аудиосигнал понижающего микширования декодируется с помощью нетронутых пространственных параметров. В случае попытки сделать число N каналов аудиосигнала выходного канала меньше числа M каналов многоканального аудиосигнала, можно декодировать аудиосигнал понижающего микширования посредством частичного применения пространственных параметров.Since the spatial parameters are calculated during down-mixing of the multi-channel audio signal according to a predetermined tree configuration, the original multi-channel audio signal before down-mixing can be restored if the down-mixing audio signal is decoded using intact spatial parameters. In an attempt to make the number N of channels of the audio signal of the output channel less than the number M of channels of the multi-channel audio signal, the down-mix audio signal can be decoded by partially applying spatial parameters.

Этот способ может варьироваться согласно порядку и способу понижающего микширования многоканального аудиосигнала в устройстве кодирования, т.е. типу древовидной конфигурации. Также тип древовидной конфигурации может быть запрошен с помощью древовидной конфигурационной информации из пространственной информации. Помимо этого, данный способ может варьироваться согласно числу выходных каналов. Более того, можно запрашивать число выходных каналов с помощью информации выходных каналов.This method may vary according to the order and method of down-mixing the multi-channel audio signal in the encoding device, i.e. type of tree configuration. Also, the type of tree configuration can be requested using the tree configuration information from spatial information. In addition, this method may vary according to the number of output channels. Moreover, it is possible to query the number of output channels using the output channel information.

Затем, в случае если число каналов аудиосигнала выходного канала меньше числа каналов многоканального аудиосигнала, способ декодирования аудиосигнала посредством применения частичной пространственной информации, включающей в себя частичные пространственные параметры, поясняется посредством рассмотрения различных древовидных конфигураций в качестве примеров в нижеследующем описании.Then, if the number of channels of the audio signal of the output channel is less than the number of channels of the multi-channel audio signal, a method for decoding an audio signal by applying partial spatial information including partial spatial parameters is explained by considering various tree configurations as examples in the following description.

(1)-1. Первый пример древовидной конфигурации (древовидная конфигурация 5-2-5)(1) -1. The first tree configuration example (tree configuration 5-2-5)

Фиг.2 - это схематичное представление примера применения частичной пространственной информации.Figure 2 is a schematic representation of an example of the application of partial spatial information.

В левой части фиг.2 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания Ls, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания Rs), в полученные через понижающее микширование стереоканалы Lo и Ro, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.The left side of FIG. 2 shows a down-mix sequence of a multi-channel audio signal having 6 channels (left front channel L, left surround channel L s , center channel C, low-frequency channel LFE, right front channel R, right surround channel R s ) into the stereo channels L o and R o obtained through down-mixing, and the relationship between the multi-channel audio signal and spatial parameters.

Во-первых, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания Ls, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания Rs. В этом первичном процессе понижающего микширования формируются левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt. Помимо этого, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD2 (включая ICC2), CLD1 (включая ICC1), CLD0 (включая ICC0) и т.д.First, down-mixing is performed between the left channel L and the left surround channel L s , down-mixing between the center channel C and the low frequency channel LFE, and down-mixing between the right channel R and the right surround channel R s . In this primary downmix process, a left aggregate channel L t , a central aggregate channel C t, and a right aggregate channel R t are formed . In addition, the spatial parameters computed in this primary downmix process include CLD 2 (including ICC 2 ), CLD 1 (including ICC 1 ), CLD 0 (including ICC 0 ), etc.

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала Lt, центрального совокупного канала Ct и правого совокупного канала Rt, чтобы сформировать левый канал Lo и правый канал Ro. Помимо этого, пространственные параметры, вычисляемые в этом вторичном процессе понижающего микширования, могут включать в себя CLDTTT, CPCTTT, ICCTTT и т.д.In the secondary process following the primary downmix process, joint downmixing of the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t is performed to form the left channel L o and the right channel R o . In addition, the spatial parameters computed in this secondary downmix process may include CLD TTT , CPC TTT , ICC TTT , etc.

Другими словами, понижающее микширование многоканального сигнала из всего шести каналов выполняется вышеописанным последовательным способом, чтобы сформировать полученные через понижающее микширование стереоканалы Lo и Ro.In other words, the down-mix of a multi-channel signal from a total of six channels is performed in the sequential manner described above to form stereo channels L o and R o obtained through down-mix.

Если пространственные параметры (CLD2, CLD1, CLD0, CLDTTT и т.д.), вычисленные вышеописанным последовательным способом, используются как есть, их повышающее микширование выполняется в обратной последовательности порядку понижающего микширования, чтобы сформировать многоканальный аудиосигнал, имеющий число каналов 6 (левый передний канал L, левый канал объемного звучания Ls, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания Rs).If the spatial parameters (CLD 2 , CLD 1 , CLD 0 , CLD TTT , etc.) calculated as described above are used as they are, their up-mix is performed in the reverse order of the down-mix order to form a multi-channel audio signal having the number of channels 6 (left front channel L, left surround channel L s , center channel C, low-frequency channel LFE, right front channel R, right surround channel R s ).

Согласно правой части фиг.2, в случае если частичная пространственная информация соответствует CLDTTT из пространственных параметров (CLD2, CLD1, CLD0, CLDTTT и т.д.), выполняется повышающее микширование в левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt. Если левый совокупный канал Lt и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов Lt и Rt. Если левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов Lt, Ct и Rt. После того как повышающее микширование выполнено с помощью CLD1 помимо прочего, если выбраны левый совокупный канал Lt, правый совокупный канал Rt, центральный канал C и низкочастотный канал LFE, можно сформировать аудиосигнал выходного канала из четырех каналов (Lt, Rt, C и LFE).According to the right side of FIG. 2, in case partial spatial information corresponds to CLD TTT from spatial parameters (CLD 2 , CLD 1 , CLD 0 , CLD TTT , etc.), upmixing to the left aggregate channel L t , central aggregate is performed channel C t and right aggregate channel R t . If the left aggregate channel L t and the right aggregate channel R t are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel from the two channels L t and R t . If the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel from the three channels L t , C t and R t . After the upmix is done with CLD 1, among other things, if the left aggregate channel L t , the right aggregate channel R t , the center channel C and the low frequency channel LFE are selected, the audio signal of the output channel of the four channels (L t , R t , C and LFE).

(1)-2. Второй пример древовидной конфигурации (древовидная конфигурация 5-1-5)(1) -2. The second example of a tree configuration (tree configuration 5-1-5)

Фиг.3 - это схематичное представление другого примера применения частичной пространственной информации.Figure 3 is a schematic representation of another example of the application of partial spatial information.

В левой части фиг.3 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания Ls, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания Rs), в моноаудиосигнал M, полученный через понижающее микширование, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.The left side of FIG. 3 shows the down-mix sequence of a multi-channel audio signal having 6 channels (left front channel L, left surround channel L s , center channel C, low frequency channel LFE, right front channel R, right surround channel R s ) , into the mono audio signal M obtained through the down-mix, and the relationship between the multi-channel audio signal and the spatial parameters.

Во-первых, как и в первом примере, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания Ls, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания Rs. В этом первичном процессе понижающего микширования формируются левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt. Кроме того, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD3 (включая ICC3), CLD4 (включая ICC4), CLD5 (включая ICC5) и т.д. (в этом случае CLDx и ICCx отличаются от предшествующего CLDx в первом примере).First, as in the first example, down-mixing is performed between the left channel L and the left surround channel L s , down-mixing between the center channel C and the low-frequency channel LFE, and down-mixing between the right channel R and the right surround channel R s . In this primary downmix process, a left aggregate channel L t , a central aggregate channel C t, and a right aggregate channel R t are formed . In addition, the spatial parameters computed in this primary downmix process include CLD 3 (including ICC 3 ), CLD 4 (including ICC 4 ), CLD 5 (including ICC 5 ), etc. (in this case, CLD x and ICC x are different from the previous CLD x in the first example).

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала Lt и правого совокупного канала Rt, чтобы сформировать левый центральный канал LC, и выполняется совместное понижающее микширование центрального совокупного канала Ct и правого совокупного канала Rt, чтобы сформировать правый центральный канал RC. Помимо этого, пространственные параметры, вычисляемые в этом вторичном процессе понижающего микширования, могут включать в себя CLD2 (включая ICC2), CLD1 (включая ICC1) и т.д.In the secondary process following the primary downmix process, a joint downmix of the left aggregate channel L t and the right aggregate channel R t is performed to form the left center channel LC, and a joint downmix of the central aggregate channel C t and the right aggregate channel R t is performed to form the right center RC channel. In addition, the spatial parameters calculated in this secondary downmix process may include CLD 2 (including ICC 2 ), CLD 1 (including ICC 1 ), etc.

После этого в третичном процессе понижающего микширования выполняется понижающее микширование левого центрального канала LC и правого центрального канала RC, чтобы сформировать моносигнал M, полученный через понижающее микширование. Также пространственные параметры, вычисленные в третичном процессе понижающего микширования, включают в себя CLD0 (включая ICC0) и т.д.Thereafter, in the tertiary downmix process, downmixing of the left center channel LC and the right center channel RC is performed to form a mono signal M obtained through downmix. Also, the spatial parameters calculated in the tertiary downmix process include CLD 0 (including ICC 0 ), etc.

Согласно правой части фиг.3, в случае если частичная пространственная информация соответствует CLD0 из пространственных параметров (CLD3, CLD4, CLD5, CLD1, CLD2, CLD0 и т.д.), формируются левый центральный канал LC и правый центральный канал RC. Если левый центральный канал LC и правый центральный канал RC выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов LC и RC.According to the right side of FIG. 3, in case partial spatial information corresponds to CLD 0 from the spatial parameters (CLD 3 , CLD 4 , CLD 5 , CLD 1 , CLD 2 , CLD 0 , etc.), the left center channel LC and right center channel RC. If the left center LC channel and the right center RC channel are selected as the output channel audio signal, the output channel audio signal from the two LC and RC channels can be generated.

Если частичная пространственная информация соответствует CLD0, CLD1 и CLD2 из пространственных параметров (CLD3, CLD4, CLD5, CLD1, CLD2, CLD0 и т.д.), формируются левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt.If the partial spatial information corresponds to CLD 0 , CLD 1 and CLD 2 from the spatial parameters (CLD 3 , CLD 4 , CLD 5 , CLD 1 , CLD 2 , CLD 0 , etc.), the left aggregate channel L t , the central aggregate channel C t and right aggregate channel R t .

Если левый совокупный канал Lt и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов Lt и Rt. Если левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов Lt, Ct и Rt.If the left aggregate channel L t and the right aggregate channel R t are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel from the two channels L t and R t . If the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel from the three channels L t , C t and R t .

В случае если частичная пространственная информация включает в себя CLD4 помимо прочего, после того как выполнено повышающее микширование до центрального канала и низкочастотного канала LFE, если левый совокупный канал Lt, правый совокупный канал Rt, центральный канал C и низкочастотный канал LFE выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из четырех каналов (Lt, Rt, C и LFE).If the partial spatial information includes CLD 4, among other things, after up-mixing to the center channel and the low frequency channel LFE is performed, if the left aggregate channel L t , the right aggregate channel R t , the center channel C and the low frequency channel LFE are selected in As the audio signal of the output channel, it is possible to generate the audio signal of the output channel of four channels (L t , R t , C and LFE).

(1)-3. Третий пример древовидной конфигурации (древовидная конфигурация 5-1-5)(1) -3. The third tree configuration example (tree configuration 5-1-5)

Фиг.4 - это схематичное представление дополнительного примера применения частичной пространственной информации.4 is a schematic representation of a further example of the application of partial spatial information.

В левой части фиг.4 показаны последовательность понижающего микширования многоканального аудиосигнала, имеющего число каналов 6 (левый передний канал L, левый канал объемного звучания Ls, центральный канал C, низкочастотный канал LFE, правый передний канал R, правый канал объемного звучания Rs), в моноаудиосигнал M, полученный через понижающее микширование, и взаимосвязь между многоканальным аудиосигналом и пространственными параметрами.The left side of FIG. 4 shows a down-mix sequence of a multi-channel audio signal having 6 channels (left front channel L, left surround channel L s , center channel C, low frequency channel LFE, right front channel R, right surround channel R s ) , into the mono audio signal M obtained through the down-mix, and the relationship between the multi-channel audio signal and the spatial parameters.

Во-первых, как в первом и втором примере, выполняется понижающее микширование между левым каналом L и левым каналом объемного звучания Ls, понижающее микширование между центральным каналом C и низкочастотным каналом LFE и понижающее микширование между правым каналом R и правым каналом объемного звучания Rs. В этом первичном процессе понижающего микширования левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt формируются. Кроме того, пространственные параметры, вычисляемые в этом первичном процессе понижающего микширования, включают в себя CLD1 (включая ICC1), CLD2 (включая ICC2), CLD3 (включая ICC3) и т.д. (в этом случае CLDx и ICCx отличаются от предшествующих CLDx и ICCx в первом или втором примере).First, as in the first and second examples, down-mix is performed between the left channel L and the left surround channel L s , down-mixes between the center channel C and the low-frequency channel LFE, and down-mix between the right channel R and the right surround channel R s . In this primary downmix process, a left aggregate channel L t , a central aggregate channel C t, and a right aggregate channel R t are formed. In addition, the spatial parameters calculated in this primary downmix process include CLD 1 (including ICC 1 ), CLD 2 (including ICC 2 ), CLD 3 (including ICC 3 ), etc. (in this case, CLD x and ICC x are different from the previous CLD x and ICC x in the first or second example).

Во вторичном процессе, следующем после первичного процесса понижающего микширования, выполняется совместное понижающее микширование левого совокупного канала Lt, центрального совокупного канала Ct и правого совокупного канала Rt, чтобы сформировать левый центральный канал LC и правый центральный канал RC. Кроме того, вычисляется пространственный параметр CLDTTT (включая ICCTTT).In the secondary process following the primary downmix process, joint downmixing of the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t is performed to form the left center channel LC and the right center channel RC. In addition, the spatial parameter CLD TTT (including ICC TTT ) is calculated.

После этого в третичном процессе понижающего микширования выполняется понижающее микширование левого центрального канала LC и правого канала R, чтобы сформировать моносигнал M, полученный через понижающее микширование. Также вычисляется пространственный параметр CLD0 (включая ICC0).Thereafter, in the tertiary downmix process, downmixing of the left center channel LC and the right channel R is performed to form a mono signal M obtained through downmix. The spatial parameter CLD 0 (including ICC 0 ) is also calculated.

Согласно правой части фиг.4, в случае если частичная пространственная информация соответствует CLD0 и CLDTTT из пространственных параметров (CLD1, CLD2, CLD3, CLDTTT, CLD0 и т.д.), формируется левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt.According to the right side of FIG. 4, in case partial spatial information corresponds to CLD 0 and CLD TTT from spatial parameters (CLD 1 , CLD 2 , CLD 3 , CLD TTT , CLD 0 , etc.), the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t .

Если левый совокупный канал Lt и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из двух каналов Lt и Rt.If the left aggregate channel L t and the right aggregate channel R t are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel from the two channels L t and R t .

Если левый совокупный канал Lt, центральный совокупный канал Ct и правый совокупный канал Rt выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из трех каналов Lt, Ct и Rt.If the left aggregate channel L t , the central aggregate channel C t and the right aggregate channel R t are selected as the audio signal of the output channel, an audio signal of the output channel from the three channels L t , C t and R t can be generated.

В случае если частичная пространственная информация включает в себя CLD2 помимо прочего, после того как выполнено повышающее микширование до центрального канала C и низкочастотного канала LFE, если левый совокупный канал Lt, правый совокупный канал Rt, центральный канал C и низкочастотный канал LFE выбраны в качестве аудиосигнала выходного канала, можно сформировать аудиосигнал выходного канала из четырех каналов (Lt, Rt, C и LFE).In the case where the partial spatial information includes CLD 2, among other things, after the upmix to the center channel C and the low frequency channel LFE is performed, if the left aggregate channel L t , the right aggregate channel R t , the center channel C and the low frequency channel LFE are selected as the audio signal of the output channel, it is possible to generate an audio signal of the output channel of four channels (L t , R t , C and LFE).

В вышеприведенном описании процесс формирования аудиосигнала выходного канала посредством только частичного применения пространственных параметров пояснен посредством использования трех типов древовидных конфигураций в качестве примеров. Помимо этого, также можно дополнительно применять комбинированную пространственную информацию или расширенную пространственную информацию, как и частичную пространственную информацию. Таким образом, можно обрабатывать процесс применения модифицированной пространственной информации к аудиосигналу иерархически или совместно и синтетически.In the above description, the process of generating an output channel audio signal by only partially applying spatial parameters is explained by using three types of tree configurations as examples. In addition, it is also possible to additionally apply combined spatial information or extended spatial information, as well as partial spatial information. Thus, it is possible to process the process of applying the modified spatial information to the audio signal hierarchically or jointly and synthetically.

(2) Комбинированная пространственная информация(2) Combined spatial information

Поскольку пространственная информация вычисляется в ходе понижающего микширования многоканального аудиосигнала согласно заранее определенной древовидной конфигурации, исходный многоканальный аудиосигнал до понижающего микширования может быть восстановлен, если аудиосигнал понижающего микширования декодируется с помощью пространственных параметров пространственной информации, как они есть. В случае если число каналов M многоканального аудиосигнала отличается от числа каналов N аудиосигнала выходного канала, новая комбинированная пространственная информация формируется посредством комбинирования пространственной информации, и затем можно выполнять повышающее микширование аудиосигнала, понижающее микширование с помощью сформированной информации. В частности, посредством применения пространственных параметров к формуле преобразования можно сформировать комбинированные пространственные параметры.Since spatial information is computed during down-mixing of a multi-channel audio signal according to a predetermined tree configuration, the original multi-channel audio signal before down-mixing can be restored if the down-mixing audio signal is decoded using the spatial spatial information parameters as they are. If the number of channels M of the multi-channel audio signal is different from the number of channels N of the audio signal of the output channel, new combined spatial information is generated by combining the spatial information, and then you can perform up-mixing of the audio signal, down-mixing using the generated information. In particular, by applying spatial parameters to the transformation formula, combined spatial parameters can be generated.

Этот способ может варьироваться согласно последовательности и способу понижающего микширования многоканального аудиосигнала в устройстве кодирования. Также можно запрашивать последовательность и способ понижающего микширования с помощью древовидной конфигурационной информации в пространственной информации. Помимо этого, данный способ может варьироваться согласно числу выходных каналов. Более того, можно запрашивать число выходных каналов и т.п. с помощью информации выходных каналов.This method may vary according to the sequence and method of down-mixing the multi-channel audio signal in the encoding device. You can also request the sequence and method of down-mixing using tree-like configuration information in spatial information. In addition, this method may vary according to the number of output channels. Moreover, you can request the number of output channels, etc. using the information of the output channels.

Далее поясняются подробные варианты осуществления способа модификации пространственной информации и варианты осуществления для предоставления виртуального трехмерного эффекта.The following explains detailed embodiments of a method for modifying spatial information and embodiments for providing a virtual three-dimensional effect.

(2)-1. Общая комбинированная пространственная информация(2) -1. General combined spatial information

Способ формирования комбинированных пространственных параметров посредством комбинирования пространственных параметров пространственной информации предусмотрен для повышающего микширования согласно древовидной конфигурации, отличающейся от конфигурации в процессе понижающего микширования. Таким образом, этот способ применим ко всем видам сигналов понижающего микширования вне зависимости от того, какая имеется древовидная конфигурация согласно информации древовидной конфигурации.A method for generating combined spatial parameters by combining spatial parameters of spatial information is provided for upmixing according to a tree configuration different from that in the downmix process. Thus, this method is applicable to all kinds of downmix signals, regardless of which tree configuration is available according to the tree configuration information.

В случае если многоканальный аудиосигнал является 5.1-канальным, а аудиосигнал понижающего микширования является 1-канальным (моноканал), способ формирования аудиосигнала выходного канала из двух каналов поясняется со ссылкой на два вида примеров как следующие.If the multi-channel audio signal is 5.1-channel and the down-mix audio signal is 1-channel (mono channel), the method of generating an audio signal of an output channel from two channels is explained with reference to two types of examples as follows.

(2)-1-1. Четвертый вариант осуществления древовидной конфигурации (древовидная конфигурация 5-1-51)(2) -1-1. The fourth embodiment of the tree configuration (tree configuration 5-1-5 1 )

Фиг.5 - это схематичное представление примера применения комбинированной пространственной информации.5 is a schematic representation of an example of application of combined spatial information.

Ссылаясь на левую часть фиг.5, CLD0-CLD4 и ICC0-ICC4 (не показаны на чертеже) могут быть названы пространственными параметрами, которые могут быть вычислены в процессе понижающего микширования многоканального аудиосигнала для 5.1-каналов. Например, в пространственных параметрах межканальная разность уровней между сигналом L левого канала и сигналом R правого канала - это CLD3, а межканальная корреляция между L и R - это ICC3. Помимо этого, межканальная разность уровней между левым каналом Ls объемного звучания и правым каналом Rs объемного звучания - это CLD2, а межканальная корреляция между Ls и Rs - это ICC2.Referring to the left side of FIG. 5, CLD 0 -CLD 4 and ICC 0 -ICC 4 (not shown in the drawing) can be called spatial parameters that can be calculated during down-mixing of a multi-channel audio signal for 5.1 channels. For example, in spatial parameters, the inter-channel level difference between the left channel signal L and the right channel signal R is CLD 3 , and the inter-channel correlation between L and R is ICC 3 . In addition, the inter-channel level difference between the left surround channel L s and the right surround channel R s is CLD 2 , and the inter-channel correlation between L s and R s is ICC 2 .

С другой стороны, ссылаясь на правую часть фиг.5, если сигнал Lt левого канала и сигнал Rt правого канала формируются посредством применения комбинированных пространственных параметров CLDα и ICCα в моноаудиосигнал m понижающего микширования, можно непосредственно сформировать аудиосигнал Lt и Rt выходного стереоканала из аудиосигнала m моноканала. В этом случае комбинированные пространственные параметры CLDα и ICCα могут быть вычислены посредством комбинирования пространственных параметров CLD0-CLD4 и ICC0-ICC4.On the other hand, referring to the right-hand side of FIG. 5, if the left channel signal L t and the right channel signal R t are generated by applying the combined spatial parameters CLD α and ICC α to the down-mix mono audio signal m, the audio signal L t and R t can be directly generated stereo output channel from mono channel audio signal m. In this case, the combined spatial parameters CLD α and ICC α can be calculated by combining the spatial parameters CLD 0 -CLD 4 and ICC 0 -ICC 4 .

Далее сначала поясняется процесс вычисления CLDα из комбинированных пространственных параметров посредством комбинирования CLD0-CLD4, а затем поясняется процесс вычисления ICCα из комбинированных пространственных параметров посредством комбинирования CLD0-CLD4 и ICC0-ICC4 следующим образом.Next, the process of computing CLD α from the combined spatial parameters by combining CLD 0 -CLD 4 is first explained, and then the process of computing ICC α from the combined spatial parameters by combining CLD 0 -CLD 4 and ICC 0 -ICC 4 is explained as follows.

(2)-1-1-a. Вывод CLDα (2) -1-1-a. Conclusion CLD α

Во-первых, поскольку CLDα - это разность уровней между левым выходным сигналом Lt и правым выходным сигналом Rt, результат ввода левого выходного сигнала Lt и правого выходного сигнала Rt в формулу определения CLD показан следующим образом:Firstly, since CLD α is the level difference between the left output signal L t and the right output signal R t , the result of inputting the left output signal L t and the right output signal R t into the CLD determination formula is shown as follows:

[Формула 1][Formula 1]

CLDα=10*log10(PLt/PRt),CLD α = 10 * log 10 (P Lt / P Rt ),

где PLt - это степень Lt, а PRt - это степень Rt.where P Lt is the degree of L t , and P Rt is the degree of R t .

[Формула 2][Formula 2]

CLDα=10*log10(PLt+a/PRt+a),CLD α = 10 * log 10 (P Lt + a / P Rt + a),

где PLt - степень Lt, PRt - степень Rt, a - очень малая константа.where P Lt is the degree of L t , P Rt is the degree of R t , a is a very small constant.

Следовательно, CLDα определяется как формула 1 или формула 2.Therefore, CLD α is defined as formula 1 or formula 2.

Чтобы представить PLt и PRt с помощью пространственных параметров CLD0-CLD4, требуется формула взаимосвязи между левым выходным сигналом Lt аудиосигнала выходного канала, правым выходным сигналом Rt аудиосигнала выходного канала и многоканальным сигналом L, Ls, R, Rs, C и LFE. Также соответствующая формула взаимосвязи может быть определена следующим образом:To represent P Lt and P Rt using the spatial parameters CLD 0 -CLD 4 , a relationship formula is required between the left output signal L t of the audio signal of the output channel, the right output signal R t of the audio signal of the output channel and the multi-channel signal L, L s , R, R s , C and LFE. Also, the corresponding relationship formula can be defined as follows:

[Формула 3][Formula 3]

Lt=L+Ls+C/√2+LFE/√2,L t = L + L s + C / √2 + LFE / √2,

Rt=R+Rs+C/√2+LFE/√2.R t = R + R s + C / √2 + LFE / √2.

Поскольку формула взаимосвязи, подобная формуле 3, может варьироваться согласно тому, как определить аудиосигнал выходного канала, он может быть определен формулой, отличной от формулы 3. Например, 1/√2 в C/√2 или LFE/√2 может быть 0 или 1.Since a relationship formula similar to formula 3 can vary according to how the audio signal of the output channel is determined, it can be defined by a formula different from formula 3. For example, 1 / √2 in C / √2 or LFE / √2 can be 0 or one.

Формула 3 позволяет вывести формулу 4 следующим образом:Formula 3 allows you to derive formula 4 as follows:

[Формула 4][Formula 4]

PLt=PL+PLS+PC/2+PLFE/2,P Lt = P L + P LS + P C / 2 + P LFE / 2,

PRt=PR+PRS+PC/2+PLFE/2.P Rt = P R + P RS + P C / 2 + P LFE / 2.

Можно представить CLDα согласно формуле 1 или формуле 2 с помощью PLt и PRt. Также PLt и PRt могут быть представлены согласно формуле 4 с помощью PL, PLs, Pc, PLFE, PR и PRs. Таким образом, необходимо найти формулу взаимосвязи, дающую возможность представления PL, PLs, Pc, PLFE, PR И PRs с помощью параметров CLD0-CLD4.You can represent CLD α according to formula 1 or formula 2 using P Lt and P Rt . Also, P Lt and P Rt can be represented according to formula 4 with P L , P Ls , P c , P LFE , P R and P Rs . Thus, it is necessary to find the relationship formula that makes it possible to represent P L , P Ls , P c , P LFE , P R, and P Rs using the parameters CLD 0 -CLD 4 .

В случае древовидной конфигурации, показанной на фиг.5, взаимосвязь между многоканальным аудиосигналом (L, R, C, LFE, Ls, Rs) и сигналом m моноканала, полученного через понижающее микширование, показана ниже.In the case of the tree configuration shown in FIG. 5, the relationship between the multi-channel audio signal (L, R, C, LFE, L s , R s ) and the mono channel signal m obtained through downmix is shown below.

[Формула 5][Formula 5]

Figure 00000001
Figure 00000001

Также формула 5 приводит к формуле 6 следующим образом:Formula 5 also leads to Formula 6 as follows:

[Формула 6][Formula 6]

Figure 00000002
Figure 00000002

В частности, посредством ввода формулы 6 в формулу 4 и посредством ввода формулы 4 в формулу 1 или формулу 2 можно представить комбинированный пространственный параметр CLDα способом комбинирования пространственных параметров CLD0-CLD4.In particular, by entering formula 6 into formula 4 and by entering formula 4 into formula 1 or formula 2, it is possible to represent the combined spatial parameter CLD α by combining the spatial parameters CLD 0 -CLD 4 .

Расширение, возникающее в результате ввода формулы 6 в Pc/2+PLFE/2 в формуле 4, показано в формуле 7.The extension resulting from entering formula 6 in P c / 2 + P LFE / 2 in formula 4 is shown in formula 7.

[Формула 7][Formula 7]

PC/2+PLFE/2=[(C1,OTT4)2+(C2,OTT4)2]*(C2,OTT1*C1,OTT0)2 * m2/2.P C / 2 + P LFE / 2 = [(C 1, OTT4) 2 + (C 2, OTT4) 2] * (C 2, OTT1 * C 1, OTT0) * m 2 2/2.

В этом случае согласно определениям C1 и C2 (сравните формулу 5), поскольку (C1,x)2+(C2,x)2=1, это приводит к (C1,OTT4)2+(C2,OTT4)2=1.In this case, according to the definitions of C 1 and C 2 (compare formula 5), since (C 1, x ) 2 + (C 2, x ) 2 = 1, this leads to (C 1, OTT4 ) 2 + (C 2, OTT4 ) 2 = 1.

Таким образом, формула 7 может быть кратко записана следующим образом:Thus, formula 7 can be summarized as follows:

[Формула 8][Formula 8]

PC/2+PLFE/2=(C2,OTT1*C1,OTT0)2 * m2/2.P C / 2 + P LFE / 2 = (C 2, OTT1 * C 1, OTT0) * m 2 2/2.

Следовательно, посредством ввода формулы 8 и формулы 6 в формулу 4 и посредством ввода формулы 4 в формулу 1 можно представить комбинированный пространственный параметр CLDα способом комбинирования пространственных параметров CLD0-CLD4.Therefore, by entering formula 8 and formula 6 into formula 4 and by entering formula 4 into formula 1, one can represent the combined spatial parameter CLD α by combining the spatial parameters CLD 0 -CLD 4 .

(2)-1-1-b. Вывод ICCα (2) -1-1-b. Conclusion ICC α

Во-первых, поскольку ICCα - это корреляция между левым выходным сигналом Lt и правым выходным сигналом Rt, результат ввода левого выходного сигнала Lt и правого выходного сигнала Rt в соответствующую формулу определения показан следующим образом:First, since ICC α is the correlation between the left output signal L t and the right output signal R t , the result of inputting the left output signal L t and the right output signal R t into the corresponding determination formula is shown as follows:

[Формула 9][Formula 9]

Figure 00000003
Figure 00000003

В формуле 9 PLt и PRt могут быть представлены с помощью CLD0-CLD4 в формуле 4, формуле 6 и формуле 8. Помимо этого, PLtPRt может быть развернуто способом формулы 10.In formula 9, P Lt and P Rt can be represented by CLD 0 -CLD 4 in formula 4, formula 6 and formula 8. In addition, P Lt P Rt can be expanded by the method of formula 10.

[Формула 10][Formula 10]

PLtRt=PLR+PLsRs+PC/2+PLFE/2.P LtRt = P LR + P LsRs + P C / 2 + P LFE / 2.

В формуле 10 PC/2+PLFE/2 может быть представлено как CLD0-CLD4 согласно формуле 6. Также PLR и PLsRs могут быть развернуты согласно определению ICC следующим образом:In formula 10, P C / 2 + P LFE / 2 can be represented as CLD 0 -CLD 4 according to formula 6. Also, P LR and P LsRs can be deployed according to the ICC definition as follows:

[Формула 11][Formula 11]

ICC3=PLR/√ (PLPR),ICC 3 = P LR / √ (P L P R ),

ICC2=PLsRs/√ (PLsРRs).ICC 2 = P LsRs / √ (P Ls P Rs ).

В формуле 11, если √(PLPR) или √(PLsRs) транспонировано, получается формула 12.In formula 11, if √ (P L P R ) or √ (P LsRs ) is transposed, then formula 12 is obtained.

[Формула 12][Formula 12]

PLR=ICC3* √(PLPR),P LR = ICC 3 * √ (P L P R ),

PLsRs=ICC2* √(PLsRs).P LsRs = ICC 2 * √ (P LsRs ).

В формуле 12 PL, PR, PLs и PRs могут быть представлены как CLD0-CLD4 согласно формуле 6. Формула, получающаяся в результате ввода формулы 6 в формулу 12, соответствует формуле 13.In formula 12, P L , P R , P Ls and P Rs can be represented as CLD 0 -CLD 4 according to formula 6. The formula resulting from the input of formula 6 into formula 12 corresponds to formula 13.

[Формула 13][Formula 13]

PLR=ICC3 * cl,ОTT3 * c2,ОTT3 * (cl,ОTT1 * cl,ОTT0)2 * m2,P LR = ICC 3 * c l, OTT3 * c 2, OTT3 * (c l, OTT1 * c l, OTT0 ) 2 * m 2 ,

PLrRs=ICC2 * cl,ОTT2 * c2,ОTT2 * (c2,ОTT0)2 * m2.P LrRs = ICC 2 * c l, OTT2 * c 2, OTT2 * (c 2, OTT0 ) 2 * m 2 .

Итак, посредством ввода формулы 6 и формулы 13 в формулу 10 и посредством ввода формулы 10 и формулы 4 в формулу 9 можно представить комбинированный пространственный параметр ICCα как пространственные параметры CLD0-CLD3, ICC2 и ICC3.So, by entering formula 6 and formula 13 into formula 10 and by entering formula 10 and formula 4 into formula 9, we can represent the combined spatial parameter ICC α as the spatial parameters CLD 0 -CLD 3 , ICC 2 and ICC 3 .

(2)-1-2. Пятый вариант осуществления древовидной конфигурации (древовидная конфигурация 5-1-52)(2) -1-2. Fifth Embodiment of a Tree Configuration (Tree Configuration 5-1-5 2 )

Фиг.6 - это схематичное представление другого примера применения комбинированной пространственной информации.6 is a schematic representation of another example of the application of combined spatial information.

Ссылаясь на левую часть фиг.6, CLD0-CLD4 и ICC0-ICC4 (не показаны на чертеже) могут быть названы пространственными параметрами, которые могут быть вычислены в процессе понижающего микширования многоканального аудиосигнала для 5.1-каналов.Referring to the left side of FIG. 6, CLD 0 -CLD 4 and ICC 0 -ICC 4 (not shown in the drawing) can be called spatial parameters, which can be calculated in the process of down-mixing the multi-channel audio signal for 5.1 channels.

В пространственных параметрах межканальная разность уровней между сигналом L левого канала и сигналом Ls левого канала объемного звучания - это CLD3, а межканальная корреляция между L и Ls - это ICC3. Помимо этого, межканальная разность уровней между правым каналом R и правым каналом Rs объемного звучания - это CLD4, а межканальная корреляция между R и Rs - это ICC4.In spatial parameters, the inter-channel level difference between the left channel signal L and the surround channel left signal L s is CLD 3 , and the inter-channel correlation between L and L s is ICC 3 . In addition, the inter-channel level difference between the right channel R and the right channel R s of the surround sound is CLD 4 , and the inter-channel correlation between R and R s is ICC 4 .

С другой стороны, ссылаясь на правую часть фиг.6, если сигнал Lt левого канала и сигнал Rt правого канала формируются посредством применения комбинированных пространственных параметров CLDβ и ICCβ в моноаудиосигнал m понижающего микширования, можно непосредственно сформировать аудиосигнал Lt и Rt выходного стереоканала из аудиосигнала m моноканала. В этом случае комбинированные пространственные параметры CLDβ и ICCβ могут быть вычислены посредством комбинирования пространственных параметров CLD0-CLD4 и ICC0-ICC4.On the other hand, referring to the right-hand side of FIG. 6, if the left channel signal L t and the right channel signal R t are generated by applying the combined spatial parameters CLD β and ICC β to the down-mix mono audio signal m, the audio signal L t and R t can be directly generated stereo output channel from mono channel audio signal m. In this case, the combined spatial parameters CLD β and ICC β can be calculated by combining the spatial parameters CLD 0 -CLD 4 and ICC 0 -ICC 4 .

Далее сначала поясняется процесс вычисления CLDβ из комбинированных пространственных параметров посредством комбинирования CLD0-CLD4, а затем поясняется процесс вычисления ICCβ из комбинированных пространственных параметров посредством комбинирования CLD0-CLD4 и ICC0-ICC4 следующим образом:Next, the process of computing CLD β from combined spatial parameters by combining CLD 0 -CLD 4 is first explained, and then the process of computing ICC β from combined spatial parameters by combining CLD 0 -CLD 4 and ICC 0 -ICC 4 is explained as follows:

(2)-1-2-a. Вывод CLDβ (2) -1-2-a. Conclusion CLD β

Во-первых, поскольку CLDβ - это разность уровней между левым выходным сигналом Lt и правым выходным сигналом Rt, результат ввода левого выходного сигнала Lt и правого выходного сигнала Rt в формулу определения CLD показан следующим образом:First, since CLD β is the level difference between the left output signal L t and the right output signal R t , the result of inputting the left output signal L t and the right output signal R t in the CLD determination formula is shown as follows:

[Формула 14][Formula 14]

CLDβ=10*log10(PLt/PRt),CLD β = 10 * log 10 (P Lt / P Rt ),

где PLt - степень Lt, PRt - степень Rt.where P Lt is the degree of L t , P Rt is the degree of R t .

[Формула 15][Formula 15]

CLDβ=10*log10(PLt+a/PRt+a),CLD β = 10 * log 10 (P Lt + a / P Rt + a),

где PLt - степень Lt, PRt - степень Rt, a - это очень малое число.where P Lt is the degree of L t , P Rt is the degree of R t , a is a very small number.

Следовательно, CLDβ определяется как формула 14 или формула 15.Therefore, CLD β is defined as formula 14 or formula 15.

Между тем, чтобы представить PLt и PRt с помощью пространственных параметров CLD0-CLD4, требуется формула взаимосвязи между левым выходным сигналом Lt аудиосигнала выходного канала, правым выходным сигналом Rt аудиосигнала выходного канала и многоканальным сигналом L, Ls, R, Rs, C и LFE. Также соответствующая формула взаимосвязи может быть определена следующим образом:Meanwhile, in order to represent P Lt and P Rt using the spatial parameters CLD 0 -CLD 4 , a relationship formula is required between the left output signal L t of the output channel audio signal, the right output signal R t of the output channel audio signal and the multi-channel signal L, L s , R , R s , C and LFE. Also, the corresponding relationship formula can be defined as follows:

[Формула 16][Formula 16]

Lt=L+Ls+C/√2+LFE/√2,L t = L + L s + C / √2 + LFE / √2,

Rt=R+Rs+C/√2+LFE/√2.R t = R + R s + C / √2 + LFE / √2.

Поскольку формула взаимосвязи, подобная формуле 16, может варьироваться согласно тому, как определить аудиосигнал выходного канала, он может быть определен формулой, отличной от формулы 16. Например, 1/√2 в C/√2 или LFE/√2 может быть 0 или 1.Since a relationship formula similar to formula 16 may vary according to how the audio signal of the output channel is determined, it can be defined by a formula other than formula 16. For example, 1 / √2 in C / √2 or LFE / √2 can be 0 or one.

Формула 16 позволяет вывести формулу 17 следующим образом:Formula 16 allows you to derive formula 17 as follows:

[Формула 17][Formula 17]

PLt=PL+PLS+PC/2+PLFE/2,P Lt = P L + P LS + P C / 2 + P LFE / 2,

PRt=PR+PRS+PC/2+PLFE/2.P Rt = P R + P RS + P C / 2 + P LFE / 2.

Можно представить CLDβ согласно формуле 14 или формуле 15 с помощью PLt и PRt. Также PLt и PRt могут быть представлены согласно формуле 15 с помощью PL, PLs, Pc, PLFE, PR и PRs. Таким образом, необходимо найти формулу взаимосвязи, дающую возможность представления PL, PLs, Pc, PLFE, PR И PRs с помощью параметров CLD0-CLD4.You can represent CLD β according to formula 14 or formula 15 using P Lt and P Rt . Also, P Lt and P Rt can be represented according to formula 15 with P L , P Ls , P c , P LFE , P R and P Rs . Thus, it is necessary to find the relationship formula that makes it possible to represent P L , P Ls , P c , P LFE , P R, and P Rs using the parameters CLD 0 -CLD 4 .

В случае древовидной конфигурации, показанной на фиг.6, взаимосвязь между многоканальным аудиосигналом (L, R, C, LFE, Ls, Rs) и сигналом m моноканала, полученного через понижающее микширование, показана ниже.In the case of the tree configuration shown in FIG. 6, the relationship between the multi-channel audio signal (L, R, C, LFE, L s , R s ) and the monochannel signal m obtained through the downmix is shown below.

[Формула 18][Formula 18]

Figure 00000004
Figure 00000004

Также формула 18 приводит к формуле 19 следующим образом:Formula 18 also leads to Formula 19 as follows:

[Формула 19][Formula 19]

Figure 00000005
Figure 00000005

В частности, посредством ввода формулы 19 в формулу 17 и посредством ввода формулы 17 в формулу 14 или формулу 15 можно представить комбинированный пространственный параметр CLDβ способом комбинирования пространственных параметров CLD0-CLD4.In particular, by entering formula 19 into formula 17 and by entering formula 17 into formula 14 or formula 15, the combined spatial parameter CLD β can be represented by combining the spatial parameters CLD 0 -CLD 4 .

Формула расширения, получаемая в результате ввода формулы 19 в PL+PLs в формуле 17, показана в формуле 20.The expansion formula obtained by entering formula 19 into P L + P Ls in formula 17 is shown in formula 20.

[Формула 20][Formula 20]

PL+PLs=[(cl,OTT3)2+(c2,OTT3)2] (cl,OTT1*cl,OTT0)2 * m2.P L + P Ls = [(c l, OTT3 ) 2 + (c 2, OTT3 ) 2 ] (c l, OTT1 * c l, OTT0 ) 2 * m 2 .

В этом случае согласно определениям c1 и c2 (сравните формулу 5), поскольку (c1,x)2+(c2,x)2=1, это приводит к (c1,OTT3)2+(c2,OTT3)2=1.In this case, according to the definitions c 1 and c 2 (compare formula 5), since (c 1, x ) 2 + (c 2, x ) 2 = 1, this leads to (c 1, OTT3 ) 2 + (c 2, OTT3 ) 2 = 1.

Таким образом, формула 20 может быть кратко записана следующим образом:Thus, formula 20 can be summarized as follows:

[Формула 21][Formula 21]

PL_=PL+PLs=(cl,OTT1*cl,OTT0)2 * m2.P L_ = P L + P Ls = (c l, OTT1 * c l, OTT0 ) 2 * m 2 .

Расширенная запись, получаемая в результате ввода формулы 19 для PR+PRs в формулу 17, представлена как формула 22.The expanded record obtained by entering formula 19 for P R + P Rs into formula 17 is represented as formula 22.

[Формула 22][Formula 22]

PR+PRs=[(cl,OTT4)2+(c2,OTT4)2] (cl,OTT1*cl,OTT0)2 * m2.P R + P Rs = [(c l, OTT4 ) 2 + (c 2, OTT4 ) 2 ] (c l, OTT1 * c l, OTT0 ) 2 * m 2 .

В этом случае согласно определениям c1 и c2 (сравните формулу 5), поскольку (c1,x)2+(c2,x)2=1, это приводит к (c1,OTT4)2+(c2,OTT4)2=1.In this case, according to the definitions c 1 and c 2 (compare formula 5), since (c 1, x ) 2 + (c 2, x ) 2 = 1, this leads to (c 1, OTT4 ) 2 + (c 2, OTT4 ) 2 = 1.

Таким образом, формула 22 может быть кратко записана следующим образом:Thus, formula 22 can be summarized as follows:

[Формула 23][Formula 23]

PR_=PR+PRs=(c2,OTT1*cl,OTT0)2 * m 2.P R_ = P R + P Rs = (c 2, OTT1 * c l, OTT0 ) 2 * m 2 .

С другой стороны, расширенная запись, получаемая в результате ввода формулы 19 для Pc/2+PLFE/2 в формулу 17, представлена как формула 24.On the other hand, the extended entry obtained by entering formula 19 for P c / 2 + P LFE / 2 into formula 17 is represented as formula 24.

[Формула 24][Formula 24]

PC/2+PLFE/2=[(cl,OTT2)2+(c2,OTT2)2] (c2,OTT0)2 * m2/2.P C / 2 + P LFE / 2 = [(c l, OTT2) 2+ (c 2, OTT2) 2] (c 2, OTT0) * m 2 2/2.

В этом случае согласно определениям c1 и c2 (сравните формулу 5), поскольку (c1,x)2+(c2,x)2=1, это приводит к (c1,OTT2)2+(c2,OTT2)2=1.In this case, according to the definitions c 1 and c 2 (compare formula 5), since (c 1, x ) 2 + (c 2, x ) 2 = 1, this leads to (c 1, OTT2 ) 2 + (c 2, OTT2 ) 2 = 1.

Таким образом, формула 24 может быть кратко записана следующим образом:Thus, formula 24 can be summarized as follows:

[Формула 25][Formula 25]

PC/2+PLFE/2=(c2,OTT0)2 * m2/2.P C / 2 + P LFE / 2 = (c 2, OTT0) * m 2 2/2.

Следовательно, посредством ввода формулы 21, формулы 23 и формулы 25 в формулу 17 и посредством ввода формулы 17 в формулу 14 или формулу 15 можно представить комбинированный пространственный параметр CLDβ способом комбинирования пространственных параметров CLD0-CLD4.Therefore, by entering formula 21, formula 23 and formula 25 into formula 17, and by entering formula 17 into formula 14 or formula 15, the combined spatial parameter CLD β can be represented by combining the spatial parameters CLD 0 -CLD 4 .

(2)-1-2-b. Вывод ICCβ (2) -1-2-b. Conclusion ICC β

Во-первых, поскольку ICCβ - это корреляция между левым выходным сигналом Lt и правым выходным сигналом Rt, результат ввода левого выходного сигнала Lt и правого выходного сигнала Rt в соответствующую формулу определения показан следующим образом:First, since ICC β is the correlation between the left output signal L t and the right output signal R t , the result of inputting the left output signal L t and the right output signal R t into the corresponding determination formula is shown as follows:

[Формула 26][Formula 26]

Figure 00000006
Figure 00000006

В формуле 26 PLt и PRt могут быть представлены согласно формуле 19 с помощью CLD0-CLD4. Помимо этого, PLtPRt может быть развернуто согласно формуле 27.In formula 26, P Lt and P Rt can be represented according to formula 19 using CLD 0 -CLD 4 . In addition, P Lt P Rt can be deployed according to formula 27.

[Формула 27][Formula 27]

PLtRt=PL_R_+PC/2+PLFE/2.P LtRt = P L_R_ + P C / 2 + P LFE / 2.

В формуле 27 PC/2+PLFE/2 может быть представлено как CLD0-CLD4 согласно формуле 19. Также PL_R_ может быть развернут согласно определению ICC следующим образом:In formula 27, P C / 2 + P LFE / 2 can be represented as CLD 0 -CLD 4 according to formula 19. Also, P L_R_ can be expanded according to the ICC definition as follows:

[Формула 28][Formula 28]

ICC1=PL_R_/√(PL_PR_).ICC 1 = P L_R_ / √ (P L_ P R_ ).

Если √(PL_PR_) транспонировано, может быть получена формула 29.If √ (P L_ P R_ ) is transposed, formula 29 can be obtained.

[Формула 29][Formula 29]

PL_R_=ICC1* √(PL_PR_).P L_R_ = ICC 1 * √ (P L_ P R_ ).

В формуле 29 PL_ и PR_ могут быть представлены как CLD0-CLD4 согласно формуле 21 и формуле 23. Формула, получающаяся в результате ввода формулы 21 и формулы 23 в формулу 29, соответствует формуле 30.In formula 29, P L_ and P R_ can be represented as CLD 0 -CLD 4 according to formula 21 and formula 23. The formula resulting from the entry of formula 21 and formula 23 into formula 29 corresponds to formula 30.

[Формула 30][Formula 30]

PL_R_=ICC1 * c1,OTT1 * c1,OTT1 * c2,OTT1 * c1,OTT0 * m2.P L_R_ = ICC 1 * c 1, OTT1 * c 1, OTT1 * c 2, OTT1 * c 1, OTT0 * m 2 .

Итак, посредством ввода формулы 30 в формулу 27 и посредством ввода формулы 27 и формулы 17 в формулу 26 можно представить комбинированный пространственный параметр ICCβ как пространственные параметры CLD0-CLD4 и ICC1.So, by entering formula 30 into formula 27 and by entering formula 27 and formula 17 into formula 26, we can represent the combined spatial parameter ICC β as spatial parameters CLD 0 -CLD 4 and ICC 1 .

Вышеописанные способы модификации пространственных параметров являются только одним вариантом осуществления. Также при нахождении Px или Pxy очевидно, что вышеописанные формулы могут варьироваться в различных формах посредством рассмотрения корреляций (к примеру, ICC0 и т.д.) между соответствующими каналами, а также в дополнение энергии сигнала.The above methods for modifying spatial parameters are only one embodiment. Also, when finding P x or P xy, it is obvious that the above formulas can vary in various forms by considering correlations (for example, ICC 0 , etc.) between the respective channels, as well as in addition to the signal energy.

(2)-2. Комбинированная пространственная информация, имеющая эффект объемного звучания(2) -2. Combined spatial information with surround effect

Во-первых, в случае рассмотрения путей звука для того, чтобы сформировать комбинированную пространственную информацию посредством комбинирования пространственной информации, можно вызывать виртуальный эффект объемного звучания.First, in the case of considering sound paths, in order to generate combined spatial information by combining spatial information, a virtual surround effect can be caused.

Виртуальный эффект объемного звучания или виртуальный трехмерный эффект может вызывать эффект, который преимущественно имеется в громкоговорителе канала объемного звучания без громкоговорителя канала объемного звучания. Например, 5.1-канальный аудиосигнал выводится посредством двух стереогромкоговорителей.A virtual surround effect or a virtual three-dimensional effect can cause an effect that is predominantly present in the surround channel speaker without the surround channel speaker. For example, 5.1-channel audio is output from two stereo speakers.

Путь звука может соответствовать информации пространственной фильтрации. Информация пространственной фильтрации может использовать функцию с названием HRTF (функция моделирования восприятия звука), которая не ограничивается посредством настоящего изобретения. Информация пространственной фильтрации может включать в себя параметр фильтрации. Посредством ввода параметра фильтрации и пространственных параметров в формулу преобразования можно сформировать комбинированный пространственный параметр. Также сформированный комбинированный пространственный параметр может включать в себя коэффициенты фильтрации.The sound path may correspond to spatial filtering information. The spatial filtering information may use a function called HRTF (Sound Perception Modeling Function), which is not limited by the present invention. The spatial filtering information may include a filtering parameter. By entering the filter parameter and spatial parameters into the transformation formula, a combined spatial parameter can be generated. Also, the combined spatial parameter generated may include filtering coefficients.

Далее предположим, что многоканальный аудиосигнал - это 5 каналов, и что формируется аудиосигнал выходного канала из трех каналов, и способ рассмотрения путей звука, чтобы формировать комбинированную пространственную информацию, имеющую эффект объемного звучания, поясняется следующим образом.Further, suppose that a multi-channel audio signal is 5 channels, and that an audio signal of an output channel of three channels is generated, and a method for considering sound paths to generate combined spatial information having a surround effect is explained as follows.

Фиг.7 - это схема путей звука от громкоговорителей к слушателю, на которой показаны позиции громкоговорителей.Fig. 7 is a diagram of sound paths from speakers to a listener, showing speaker positions.

Согласно фиг.7, позиции трех громкоговорителей SPK1, SPK2 и SPK3 - это левый передний L, центральный C и правый R соответственно. Также позиции виртуальных каналов объемного звучания - это левый объемного звучания Ls и правый объемного звучания Rs соответственно.According to Fig. 7, the positions of the three speakers SPK1, SPK2 and SPK3 are the left front L, the center C and the right R, respectively. Also the positions of the virtual surround channels are the left surround sound Ls and the right surround sound Rs, respectively.

Показаны пути звука к позициям r и l правого и левого уха слушателя от позиций L, C и R трех громкоговорителей и позиций Ls и Rs виртуальных каналов объемного звучания соответственно. Индикатор Gx_y указывает путь звука от позиции x в позицию y. Например, индикатор GL_r указывает путь звука от позиции левого переднего L к позиции правого уха r слушателя.The sound paths to the r and l positions of the right and left ears of the listener from the positions L, C and R of the three speakers and the positions Ls and Rs of the virtual surround channels, respectively, are shown. The G x_y indicator indicates the sound path from position x to position y. For example, the indicator G L_r indicates the sound path from the position of the left front L to the position of the right ear r of the listener.

Если имеются громкоговорители в пяти позициях (т.е. имеются громкоговорители в левом объемного звучания Ls и правом объемного звучания Rs также), и если слушатель находится в позиции, показанной на фиг.7, сигнал L0, поступающий в левое ухо слушателя, и сигнал R0, поступающий в правое ухо слушателя, представляются по формуле 31.If there are speakers in five positions (i.e. there are speakers in the left surround sound Ls and the surround right Rs also), and if the listener is in the position shown in FIG. 7, the signal L 0 entering the listener's left ear, and the signal R 0 entering the listener's right ear is represented by formula 31.

[Формула 31][Formula 31]

L0=L*GL_l+C*GC_l+R*GR_l+Ls*GLs_l+Rs*GRs_l,L 0 = L * G L_l + C * G C_l + R * G R_l + Ls * G Ls_l + Rs * G Rs_l ,

R0=L*GL_r+C*GC_r+R*GR_r+Ls*GLs_r+Rs*GRs_r,R 0 = L * G L_r + C * G C_r + R * G R_r + Ls * G Ls_r + Rs * G Rs_r ,

где L, C, R, Ls и Rs - это каналы в позициях, соответственно, Gx_y указывает путь звука от позиции x к позиции y, а '*' указывает свертку.where L, C, R, Ls and Rs are channels in positions, respectively, G x_y indicates the sound path from position x to position y, and '*' indicates convolution.

Как упоминалось в вышеприведенном описании, в случае если громкоговорители находятся только в трех позициях L, C и R, сигнал L0_real, поступающий в левое ухо слушателя, и сигнал R0_real, поступающий в правое ухо слушателя, представляются следующим образом:As mentioned in the above description, if the speakers are only in three positions L, C and R, the L 0_real signal entering the listener's left ear and the R 0_real signal coming into the listener's right ear are presented as follows:

[Формула 32][Formula 32]

L0_real=L*GL_l+C*GC_l+R*GR_l,L 0_real = L * G L_l + C * G C_l + R * G R_l ,

R0_real=L*GL_r+C*GC_r+R*GR_r.R 0_real = L * G L_r + C * G C_r + R * G R_r .

Поскольку сигналы Ls и Rs каналов объемного звучания не учитываются в сигналах, показанных в формуле 32, невозможно вызвать виртуальный эффект объемного звучания. Чтобы вызвать виртуальный эффект объемного звучания, сигнал Ls, поступающий в позицию (l, r) слушателя из позиции громкоговорителя Ls, задается равным сигналу Ls, поступающему в позицию (l, r) слушателя от громкоговорителя в каждой из трех позиций L, C и R, отличающихся от исходной позиции Ls. Помимо этого, это в такой же степени применимо к случаю сигнала правого канала объемного звучания Rs.Since the Ls and Rs signals of the surround channels are not taken into account in the signals shown in Formula 32, it is not possible to produce a virtual surround effect. To cause a virtual surround effect, the signal Ls entering the listening position (l, r) from the speaker position Ls is set equal to the signal Ls entering the listening position (l, r) from the speaker in each of the three positions L, C and R different from the starting position Ls. In addition, this is equally applicable to the case of the right surround channel signal Rs.

Рассмотрим сигнал левого канала объемного звучания Ls в случае, если сигнал левого канала объемного звучания Ls выводится из громкоговорителя в левой позиции объемного звучания Ls в качестве исходной позиции, тогда сигналы, приходящие в левое и правое ухо l и r слушателя, представляются следующим образом:Consider the left surround channel signal Ls if the left surround channel signal Ls is output from the speaker in the left surround position Ls as the starting position, then the signals coming to the listener's left and right ears l and r are presented as follows:

[Формула 33][Formula 33]

Ls*GLs_l, Ls*GLs_r.Ls * G Ls_l , Ls * G Ls_r .

А в случае, если сигнал правого канала объемного звучания Rs выводится из громкоговорителя в правой позиции объемного звучания Rs в качестве исходной позиции, сигналы, приходящие в левое и правое ухо l и r слушателя, представляются следующим образом:And if the signal of the right surround sound channel Rs is output from the speaker in the right surround sound position Rs as the starting position, the signals coming to the listener's left and right ears l and r are presented as follows:

[Формула 34][Formula 34]

Rs*GRs_l, Rs*GRs_r.Rs * G Rs_l , Rs * G Rs_r .

В случае если сигналы, приходящие в левое и правое ухо l и r слушателя, равны компонентам формулы 33 и формулы 34, даже если они выводятся посредством громкоговорителей любой позиции (к примеру, посредством громкоговорителя SPK1 в левой передней позиции), слушатель может воспринимать их так, как если бы громкоговорители находились в левой и правой позициях объемного звучания Ls и Rs соответственно.If the signals coming into the left and right ear l and r of the listener are equal to the components of formula 33 and formula 34, even if they are output through speakers of any position (for example, through the speaker SPK1 in the left front position), the listener can perceive them like this as if the speakers were in the left and right surround positions of Ls and Rs respectively.

Если компоненты, показанные в формуле 33, выводятся из громкоговорителя в левой позиции объемного звучания Ls, они являются сигналами, приходящими в левое и правое ухо l и r слушателя соответственно. Таким образом, если компоненты, показанные в формуле 33, выводятся неизмененными из громкоговорителя SPK1 в левой передней позиции, сигналы, приходящие в левое и правое ухо l и r слушателя, могут быть представлены следующим образом:If the components shown in Formula 33 are output from the speaker in the left surround position Ls, they are signals coming into the listener's left and right ears l and r, respectively. Thus, if the components shown in formula 33 are output unchanged from the speaker SPK1 in the left front position, the signals coming into the left and right ear l and r of the listener can be represented as follows:

[Формула 35][Formula 35]

Ls*GLs_l*GL_l, Ls*GLs_r*GL_r.Ls * G Ls_l * G L_l , Ls * G Ls_r * G L_r .

В формуле 35 добавляется компонент GL_l (или GL_r), соответствующий пути звука из левой передней позиции L в левое ухо l (или правое ухо r) слушателя.In formula 35, the component G L_l (or G L_r ) is added , corresponding to the sound path from the left front position L to the left ear l (or right ear r) of the listener.

Также сигналы, приходящие в левое и правое ухо l и r слушателя, должны быть компонентами, показанными в формуле 33 вместо формулы 35. В случае если звук, выводимый из громкоговорителя и левой передней позиции L, поступает к слушателю, добавляется компонент GL_l (или GL_r). Таким образом, если компоненты, показанные в формуле 33, выводятся из громкоговорителя SPK1 в левой передней позиции, для пути звука должна рассматриваться обратная функция GL_l-1 (или GL_r-1) от GL_l (или GL_r). Другими словами, в случае если компоненты, соответствующие формуле 33, выводятся из громкоговорителя SPK1 в левой передней позиции L, они должны быть модифицированы по следующей формуле:Also, the signals coming into the left and right ears l and r of the listener should be the components shown in formula 33 instead of formula 35. If the sound output from the speaker and the left front position L comes to the listener, the component G L_l (or G L_r ). Thus, if the components shown in formula 33 are output from the speaker SPK1 in the left front position, the inverse function G L_l -1 (or G L_r -1 ) of G L_l (or G L_r ) should be considered for the sound path. In other words, if the components corresponding to formula 33 are output from the speaker SPK1 in the left front position L, they must be modified according to the following formula:

[Формула 36][Formula 36]

Ls*GLs_l*GL_l-1, 'Ls*GLs_r*GL_r-1.Ls * G Ls_l * G L_l -1 , 'Ls * G Ls_r * G L_r -1 .

Также в случае если компоненты, соответствующие формуле 34, выводятся из громкоговорителя SPK1 в левой передней позиции L, они должны быть модифицированы по следующей формуле:Also, if the components corresponding to formula 34 are output from the speaker SPK1 in the left front position L, they must be modified according to the following formula:

[Формула 37][Formula 37]

Rs*GRs_l*GL_l-1, Rs*GRs_r*GL_l-1.Rs * G Rs_l * G L_l -1 , Rs * G Rs_r * G L_l -1 .

Таким образом, сигнал, выводимый из громкоговорителя SPK1 в левой передней позиции L', обобщается следующим образом:Thus, the signal output from the speaker SPK1 in the left front position L 'is summarized as follows:

[Формула 38][Formula 38]

L'=L+Ls*GLs_l*GL_l-1+Rs*GRs_l*GL_l-1 L '= L + Ls * G Ls_l * G L_l -1 + Rs * G Rs_l * G L_l -1

(Компоненты Ls*GLs_r*GL_r-1 и Rs*GRs_r*GL_l-1 опущены).(Components Ls * G Ls_r * G L_r -1 and Rs * G Rs_r * G L_l -1 are omitted).

Если сигнал, который показан в формуле 38, который должен быть выведен из громкоговорителя SPK1 в левой передней позиции L, приходит в местоположение левого уха L слушателя, добавляется коэффициент пути звука GL_1. Таким образом, члены GL_l в формуле взаимно уничтожаются, за счет чего в итоге остаются коэффициенты, показанные в формуле 33 и формуле 34.If the signal that is shown in formula 38, which is to be output from the speaker SPK1 in the left front position L, arrives at the location of the left ear L of the listener, the sound path coefficient G L_1 is added. Thus, the terms G L_l in the formula are mutually annihilated, as a result of which the coefficients shown in formula 33 and formula 34 remain.

Фиг.8 - это схема для пояснения сигнала, выводимого из каждой позиции громкоговорителя для виртуального эффекта объемного звучания.8 is a diagram for explaining a signal output from each speaker position for a virtual surround effect.

Согласно фиг.8, если сигналы Ls и Rs, выводимые из позиций Ls и Rs объемного звучания, должны быть включены в сигнал L', выводимый из каждой позиции громкоговорителя SPK1 посредством рассмотрения путей звука, они соответствуют формуле 38.8, if the signals Ls and Rs outputted from the surround sound positions Ls and Rs are to be included in the signal L 'output from each position of the speaker SPK1 by considering sound paths, they correspond to formula 38.

В формуле 38 GLs_l*GL_l-1 кратко записывается как HLs_L следующим образом:In the formula 38 G Ls_l * G L_l -1 is briefly written as H Ls_L as follows:

[Формула 39][Formula 39]

L'=L+Ls*HLs_L+Rs*HRs_L.L '= L + Ls * H Ls_L + Rs * H Rs_L .

Например, сигнал C', выводимый из громкоговорителя SPK2 в центральной позиции C, обобщается следующим образом:For example, the signal C 'output from the speaker SPK2 in the center position C is summarized as follows:

[Формула 40][Formula 40]

C'=C+Ls*HLs_C+Rs*HRs_C.C '= C + Ls * H Ls_C + Rs * H Rs_C .

В качестве другого примера, сигнал R', выводимый из громкоговорителя SPK3 в правой передней позиции R, обобщается следующим образом:As another example, the signal R 'output from the speaker SPK3 in the front right position R is summarized as follows:

[Формула 41][Formula 41]

R'=R+Ls*HLs_R+Rs*HRs_R.R '= R + Ls * H Ls_R + Rs * H Rs_R .

Фиг.9 - это концептуальная схема для пояснения способа формирования 3-канального сигнала с помощью 5-канального сигнала по формуле 38, формуле 39 и формуле 40.Fig.9 is a conceptual diagram for explaining a method for generating a 3-channel signal using a 5-channel signal according to formula 38, formula 39 and formula 40.

В случае формирования 2-канального сигнала R' и L' с помощью 5-канального сигнала или в случае не включения сигналов канала объемного звучания Ls или Rs в сигнал центрального канала C' HLs_C или HRs_C становится равным 0.If a 2-channel signal R 'and L' is generated using a 5-channel signal, or if the surround channel signals Ls or Rs are not included in the center channel signal C 'H, Ls_C or H Rs_C becomes equal to 0.

Для удобства реализации Hx_y может быть по-разному модифицирован таким образом, что Hx_y заменяется на Gx_y, или Hx_y используется посредством рассмотрения перекрестных помех.For ease of implementation, H x_y can be modified in different ways so that H x_y is replaced by G x_y , or H x_y is used by considering crosstalk.

Вышеприведенное подробное описание относится к одному примеру комбинированной пространственной информации, имеющей эффект объемного звучания. Также очевидно, что она может варьироваться в различных формах согласно способу применения информации пространственной фильтрации. Как упоминалось в вышеприведенном описании, сигналы, выводимые посредством громкоговорителей (в вышеуказанном примере левый передний канал L', правый передний канал R' и центральный канал C') согласно вышеуказанному процессу, могут быть сформированы из аудиосигнала понижающего микширования с помощью комбинированной пространственной информации и, более конкретно, с помощью комбинированных пространственных параметров.The above detailed description relates to one example of combined spatial information having a surround effect. It is also obvious that it can vary in various forms according to the method of applying spatial filtering information. As mentioned in the above description, the signals output by the speakers (in the above example, the left front channel L ', the right front channel R' and the center channel C ') according to the above process can be generated from the downmix audio signal using combined spatial information and, more specifically, using combined spatial parameters.

(3) Более детализированная пространственная информация(3) More detailed spatial information

Во-первых, посредством добавления расширенной пространственной информации в пространственную информацию можно сформировать более детализированную пространственную информацию. Также можно выполнить повышающее микширование аудиосигнала с помощью расширенной пространственной информации. В соответствующем процессе повышающего микширования аудиосигнал преобразуется в первичный аудиосигнал повышающего микширования на основе пространственной информации, и первичный аудиосигнал повышающего микширования затем преобразуется во вторичный аудиосигнал повышающего микширования на основе расширенной пространственной информации.Firstly, by adding extended spatial information to spatial information, more detailed spatial information can be generated. You can also perform up-mixing of the audio signal using extended spatial information. In the corresponding upmixing process, the audio signal is converted to the primary upmix audio signal based on spatial information, and the primary upmix audio signal is then converted to the secondary upmix audio signal based on the extended spatial information.

В этом случае расширенная пространственная информация может включать в себя конфигурационную информацию расширенных каналов, информацию согласования расширенных каналов и расширенные пространственные параметры.In this case, the extended spatial information may include extended channel configuration information, extended channel matching information, and extended spatial parameters.

Конфигурационная информация расширенных каналов - это информация для конфигурируемого канала, а также канала, который может быть сконфигурирован посредством древовидной конфигурационной информации из пространственной информации. Конфигурационная информация расширенных каналов может включать в себя, по меньшей мере, одно из идентификатора раздела и идентификатора без раздела, которые подробнее описываются ниже. Информация согласования расширенных каналов - это информация позиции каждого канала, который конфигурирует расширенный канал. Также расширенные пространственные параметры могут быть использованы для повышающего микширования одного канала, по меньшей мере, в два канала. Расширенные пространственные параметры могут включать в себя межканальные разности уровней.Extended channel configuration information is information for a configurable channel, as well as a channel that can be configured by means of tree configuration information from spatial information. The extended channel configuration information may include at least one of a section identifier and a non-partition identifier, which are described in more detail below. Extended channel matching information is the position information of each channel that configures the extended channel. Extended spatial parameters can also be used to up-mix one channel into at least two channels. Enhanced spatial parameters may include inter-channel level differences.

Вышеописанная расширенная пространственная информация может быть включена в пространственную информацию после формирования посредством устройства кодирования (i) или сформирована самим устройством декодирования (ii). В случае если расширенная пространственная информация сформирована посредством устройства кодирования, наличие или отсутствие расширенной пространственной информации может быть определено на основе индикатора пространственной информации. В случае если расширенная пространственная информация сформирована посредством самого устройства декодирования, расширенные пространственные параметры расширенной пространственной информации могут вытекать из вычисления с помощью пространственных параметров пространственной информации.The above-described extended spatial information may be included in the spatial information after being generated by the encoding device (i) or generated by the decoding device (ii) itself. If the extended spatial information is generated by the encoding device, the presence or absence of the extended spatial information can be determined based on the spatial information indicator. In the event that the expanded spatial information is generated by the decoding device itself, the expanded spatial parameters of the extended spatial information can flow from the calculation using the spatial parameters of the spatial information.

Процесс повышающего микширования аудиосигнала с помощью более детализированной пространственной информации, сформированной на основе пространственной информации и расширенной пространственной информации, может выполняться последовательно и иерархически или в совокупности и синтетически. Если более детализированная пространственная информация может быть вычислена как одна матрица на основе пространственной информации и расширенной пространственной информации, нельзя выполнить повышающее микширование или понижающее микширование аудиосигнала в многоканальный аудиосигнал коллективно и непосредственно с помощью матрицы. В этом случае коэффициенты, конфигурирующие матрицу, могут быть заданы согласно пространственным параметрам и расширенным пространственным параметрам.The process of up-mixing an audio signal using more detailed spatial information generated on the basis of spatial information and extended spatial information can be performed sequentially and hierarchically, or collectively and synthetically. If more detailed spatial information can be calculated as a single matrix based on spatial information and extended spatial information, it is not possible to perform up-mix or down-mix of an audio signal into a multi-channel audio signal collectively and directly using the matrix. In this case, the coefficients configuring the matrix can be set according to spatial parameters and extended spatial parameters.

Далее, после завершения пояснения случая, в котором используется расширенная пространственная информация, сформированная посредством устройства кодирования, поясняется случай формирования расширенной пространственной информации в самом устройстве декодирования.Further, after completing the explanation of the case in which the extended spatial information generated by the encoding device is used, the case of generating the extended spatial information in the decoding device itself is explained.

(3)-1. Случай использования расширенной пространственной информации, сформированной посредством устройства кодирования: произвольная древовидная конфигурация(3) -1. The case of using the extended spatial information generated by the encoding device: an arbitrary tree configuration

Во-первых, более детализированная пространственная информация формируется устройством кодирования при формировании посредством добавления расширенной пространственной информации в пространственную информацию. Также поясняется случай, когда устройство кодирования принимает расширенную пространственную информацию. Помимо этого, расширенная пространственная информация может быть информацией, извлекаемой в процессе, когда устройство кодирования выполняет понижающее микширование многоканального аудиосигнала.Firstly, more detailed spatial information is generated by the encoding device during generation by adding extended spatial information to the spatial information. Also explained is the case where the encoding device receives extended spatial information. In addition, the extended spatial information may be information extracted in the process when the encoding device down-mixes the multi-channel audio signal.

Как упоминалось в вышеприведенном описании, расширенная пространственная информация включает в себя конфигурационную информацию расширенных каналов, информацию согласования расширенных каналов и расширенные пространственные параметры. В этом случае конфигурационная информация расширенных каналов может включать в себя, по меньшей мере, одно из идентификатора раздела и идентификатора без раздела. Далее подробно описывается процесс конфигурирования расширенного канала на основе матрицы идентификаторов раздела и идентификаторов без раздела следующим образом.As mentioned in the above description, the extended spatial information includes extended channel configuration information, extended channel matching information, and extended spatial parameters. In this case, the extended channel configuration information may include at least one of a section identifier and an identifier without a section. The following describes in detail the process of configuring an extended channel based on a matrix of partition identifiers and non-partition identifiers as follows.

Фиг.10 - это схема примера конфигурирования расширенных каналов на основе конфигурационной информации расширенных каналов.10 is a diagram of an example configuration of extended channels based on configuration information of extended channels.

Согласно нижней части фиг.10, нули и единицы попеременно размещены друг за другом. В этом случае 0 означает идентификатор без раздела, а 1 означает идентификатор раздела. Идентификатор без раздела 0 имеется в первом порядке (1), канал, соответствующий идентификатору без раздела 0 первого порядка, - это левый канал, находящийся в самом верхнем крае. Таким образом, левый канал L, соответствующий идентификатору без раздела 0, выбирается в качестве выходного канала вместо разделения. Во втором порядке (2) имеется идентификатор раздела 1. Канал, соответствующий идентификатору раздела, - это левый канал Ls объемного звучания после левого канала L. Таким образом, левый канал Ls объемного звучания, соответствующий идентификатору раздела 1, разделяется на два канала.According to the bottom of FIG. 10, zeros and ones are alternately arranged one after another. In this case, 0 means an identifier without a section, and 1 means an identifier for a section. An identifier without a partition 0 is in the first order (1), the channel corresponding to the identifier without a partition 0 of the first order is the left channel located at the very top edge. Thus, the left channel L corresponding to the identifier without section 0 is selected as the output channel instead of splitting. In the second order (2), there is a section identifier 1. The channel corresponding to the section identifier is the left surround channel Ls after the left channel L. Thus, the left surround channel Ls corresponding to the identifier of section 1 is divided into two channels.

Поскольку имеются идентификаторы без раздела 0 в третьем порядке (3) и четвертом порядке (4), два канала, разделенные из левого канала Ls объемного звучания, выбираются неизмененными в качестве выходных каналов без разделения. После того как вышеуказанный порядок повторяется до последнего порядка (10), можно сконфигурировать все расширенные каналы.Since there are identifiers without section 0 in the third order (3) and fourth order (4), two channels separated from the left surround channel Ls are selected unchanged as output channels without separation. After the above order is repeated to the last order (10), all extended channels can be configured.

Процесс разделения канала повторяется столько раз, сколько идентификаторов раздела 1, и процесс выбора канала в качестве выходного канала повторяется столько раз, сколько идентификаторов без раздела 0. Таким образом, число блоков деления каналов AT0 и AT1 равно числу (2) идентификаторов раздела 1, а число расширенных каналов (L, Lfs, Ls, R, Rfs, Rs, C и LFE) равно числу (8) идентификаторов без раздела 0.The channel splitting process is repeated as many times as the identifiers of section 1, and the channel selection process as the output channel is repeated as many times as the identifiers without section 0. Thus, the number of channel division blocks AT0 and AT1 is equal to the number (2) of section 1 identifiers, and the number of extended channels (L, Lfs, Ls, R, Rfs, Rs, C, and LFE) is equal to the number (8) of identifiers without section 0.

После того как расширенный канал сконфигурирован, можно согласовать позицию каждого выходного канала с помощью информации согласования расширенных каналов. В случае фиг.10 согласование выполняется в последовательности левого переднего канала L, левого переднего бокового канала Lfs, левого канала объемного звучания Ls, правого переднего канала R, правого переднего бокового канала Rfs, правого канала Rs объемного звучания, центрального канала C и низкочастотного канала LFЕ.After the extended channel is configured, it is possible to negotiate the position of each output channel using the extended channel matching information. In the case of FIG. 10, matching is performed in the sequence of the left front channel L, left front side channel Lfs, left surround channel Ls, right front channel R, right front side channel Rfs, right surround channel Rs, center channel C and low frequency channel LFE .

Как упоминалось в вышеприведенном описании, расширенный канал может быть сконфигурирован на основе конфигурационной информации расширенных каналов. Для этого требуется блок разделения каналов, разделяющий один канал, по меньшей мере, на два канала. При разделении одного канала, по меньшей мере, на два канала блок разделения каналов может использовать расширенные пространственные параметры. Поскольку число расширенных пространственных параметров равно числу блоков разделения канала, оно также равно числу идентификаторов разделения. Таким образом, расширенные параметры могут быть извлечены столько раз, сколько идентификаторов раздела.As mentioned in the above description, the extended channel can be configured based on the configuration information of the extended channels. This requires a channel separation unit dividing one channel into at least two channels. When dividing one channel into at least two channels, the channel splitting unit may use advanced spatial parameters. Since the number of extended spatial parameters is equal to the number of channel separation blocks, it is also equal to the number of separation identifiers. Thus, advanced parameters can be retrieved as many times as section identifiers.

Фиг.11 - это схема для пояснения конфигурации расширенных каналов, показанной на фиг.10, и взаимосвязь с расширенными пространственными параметрами.11 is a diagram for explaining the configuration of the extended channels shown in FIG. 10, and the relationship with the advanced spatial parameters.

Согласно фиг.11 имеются два блока AT0 и AT1 разделения каналов и расширенные пространственные параметры ATD0 и ATD1, применяемые к ним соответственно.11, there are two channel separation units AT 0 and AT 1 and the extended spatial parameters ATD 0 and ATD 1 applied to them, respectively.

В случае если расширенный пространственный параметр - это межканальная разность уровней, блок разделения каналов может определять уровни двух разделенных каналов с помощью расширенного пространственного параметра.If the expanded spatial parameter is an inter-channel level difference, the channel separation unit can determine the levels of two separated channels using the extended spatial parameter.

Таким образом, при выполнении повышающего микширования посредством добавления расширенной пространственной информации расширенные пространственные параметры могут быть применены не полностью, а частично.Thus, when performing upmixing by adding extended spatial information, the expanded spatial parameters may not be fully applied, but partially.

(3)-2. Случай формирования расширенной пространственной информации: интерполяция/экстраполяция(3) -2. The case of the formation of extended spatial information: interpolation / extrapolation

Во-первых, можно сформировать более подробную пространственную информацию посредством добавления расширенной пространственной информации в пространственную информацию. Случай формирования расширенной пространственной информации с помощью пространственной информации поясняется в нижеприведенном описании. В частности, можно сформировать расширенную пространственную информацию с помощью пространственных параметров пространственной информации. В этом случае может быть использована интерполяция, экстраполяция и т.п.First, more detailed spatial information can be generated by adding extended spatial information to spatial information. The case of generating extended spatial information using spatial information is explained in the description below. In particular, it is possible to form extended spatial information using spatial parameters of spatial information. In this case, interpolation, extrapolation, etc. can be used.

(3)-2-1. Расширение до 6.1-каналов(3) -2-1. Extend to 6.1 channels

В случае если многоканальный аудиосигнал представляет собой 5.1-каналы, случай формирования аудиосигнала выходного канала для 6.1-каналов поясняется со ссылкой на примеры следующим образом.If the multi-channel audio signal is 5.1 channels, the case of generating the output channel audio signal for 6.1 channels is explained with reference to examples as follows.

Фиг.12 - это схема позиции многоканального аудиосигнала для 5.1-каналов и позиции аудиосигнала выходного канала для 6.1-каналов.Fig is a diagram of the position of the multi-channel audio signal for 5.1 channels and the position of the audio signal of the output channel for 6.1 channels.

Ссылаясь на (a) из фиг.12, можно видеть, что позициями каналов многоканального аудиосигнала 5.1-каналов являются левый передний канал L, правый передний канал R, центральный канал C, низкочастотный канал (не показан на чертеже) LFE, левый канал Ls объемного звучания и правый канал Rs объемного звучания соответственно.Referring to (a) of FIG. 12, it can be seen that the channel positions of the 5.1-channel multi-channel audio signal are the left front channel L, the right front channel R, the center channel C, the low-frequency channel (not shown in the drawing) LFE, the left channel Ls surround sound and the right channel Rs surround sound respectively.

В случае когда многоканальным аудиосигналом 5.1-каналов является сигнал понижающего микширования, если пространственные параметры применяются к аудиосигналу понижающего микширования, опять выполняется повышающее микширование аудиосигнала понижающего микширования в многоканальный аудиосигнал 5.1-каналов.In the case where the 5.1-channel multi-channel audio signal is a down-mix signal, if spatial parameters are applied to the down-mix audio signal, up-mixing of the down-mix audio signal to the 5.1-channel multi-channel audio signal is again performed.

Кроме того, сигнал канала для заднего центрального RC, как показано в (b) по фиг.12, должен быть дополнительно сформирован, чтобы выполнить повышающее микширование аудиосигнала понижающего микширования в многоканальный аудиосигнал для 6.1-каналов.In addition, the channel signal for the rear center RC, as shown in (b) of FIG. 12, needs to be further formed in order to up-mix the down-mix audio signal into a multi-channel audio signal for 6.1 channels.

Канал сигнала для заднего центрального RC может быть сформирован с помощью пространственных параметров, связанных с двумя задними каналами (левым каналом Ls объемного звучания и правым каналом Rs объемного звучания). В частности, межканальная разность уровней (CLD) из пространственных параметров указывает разность уровней между двумя каналами. Таким образом, посредством корректирования разности уровней между двумя каналами можно сформировать виртуальный источник звука, существующий между двумя каналами.The signal channel for the rear center RC can be formed using spatial parameters associated with the two rear channels (left surround channel Ls surround and right surround channel Rs). In particular, the inter-channel level difference (CLD) of the spatial parameters indicates the level difference between the two channels. Thus, by adjusting the level difference between the two channels, it is possible to form a virtual sound source existing between the two channels.

Принцип, при котором позиция виртуального источника звука варьируется согласно разности уровней между двумя каналами, поясняется следующим образом.The principle in which the position of the virtual sound source varies according to the level difference between the two channels is explained as follows.

Фиг.13 - это схема для пояснения взаимосвязи между позицией виртуального источника звука и разностью уровней между двумя каналами, в которой уровнями левого и правого каналов Ls и Rs объемного звучания являются a и b соответственно.13 is a diagram for explaining the relationship between the position of the virtual sound source and the level difference between the two channels, in which the levels of the left and right surround channels Ls and Rs are a and b, respectively.

Ссылаясь на (a) по фиг.13, в случае если уровень a левого канала Ls объемного звучания больше уровня b правого канала Rs объемного звучания, можно видеть, что позиция виртуального источника звука VS ближе к позиции левого канала Ls объемного звучания, чем к позиции правого канала Rs объемного звучания.Referring to (a) of FIG. 13, if the level a of the surround left channel Ls is greater than the level b of the surround right channel Rs, it can be seen that the position of the virtual sound source VS is closer to the position of the surround left channel Ls than to the position right channel rs surround sound.

Если аудиосигнал выводится из двух каналов, слушатель ощущает, что виртуальный источник звука практически существует между двумя каналами. В этом случае позиция виртуального источника звука ближе к позиции канала, имеющего уровень выше уровня другого канала.If the audio signal is output from two channels, the listener feels that a virtual sound source practically exists between the two channels. In this case, the position of the virtual sound source is closer to the position of the channel having a level above the level of another channel.

В случае (b) по фиг.13, поскольку уровень a левого канала Ls объемного звучания практически равен уровню b правого канала Rs объемного звучания, слушатель ощущает, что позиция виртуального источника звука имеется в центре между левым каналом Ls объемного звучания и правым каналом Rs объемного звучания.In case (b) of FIG. 13, since the level a of the left surround channel Ls is almost equal to the level b of the right surround channel Rs, the listener feels that the position of the virtual sound source is in the center between the left surround channel Ls and the right surround channel Rs sounding.

Следовательно, можно определить уровень заднего центрального с помощью вышеозначенного принципа.Therefore, it is possible to determine the level of the rear center using the above principle.

Фиг.14 - это схема для пояснения уровней двух задних каналов и уровня заднего центрального канала.14 is a diagram for explaining levels of two rear channels and a level of a rear center channel.

Согласно фиг.14 можно вычислить уровень c заднего центрального канала RC посредством интерполяции разности между уровнем a левого канала Ls объемного звучания и уровнем b правого канала Rs объемного звучания. В этом случае нелинейная интерполяция может быть использована так же, как и линейная интерполяция для вычисления.According to FIG. 14, it is possible to calculate the level c of the rear center channel RC by interpolating the difference between the level a of the left surround channel Ls and the level b of the right surround channel Rs. In this case, non-linear interpolation can be used in the same way as linear interpolation for calculation.

Уровень c нового канала (к примеру, заднего центрального канала RC), существующего между двумя каналами (к примеру, Ls и Rs), может быть вычислен согласно линейной интерполяции по следующей формуле:The level c of the new channel (for example, the rear center channel RC) existing between the two channels (for example, Ls and Rs) can be calculated according to linear interpolation using the following formula:

[Формула 40][Formula 40]

c=a * k+b * (1-k),c = a * k + b * (1-k),

где a и b - уровни двух каналов соответственно, k -относительная позиция бета-канала уровня a, канала уровня b и канала уровня c.where a and b are the levels of two channels, respectively, k is the relative position of the beta channel of level a, channel of level b and channel of level c.

Если канал (к примеру, задний центральный канал RC) на уровне c размещается в центре между каналом (к примеру, Ls) на уровне a и каналом Rs на уровне b, k равно 0,5. Если k равно 0,5, то из формулы 40 следует формула 41.If the channel (for example, the rear center channel RC) at level c is located in the center between the channel (for example, Ls) at level a and the channel Rs at level b, k is 0.5. If k is 0.5, then formula 41 follows from formula 40.

[Формула 41][Formula 41]

c=(a+b)/2.c = (a + b) / 2.

Согласно формуле 41, если канал (к примеру, задний центральный канал RC) на уровне c размещается в центре между каналом (к примеру, Ls) на уровне a и каналом Rs на уровне b, уровень c нового канала соответствует среднему значению уровней a и b предыдущих каналов. Кроме того, формула 40 и формула 41 приведены только для примера. Таким образом, также можно скорректировать определение уровня c и значений уровня a и уровня b.According to formula 41, if the channel (for example, the rear center channel RC) at level c is located in the center between the channel (for example, Ls) at level a and channel Rs at level b, the level c of the new channel corresponds to the average value of levels a and b previous channels. In addition, formula 40 and formula 41 are for example purposes only. Thus, it is also possible to adjust the definition of level c and the values of level a and level b.

(3)-2-2. Расширение до 7.1-каналов(3) -2-2. Extend to 7.1 channels

Когда многоканальный аудиосигнал представляет собой 5.1-каналы, случай попытки сформировать аудиосигнал выходного канала для 7.1-каналов поясняется следующим образом.When the multi-channel audio signal is 5.1 channels, a case of attempting to generate an output channel audio signal for 7.1 channels is explained as follows.

Фиг.15 - это схема для пояснения позиции многоканального аудиосигнала 5.1-каналов и позиции аудиосигнала выходного канала 7.1-каналов.FIG. 15 is a diagram for explaining a position of a multi-channel audio signal of 5.1 channels and a position of an audio signal of an output channel of 7.1 channels.

Ссылаясь на (a) из фиг.15, аналогично (a) из фиг.12, можно видеть, что позициями каналов многоканального аудиосигнала 5.1-каналов являются левый передний канал L, правый передний канал R, центральный канал C, низкочастотный канал (не показан на чертеже) LFE, левый канал Ls объемного звучания и правый канал Rs объемного звучания соответственно.Referring to (a) of FIG. 15, similarly to (a) of FIG. 12, it can be seen that the channel positions of the 5.1 channel multi-channel audio signal are left front channel L, right front channel R, center channel C, low frequency channel (not shown in the drawing) LFE, left surround channel Ls and right surround channel Rs, respectively.

В случае когда многоканальным аудиосигналом 5.1-каналов является сигнал понижающего микширования, если пространственные параметры применяются к аудиосигналу понижающего микширования, опять выполняется повышающее микширование аудиосигнала понижающего микширования в многоканальный аудиосигнал 5.1-каналов.In the case where the 5.1-channel multi-channel audio signal is a down-mix signal, if spatial parameters are applied to the down-mix audio signal, up-mixing of the down-mix audio signal to the 5.1-channel multi-channel audio signal is again performed.

Кроме того, левый передний боковой канал Lfs и правый передний боковой канал Rfs, как показано в (b) по фиг.15, должны быть дополнительно сформированы, чтобы выполнить повышающее микширование аудиосигнала понижающего микширования в многоканальный аудиосигнал 7.1-каналов.In addition, the left front side channel Lfs and the right front side channel Rfs, as shown in (b) of FIG. 15, need to be further formed to up-mix the down-mix audio signal to the 7.1-channel multi-channel audio signal.

Поскольку левый передний боковой канал Lfs размещается между левым передним каналом L и левым каналом Ls объемного звучания, можно определить уровень левого переднего бокового канала Lfs посредством интерполяции с помощью уровня левого переднего канала L и уровня левого канала Ls объемного звучания.Since the left front side channel Lfs is located between the left front channel L and the left surround channel Ls, it is possible to determine the level of the left front side channel Lfs by interpolation using the level of the left front channel L and the level of the left surround channel Ls.

Фиг.16 - это схема для пояснения уровней двух левых каналов и уровня левого переднего бокового канала (Lfs).16 is a diagram for explaining levels of two left channels and a level of a left front side channel (Lfs).

Ссылаясь на фиг.16 можно видеть, что уровень c левого переднего бокового канала Lfs - это линейно интерполированное значение на основе уровня a левого переднего канала L и уровня b левого канала Ls объемного звучания.Referring to FIG. 16, it can be seen that the level c of the left front side channel Lfs is a linearly interpolated value based on the level a of the left front channel L and the level b of the left surround channel Ls.

Хотя левый передний боковой канал Lfs находится между левым передним каналом L и левым каналом Ls объемного звучания, он может быть размещен вне левого переднего канала L, центрального канала C и правого переднего канала R. Таким образом, можно определить уровень левого переднего бокового канала Lfs посредством экстраполяции с использованием уровней левого переднего канала L, центрального канала C и правого переднего канала R.Although the left front side channel Lfs is between the left front channel L and the left surround channel Ls, it can be placed outside the left front channel L, the center channel C and the right front channel R. Thus, the level of the left front side channel Lfs can be determined by extrapolation using the levels of the left front channel L, the center channel C and the right front channel R.

Фиг.17 - это схема для пояснения уровней трех передних каналов и уровня левого переднего бокового канала (Lfs).17 is a diagram for explaining levels of three front channels and a level of a left front side channel (Lfs).

Ссылаясь на фиг.17 можно видеть, что уровень c левого переднего бокового канала Lfs - это линейно интерполированное значение на основе уровня a левого переднего канала L, уровня c центрального канала С и уровня b правого переднего канала.Referring to FIG. 17, it can be seen that the level c of the left front side channel Lfs is a linearly interpolated value based on the level a of the left front channel L, the level c of the central channel C and the level b of the right front channel.

В вышеприведенном описании процесс формирования аудиосигнала выходного канала посредством добавления расширенной пространственной информации в пространственную информацию пояснен со ссылкой на два примера. Как упоминалось в вышеприведенном описании, в процессе повышающего микширования с добавлением расширенной пространственной информации расширенные пространственные параметры могут быть применены не полностью, а частично. Таким образом, процесс применения пространственных параметров к аудиосигналу может выполняться последовательно и иерархически или коллективно и синтетически.In the above description, the process of generating an audio signal of an output channel by adding extended spatial information to spatial information is explained with reference to two examples. As mentioned in the above description, in the process of upmixing with the addition of extended spatial information, the expanded spatial parameters may not be fully applied, but partially. Thus, the process of applying spatial parameters to an audio signal can be performed sequentially and hierarchically or collectively and synthetically.

Промышленная применимостьIndustrial applicability

Следовательно, настоящее изобретение обеспечивает следующие результаты.Therefore, the present invention provides the following results.

Во-первых, настоящее изобретение позволяет формировать аудиосигнал, имеющий конфигурацию, отличную от заранее определенной древовидной конфигурации, тем самым формируя по-разному сконфигурированные выходные сигналы.Firstly, the present invention makes it possible to generate an audio signal having a configuration different from a predetermined tree configuration, thereby generating differently configured output signals.

Во-вторых, поскольку можно формировать аудиосигнал, имеющий конфигурацию, отличную от заранее определенной древовидной конфигурации, даже если число множества каналов до выполнения понижающего микширования меньше или более числа громкоговорителей, можно сформировать выходные каналы в количестве, равном количеству громкоговорителей, из аудиосигнала понижающего микширования.Secondly, since it is possible to generate an audio signal having a configuration different from a predetermined tree configuration, even if the number of the plurality of channels before performing downmix is less than or more than the number of speakers, it is possible to generate output channels in an amount equal to the number of speakers from the downmix audio signal.

В-третьих, в случае формирования выходных каналов в количестве, меньшем множества каналов, поскольку многоканальный аудиосигнал непосредственно формируется из аудиосигнала понижающего микширования вместо понижающего микширования аудиосигнала выходного канала из многоканального аудиосигнала, сформированного при повышающем микшировании аудиосигнала понижающего микширования, можно существенно снизить нагрузку операций, требуемых для декодирования аудиосигнала.Thirdly, in the case of generating output channels in an amount smaller than the plurality of channels, since the multi-channel audio signal is directly generated from the down-mix audio signal instead of the down-mix of the output channel audio signal from the multi-channel audio signal generated during the up-mix of the down-mix audio signal, the load of operations required to decode the audio signal.

В-четвертых, поскольку пути звука учитываются при формировании комбинированной пространственной информации, настоящее изобретение предоставляет эффект псевдо-объемного звучания в случае, если вывод канала объемного звучания недоступен.Fourth, since sound paths are taken into account when generating combined spatial information, the present invention provides a pseudo-surround sound effect in case the surround channel output is not available.

Несмотря на то, что настоящее изобретение показано и описано в данном варианте осуществления со ссылкой на его предпочтительные варианты осуществления, специалистам в данной области техники должно быть очевидным, что различные модификации и изменения по форме и содержанию могут быть сделаны без отступления от сущности и объема изобретения. Таким образом, предполагается, что настоящее изобретение охватывает модификации и изменения этого изобретения, которые входят в объем формулы изобретения и ее эквивалентов.Although the present invention is shown and described in this embodiment with reference to its preferred embodiments, it will be apparent to those skilled in the art that various modifications and changes in form and content can be made without departing from the spirit and scope of the invention . Thus, it is intended that the present invention cover the modifications and variations of this invention that come within the scope of the claims and their equivalents.

Claims (18)

1. Способ декодирования аудиосигнала, содержащий:
прием аудиосигнала и пространственной информации;
формирование модифицированной пространственной информации с использованием пространственной информации и
декодирование аудиосигнала с использованием модифицированной пространственной информации,
при этом модифицированная пространственная информация включает в себя, по меньшей мере, одно из частичной пространственной информации, комбинированной пространственной информации и расширенной пространственной информации.
1. A method of decoding an audio signal, comprising:
receiving audio and spatial information;
the formation of modified spatial information using spatial information and
decoding an audio signal using modified spatial information,
wherein the modified spatial information includes at least one of the partial spatial information, the combined spatial information and the extended spatial information.
2. Способ по п.1, в котором формирование модифицированной пространственной информации выполняется на основе индикатора, включенного в пространственную информацию.2. The method according to claim 1, in which the formation of the modified spatial information is performed based on an indicator included in the spatial information. 3. Способ по п.1, в котором формирование модифицированной пространственной информации выполняется на основе древовидной конфигурационной информации, включенной в пространственную информацию.3. The method according to claim 1, in which the formation of the modified spatial information is performed based on tree configuration information included in the spatial information. 4. Способ по п.1, в котором формирование модифицированной пространственной информации выполняется на основе информации выходного канала.4. The method according to claim 1, in which the formation of the modified spatial information is performed based on the information of the output channel. 5. Способ по п.1, в котором пространственная информация включает в себя пространственные параметры, а частичная пространственная информация включает в себя часть пространственных параметров.5. The method according to claim 1, in which spatial information includes spatial parameters, and partial spatial information includes part of the spatial parameters. 6. Способ по п.5, в котором пространственные параметры являются иерархическими, а частичная пространственная информация включает в себя пространственные параметры верхнего уровня.6. The method according to claim 5, in which the spatial parameters are hierarchical, and partial spatial information includes spatial parameters of the upper level. 7. Способ по п.6, в котором частичная пространственная информация дополнительно включает в себя частично пространственные параметры нижнего уровня.7. The method according to claim 6, in which the partial spatial information further includes partially spatial parameters of the lower level. 8. Способ по п.1, в котором пространственная информация включает в себя пространственные параметры, а комбинированная пространственная информация формируется из комбинирования пространственных параметров.8. The method according to claim 1, in which the spatial information includes spatial parameters, and the combined spatial information is formed from a combination of spatial parameters. 9. Способ по п.1, в котором расширенная пространственная информация формируется с помощью пространственной информации и расширенной пространственной информации.9. The method according to claim 1, in which the extended spatial information is generated using spatial information and extended spatial information. 10. Устройство для декодирования аудиосигнала, содержащее:
блок формирования модифицированной пространственной информации, при этом упомянутый блок формирования модифицированной пространственной информации формирует модифицированную пространственную информацию с использованием пространственной информации; и
блок формирования выходного канала, декодирующий аудиосигнал с использованием модифицированной пространственной информации,
при этом модифицированная пространственная информация включает в себя, по меньшей мере, одно из частичной пространственной информации, комбинированной пространственной информации и расширенной пространственной информации.
10. An apparatus for decoding an audio signal, comprising:
a modified spatial information generating unit, wherein said modified spatial information generating unit generates modified spatial information using spatial information; and
an output channel generating unit decoding an audio signal using modified spatial information,
wherein the modified spatial information includes at least one of the partial spatial information, the combined spatial information and the extended spatial information.
11. Устройство по п.10, в котором модифицированная пространственная информация формируется на основе индикатора, включенного в пространственную информацию.11. The device according to claim 10, in which the modified spatial information is generated based on the indicator included in the spatial information. 12. Устройство по п.10, в котором модифицированная пространственная информация формируется на основе древовидной конфигурационной информации, включенной в пространственную информацию.12. The device according to claim 10, in which the modified spatial information is generated on the basis of tree configuration information included in the spatial information. 13. Устройство по п.10, в котором модифицированная пространственная информация формируется на основе информации выходного канала.13. The device according to claim 10, in which the modified spatial information is generated based on the information of the output channel. 14. Устройство по п.10, в котором пространственная информация включает в себя пространственные параметры, а частичная пространственная информация включает в себя часть пространственных параметров.14. The device according to claim 10, in which the spatial information includes spatial parameters, and partial spatial information includes part of the spatial parameters. 15. Устройство по п.14, в котором пространственные параметры являются иерархическими, а частичная пространственная информация включает в себя пространственные параметры верхнего уровня.15. The device according to 14, in which the spatial parameters are hierarchical, and partial spatial information includes spatial parameters of the upper level. 16. Устройство по п.15, в котором частичная пространственная информация дополнительно включает в себя частично пространственные параметры нижнего уровня.16. The device according to clause 15, in which the partial spatial information further includes partially spatial parameters of the lower level. 17. Устройство по п.10, в котором пространственная информация включает в себя пространственные параметры, а комбинированная пространственная информация формируется из комбинирования пространственных параметров.17. The device according to claim 10, in which the spatial information includes spatial parameters, and the combined spatial information is formed from a combination of spatial parameters. 18. Устройство по п.10, в котором расширенная пространственная информация формируется с помощью пространственной информации и расширенной пространственной информации. 18. The device according to claim 10, in which the extended spatial information is generated using spatial information and extended spatial information.
RU2008114388/09A 2005-09-14 2006-09-14 Method and device for audio signal decoding RU2380767C2 (en)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
US71652405P 2005-09-14 2005-09-14
US60/716,524 2005-09-14
US75998006P 2006-01-19 2006-01-19
US60/759,980 2006-01-19
US60/760,360 2006-01-20
US77366906P 2006-02-16 2006-02-16
US60/773,669 2006-02-16
US60/776,724 2006-02-27
US78751606P 2006-03-31 2006-03-31
US60/787,516 2006-03-31
US60/816,022 2006-06-22
KR10-2006-0078300 2006-08-18
KR20060078300 2006-08-18

Publications (2)

Publication Number Publication Date
RU2008114388A RU2008114388A (en) 2009-10-20
RU2380767C2 true RU2380767C2 (en) 2010-01-27

Family

ID=41262597

Family Applications (1)

Application Number Title Priority Date Filing Date
RU2008114388/09A RU2380767C2 (en) 2005-09-14 2006-09-14 Method and device for audio signal decoding

Country Status (1)

Country Link
RU (1) RU2380767C2 (en)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
RU2575390C2 (en) * 2011-03-18 2016-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoder and decoder having flexible configuration functionalities
US9524722B2 (en) 2011-03-18 2016-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Frame element length transmission in audio coding
US9747905B2 (en) 2005-09-14 2017-08-29 Lg Electronics Inc. Method and apparatus for decoding an audio signal

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9747905B2 (en) 2005-09-14 2017-08-29 Lg Electronics Inc. Method and apparatus for decoding an audio signal
RU2575390C2 (en) * 2011-03-18 2016-02-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Audio encoder and decoder having flexible configuration functionalities
US9524722B2 (en) 2011-03-18 2016-12-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Frame element length transmission in audio coding
US9773503B2 (en) 2011-03-18 2017-09-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder and decoder having a flexible configuration functionality
US9779737B2 (en) 2011-03-18 2017-10-03 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Frame element positioning in frames of a bitstream representing audio content

Also Published As

Publication number Publication date
RU2008114388A (en) 2009-10-20

Similar Documents

Publication Publication Date Title
US9747905B2 (en) Method and apparatus for decoding an audio signal
US20080235006A1 (en) Method and Apparatus for Decoding an Audio Signal
US20080221907A1 (en) Method and Apparatus for Decoding an Audio Signal
TWI462086B (en) Method and apparatus for decoding an audio signal
US20130304480A1 (en) Encoding and decoding of slot positions of events in an audio signal frame
CN101356572B (en) Method and apparatus for decoding an audio signal
RU2380767C2 (en) Method and device for audio signal decoding