RU2450440C1

RU2450440C1 - Audio signal processing method and device

Info

Publication number: RU2450440C1
Application number: RU2010134915/08A
Authority: RU
Inventors: Хиен-О ОХ (KR); Хиен-О ОХ; Йанг Вон ДЗУНГ (KR); Йанг Вон ДЗУНГ
Original assignee: ЭлДжи ЭЛЕКТРОНИКС ИНК.
Priority date: 2008-01-23
Filing date: 2009-01-23
Publication date: 2012-05-10
Also published as: CA2712941A1; DE602009000167D1; KR100998913B1; CN101926181A; AU2009206856B2; CA2712941C; CN101926094A; KR20090081342A; DE602009000166D1; JP5249354B2; ATE481829T1; AU2009206856A1; CN101926094B; CN101926181B; JP5319704B2; ATE481830T1; KR101024924B1; JP2011510589A; RU2010134915A; KR20090081341A

Abstract

FIELD: information technology.

SUBSTANCE: audio signal processing method involves reception of an audio signal and predetermined information; deriving a predetermined matrix from the predetermined information, wherein the predetermined matrix indicates the degree of contribution of the object in the output channel; and adjusting the output level of the object using the predetermined matrix. Consequently, if there are no user settings for each object, if predetermined metadata applied to the audio signal are selected with references to predetermined metadata, the level of objects contained in the audio signal can be easily adjusted by using predetermined rendering data corresponding to selected predetermined metadata.

EFFECT: high accuracy and efficiency of adjusting the output channel level and cutting volume of excessive coding.

15 cl, 16 dwg

Description

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение относится к способу и устройству для обработки аудиосигнала, в частности относится к устройству для обработки аудиосигнала и к соответствующему способу. Хотя настоящее изобретение подходит для широкого круга применений, оно особенно подходит для обработки аудиосигнала, принятого в виде цифрового носителя, широковещательного сигнала или т.п.The present invention relates to a method and apparatus for processing an audio signal, in particular relates to a device for processing an audio signal and to a corresponding method. Although the present invention is suitable for a wide range of applications, it is particularly suitable for processing an audio signal received in the form of a digital medium, a broadcast signal, or the like.

Уровень техникиState of the art

В общем случае в ходе создания сигнала понижающего микширования путем понижающего микширования аудиосигнала, включающего в себя множество объектов, с получением моно- или стереосигнала, из упомянутых объектов извлекают параметры (информацию). Эти параметры (информацию) используют в процессе декодирования сигнала понижающего микширования. Также можно управлять панорамированием и коэффициентами усиления объектов на основе выбора, выполняемого пользователем.In the general case, when creating a down-mix signal by down-mixing an audio signal including a plurality of objects to obtain a mono or stereo signal, parameters (information) are extracted from the said objects. These parameters (information) are used in the process of decoding the down-mix signal. You can also control the pan and gain of objects based on the selection made by the user.

Сущность изобретенияSUMMARY OF THE INVENTION

Техническая задачаTechnical challenge

Тем не менее, объектами, содержащимися в сигнале понижающего микширования, следует должным образом управлять на основе выбора, осуществляемого пользователем. Когда пользователь управляет объектом, ему неудобно управлять данным объектом напрямую и возможно ему труднее, чем это мог бы сделать эксперт, восстановить оптимальное состояние аудиосигнала, включающего в себя множество объектов, соответствующих окружающей среде.However, objects contained in the downmix signal should be properly managed based on the selection made by the user. When a user controls an object, it is inconvenient for him to control this object directly and it may be more difficult for him than an expert could do to restore the optimal state of the audio signal, which includes many objects corresponding to the environment.

Техническое решениеTechnical solution

Соответственно, настоящее изобретение направлено на создание устройства и способа обработки аудиосигнала, которые фактически решают одну или несколько проблем, возникающих из-за ограничений и недостатков существующего уровня техники.Accordingly, the present invention is directed to a device and method for processing an audio signal that actually solve one or more problems arising from the limitations and disadvantages of the existing prior art.

Задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых можно управлять объектом, содержащимся в аудиосигнале, с использованием предварительно установленной информации, включающей в себя предварительно установленные метаданные и предварительно установленные данные рендеринга.An object of the present invention is to provide a device and method for processing an audio signal with which it is possible to control an object contained in an audio signal using preset information including preset metadata and preset rendering data.

Другой задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых можно настраивать уровень объекта в выходном канале путем определения предварительно установленных данных рендеринга на основе информации об аудиосигнале в выходном канале и последующего применения предварительно установленных данных рендеринга к аудиосигналу в том случае, когда предварительно установленные данные рендеринга относятся к матричному типу.Another objective of the present invention is to provide a device and method for processing an audio signal, with which you can adjust the level of the object in the output channel by determining the preset rendering data based on information about the audio signal in the output channel and then applying the preset rendering data to the audio signal, when the preset rendering data is of a matrix type.

Еще одной задачей настоящего изобретения является создание устройства и способа для обработки аудиосигнала, с помощью которых шаг за шагом из предварительно установленной матрицы рендеринга типа «моно», переданной от кодера, или из информации об усилении шаг за шагом создают предварительно установленную матрицу рендеринга для настройки объекта.Another objective of the present invention is to provide a device and method for processing an audio signal by which, step by step, a pre-set rendering matrix for setting up an object is created from a pre-installed mono-type rendering matrix transmitted from an encoder or from gain information, step by step .

Положительные эффектыPositive effects

Соответственно, настоящее изобретение обеспечивает следующие положительные эффекты или преимущества.Accordingly, the present invention provides the following beneficial effects or advantages.

Прежде всего, согласно настоящему изобретению выбирается некоторая из предварительно установленной информации без установки для объектов, выполняемой пользователем, в результате чего облегчается настройка уровня выходного канала.First of all, according to the present invention, some of the pre-set information without installation for objects performed by the user is selected, which makes it easier to adjust the level of the output channel.

Во-вторых, настоящее изобретение представляет предварительно установленные метаданные для представления предварительно установленной информации в виде текста на основе предварительно установленной информации о длине, указывающей длину метаданных, в результате чего сокращается объем излишнего кодирования.Secondly, the present invention provides preset metadata for presenting preset information in the form of text based on preset length information indicating the length of the metadata, thereby reducing unnecessary coding.

В-третьих, в том случае, когда предварительно установленные данные рендеринга относятся к матричному типу, настоящее изобретение определяет предварительно установленную матрицу, указывающую предварительно установленные данные рендеринга на основе информации об аудиосигнале в выходном канале, в результате чего обеспечивается более точная и эффективная настройка уровня выходного канала объекта.Thirdly, in the case where the preset rendering data is of a matrix type, the present invention defines a preset matrix indicating preset rendering data based on information about an audio signal in an output channel, thereby providing a more accurate and efficient adjustment of the output level channel object.

В-четвертых, согласно настоящему изобретению предварительно установленная матрица создается шаг за шагом, в результате чего уменьшается скорость передачи данных от кодера.Fourth, according to the present invention, a preset matrix is created step by step, thereby reducing the data rate from the encoder.

В-пятых, в настоящем изобретении предварительно установленная матрица используется для настройки объектов только частично, в результате чего сокращается объем излишнего кодирования.Fifthly, in the present invention, the pre-installed matrix is used to configure objects only partially, which reduces the amount of redundant coding.

Краткое описание чертежейBrief Description of the Drawings

Сопроводительные чертежи, которые предусмотрены для обеспечения более детального представления об изобретении и образуют часть этого описания, иллюстрируют варианты осуществления изобретения и вместе с описанием служат для объяснения принципов изобретения.The accompanying drawings, which are provided to provide a more detailed understanding of the invention and form part of this description, illustrate embodiments of the invention and together with the description serve to explain the principles of the invention.

На чертежах:In the drawings:

фиг.1 - концептуальная схема предварительно установленной информации, применяемой к объекту, содержащемуся в аудиосигнале, согласно варианту настоящего изобретения;1 is a conceptual diagram of preset information applied to an object contained in an audio signal according to an embodiment of the present invention;

фиг.2 - блок-схема устройства обработки аудиосигнала согласно варианту настоящего изобретения;FIG. 2 is a block diagram of an audio signal processing apparatus according to an embodiment of the present invention; FIG.

фиг.3 - блок-схема блока приема предварительно установленной информации в устройстве обработки аудиосигнала согласно варианту настоящего изобретения;FIG. 3 is a block diagram of a unit for receiving preset information in an audio signal processing apparatus according to an embodiment of the present invention; FIG.

фиг.4 - блок-схема способа обработки аудиосигнала согласно варианту настоящего изобретения;4 is a flowchart of an audio signal processing method according to an embodiment of the present invention;

фиг.5 - схема синтаксиса согласно варианту настоящего изобретения;5 is a diagram of a syntax according to a variant of the present invention;

фиг.6 - схема синтаксиса согласно еще одному варианту настоящего изобретения;6 is a syntax diagram according to another embodiment of the present invention;

фиг.7 - схема синтаксиса согласно дополнительному варианту настоящего изобретения;7 is a syntax diagram according to a further embodiment of the present invention;

фиг.8 - блок-схема блока приема предварительно установленных данных рендеринга согласно дополнительному варианту настоящего изобретения;FIG. 8 is a block diagram of a unit for receiving preset rendering data according to a further embodiment of the present invention; FIG.

фиг.9 - схема синтаксиса согласно другому дополнительному варианту настоящего изобретения;FIG. 9 is a syntax diagram according to another further embodiment of the present invention; FIG.

фиг.10 - блок-схема устройства обработки аудиосигнала согласно другому варианту настоящего изобретения;10 is a block diagram of an audio signal processing apparatus according to another embodiment of the present invention;

фиг.11 - блок-схема оборудования, реализующего блок приема предварительно установленной информации согласно варианту настоящего изобретения;11 is a block diagram of equipment that implements a unit for receiving preset information according to an embodiment of the present invention;

фиг.12 - схема взаимосвязи между терминалом и сервером согласно оборудованию, показанному на фиг.11;12 is a diagram of the relationship between the terminal and the server according to the equipment shown in FIG. 11;

фиг.13 - блок-схема блока приема предварительно установленной информации для реализации применительно к цифровому телевидению согласно варианту настоящего изобретения; иFIG. 13 is a block diagram of a unit for receiving preset information for implementation with respect to digital television according to an embodiment of the present invention; FIG. and

фиг.14 - схема блока отображения для оборудования, включающего в себя блок приема предварительно установленной информации согласно одному варианту настоящего изобретения.14 is a diagram of a display unit for equipment including a unit for receiving preset information according to one embodiment of the present invention.

Наилучший вариант осуществления изобретенияBest Mode for Carrying Out the Invention

Дополнительные признаки и преимущества изобретения изложены в последующем описании и частично могут быть выяснены из этого описания, либо представление о них можно получить в результате практической реализации изобретения. Задачи и другие преимущества изобретения реализуются и поддерживаются структурой, детально указанной в описании изобретения и формуле изобретения, а также на прилагаемых чертежах.Additional features and advantages of the invention are set forth in the following description and may be partly clarified from this description, or an understanding of them can be obtained as a result of the practical implementation of the invention. The objectives and other advantages of the invention are realized and supported by the structure detailed in the description of the invention and the claims, as well as in the accompanying drawings.

Для достижения указанных и других преимуществ и в соответствии с задачей настоящего изобретения способ обработки аудиосигнала согласно настоящему изобретению включает в себя: прием аудиосигнала и предварительно установленной информации, причем аудиосигнал включает в себя по меньшей мере один объект; получение предварительно установленной матрицы из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал; настройку выходного уровня объекта согласно выходному каналу путем использования предварительно установленной матрицы; и вывод аудиосигнала, включающего в себя объект с настроенным выходным уровнем, причем предварительно установленную информацию получают на основе предварительно установленной информации о наличии, указывающей, что предварительно установленная информация существует, и предварительно установленной информации о номерах, указывающей номер предварительно установленной информации, причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.To achieve these and other advantages, and in accordance with the object of the present invention, an audio signal processing method according to the present invention includes: receiving an audio signal and preset information, the audio signal including at least one object; obtaining a pre-installed matrix from pre-installed information, and the pre-installed matrix indicates the degree of contribution of the object to the output channel; setting the output level of the object according to the output channel by using a pre-installed matrix; and outputting an audio signal including an object with a configured output level, wherein pre-set information is obtained based on pre-set availability information indicating that pre-set information exists and pre-set number information indicating a number of pre-set information, and pre-set a matrix is obtained based on preset type information indicating that the preset All information is presented in the matrix.

Предварительно установленную матрицу предпочтительно получают на основе информации о выходном канале, указывающей о том, что выходной канал является моноканалом, стереоканалом или многоканальным.A preset matrix is preferably obtained based on the output channel information indicating that the output channel is a mono channel, a stereo channel, or multi-channel.

Предварительно установленную информацию о типе предпочтительно представляют 1 битом.The preset type information is preferably 1 bit.

Более предпочтительно определять размерность предварительно установленной матрицы на основе номера объекта и номера выходного канала.It is more preferable to determine the dimension of the preset matrix based on the object number and the output channel number.

Кроме того, для достижения этих и других преимуществ и в соответствии с задачей настоящего изобретения устройство для обработки аудиосигнала согласно настоящему изобретению включает в себя: блок приема аудиосигнала, принимающий аудиосигнал, включающий в себя по меньшей мере один объект; блок приема предварительно установленных метаданных, принимающий предварительно установленные метаданные из предварительно установленной информации, причем блок приема предварительно установленных метаданных получает по меньшей мере некоторые из предварительно установленных метаданных по меньшей мере из некоторой предварительно установленной информации; блок приема предварительно установленных данных рендеринга, получающий предварительно установленную матрицу из предварительно установленной информации, причем предварительно установленная матрица указывает степень вклада объекта в выходной канал, и причем предварительно установленная матрица соответствует предварительно установленным метаданным; блок отображения, отображающий предварительно установленные метаданные; блок ввода, принимающий команду для выбора некоторых из предварительно установленных метаданных; блок настройки объекта, настраивающий выходной уровень объекта согласно выходному каналу путем использования предварительно установленной матрицы, соответствующей выбранным предварительно установленным метаданным; и блок вывода, выводящий аудиосигнал, включающий в себя объект с настроенным выходным уровнем. Предпочтительно, чтобы блок отображения отображал выбранные предварительно установленные метаданные, когда блок вывода выводит аудиосигнал.In addition, to achieve these and other advantages, and in accordance with the object of the present invention, an audio signal processing apparatus according to the present invention includes: an audio signal receiving unit receiving an audio signal including at least one object; a pre-set metadata receiving unit receiving the pre-set metadata from the pre-set information, the pre-set metadata receiving unit receiving at least some of the pre-set metadata from at least some pre-set information; a unit for receiving preset rendering data receiving a preset matrix from the preset information, the preset matrix indicating the degree of contribution of the object to the output channel, and the preset matrix corresponding to the preset metadata; a display unit displaying predefined metadata; an input unit receiving a command for selecting some of the predefined metadata; an object setting unit that adjusts the output level of the object according to the output channel by using a predefined matrix corresponding to the selected predefined metadata; and an output unit outputting an audio signal including an object with a configured output level. Preferably, the display unit displays the selected predefined metadata when the output unit outputs an audio signal.

Предпочтительно, чтобы блок отображения, кроме того, отображал выходной уровень объекта.Preferably, the display unit, in addition, displays the output level of the object.

Предварительно установленную матрицу предпочтительно получают на основе информации о выходном канале, указывающей, что выходной канал является моноканалом, стереоканалом или многоканальным.A preset matrix is preferably obtained based on the output channel information indicating that the output channel is a mono channel, a stereo channel, or multi-channel.

Предварительно установленную информацию получают на основе предварительно установленной информации о номерах, указывающей номер предварительно установленной информации, причем предварительно установленную матрицу получают на основе предварительно установленной информации о типе, указывающей, что предварительно установленная информация представлена в матрице.The preset information is obtained based on the preset information on the numbers indicating the number of the preset information, the preset matrix being obtained on the basis of the preset type information indicating that the preset information is presented in the matrix.

Предпочтительно, чтобы предварительно установленная информация, кроме того, содержала предварительно установленную информацию о применении к объекту, указывающую, существует ли предварительно установленная матрица, применяемая к объектам.Preferably, the preset information further comprises preset application information for an object indicating whether there is a preset matrix applied to the objects.

Предпочтительно, чтобы блок отображения дополнительно отображал, существует ли предварительно установленная матрица, подлежащая применению к объекту, на основе предварительно установленной информации о применении к объекту.Preferably, the display unit additionally displays whether there is a pre-installed matrix to be applied to the object, based on the pre-installed information about the application to the object.

Более предпочтительно, чтобы блок отображения отображал предварительно установленные метаданные в виде текста.More preferably, the display unit displays the preset metadata as text.

Должно быть понятно, что как предшествующее общее описание, так и последующее подробное описание носят иллюстративный и разъяснительный характер и предназначены обеспечить дополнительное понимание заявленного изобретения.It should be understood that both the foregoing general description and the following detailed description are illustrative and explanatory in nature and are intended to provide further understanding of the claimed invention.

Вариант осуществления изобретенияAn embodiment of the invention

Далее следуют подробные ссылки на предпочтительные варианты настоящего изобретения, примеры которых показаны на сопроводительных чертежах.The following are detailed references to preferred embodiments of the present invention, examples of which are shown in the accompanying drawings.

Прежде всего, термин «информация» в данном описании трактуется в общем случае как: значения, параметры, коэффициенты, элементы и т.п., а термин «объект» может трактоваться как сигнал источника, образующий аудиосигнал гитары, вокала, фортепиано или т.п. Их смысл может трактоваться подчас по-разному, но настоящее изобретение этим не ограничивается.First of all, the term “information” in this description is interpreted in the general case as: values, parameters, coefficients, elements, etc., and the term “object” can be interpreted as a source signal that generates the audio signal of a guitar, vocals, piano, etc. P. Their meaning can sometimes be interpreted in different ways, but the present invention is not limited to this.

При декодировании аудиосигнала, включающего в себя множество объектов, настоящее изобретение обеспечивает способ эффективного декодирования аудиосигнала с использованием некоторой из предварительно установленной информации для настройки объектов.When decoding an audio signal including a plurality of objects, the present invention provides a method for efficiently decoding an audio signal using some of the preset information for setting objects.

На фиг.1 представлена концептуальная схема настоящего изобретения, применимая к объекту, содержащемуся в аудиосигнале, согласно варианту настоящего изобретения. В данном описании заранее установленная информация для настройки объекта называется предварительно установленной информацией. Предварительно установленная информация может указывать один из различных режимов, выбираемых в соответствии с характеристикой аудиосигнала или окружающей среды при прослушивании. Также может существовать множество видов предварительно установленной информации. Кроме того, предварительно установленная информация включает в себя метаданные для представления атрибута предварительно установленной информации или т.п., а также данные рендеринга, применяемые для настройки объекта. Метаданные могут быть представлены в текстовом виде. Метаданные не только указывают атрибут (например, режим концертного зала, режим караоке, режим новостей и т.д.) предварительно установленной информации, но также включают в себя соответствующую информацию для представления предварительно установленной информации, такой как автор предварительно установленной информации, дата записи, название объекта, имеющего применяемую к нему предварительно установленную информацию, и т.п. Между тем, данные рендеринга представляют собой данные, фактически применяемые к объекту. Данные рендеринга могут иметь одну из различных форм. В частности, данные рендеринга могут существовать в матричном виде.Figure 1 presents a conceptual diagram of the present invention, applicable to the object contained in the audio signal according to a variant of the present invention. In this description, pre-set information for setting up an object is called pre-set information. The preset information may indicate one of various modes selected according to the characteristics of the audio signal or the environment when listening. There may also be many kinds of preset information. In addition, the preset information includes metadata for representing the attribute of the preset information or the like, as well as rendering data used to configure the object. Metadata can be presented in text form. Metadata not only indicates an attribute (e.g., concert hall mode, karaoke mode, news mode, etc.) of preset information, but also includes relevant information for representing preset information, such as author of preset information, recording date, the name of the object having the predefined information applied to it, etc. Meanwhile, the rendering data is the data actually applied to the object. Rendering data can take one of various forms. In particular, rendering data may exist in matrix form.

Обратимся к фиг.1, где предварительно установленной информацией 1 может быть режим концертного зала для обеспечения звукового сценического эффекта, позволяющего слышать музыкальный сигнал, как в концертном зале. Предварительно установленной информацией 1 может быть режим караоке, снижающий уровень вокального объекта в аудиосигнале. Наконец, предварительно установленной информацией n может быть режим новостей, поднимающий уровень речевого объекта. Кроме того, предварительно установленная информация 2 включает в себя метаданные 2 и данные 2 рендеринга. Если пользователь выбирает предварительно установленную информацию 2, то в блоке отображения будет реализован режим караоке метаданных 2 и можно будет настроить уровень, применив к объекту данные 2 рендеринга, соответствующие метаданным 2.Turning to FIG. 1, where the preset information 1 can be a concert hall mode to provide a stage sound effect that allows you to hear a musical signal, like in a concert hall. The preset information 1 may be a karaoke mode that reduces the level of a vocal object in the audio signal. Finally, the preset information n can be a news mode raising the level of a speech object. In addition, the preset information 2 includes metadata 2 and rendering data 2. If the user selects the preset information 2, then the karaoke mode of metadata 2 will be implemented in the display unit and it will be possible to adjust the level by applying rendering data 2 corresponding to metadata 2 to the object.

В этом случае, если данные рендеринга относятся к матричному типу, они могут включать в себя матрицу моно, матрицу стерео или многоканальную матрицу. Матрица моно представляет собой данные рендеринга, применяемые в том случае, когда выходным каналом объекта является моноканал. Матрица стерео представляет собой данные рендеринга, применяемые в том случае, когда выходным каналом объекта является стереоканал. И многоканальная матрица представляет собой данные рендеринга, применяемые в том случае, когда выходной канал объекта является многоканальным. Как только определен выходной канал объекта, определяют матрицу, используя определенный выходной канал. Затем, применяя упомянутую матрицу к объекту, можно настроить уровень.In this case, if the rendering data is of a matrix type, it may include a mono matrix, a stereo matrix, or a multi-channel matrix. The mono matrix is the rendering data used when the output channel of the object is a mono channel. The stereo matrix is the rendering data used when the output channel of the object is a stereo channel. And the multi-channel matrix is the rendering data used when the output channel of the object is multi-channel. Once the output channel of the object is determined, a matrix is determined using the specific output channel. Then, applying the mentioned matrix to the object, you can adjust the level.

Таким образом, используя метаданные и данные рендеринга, содержащиеся в предварительно установленной информации, выполняют настройку объекта и представляют атрибут или признак применяемой предварительно установленной информации. Таким образом, можно эффективно обеспечить аудиосигнал с эффектом, необходимым конкретному пользователю.Thus, using metadata and rendering data contained in the predefined information, the object is set up and an attribute or attribute of the applied predefined information is presented. Thus, it is possible to efficiently provide an audio signal with the effect needed by a particular user.

На фиг.2 представлена блок-схема устройства 200 обработки аудиосигнала согласно варианту настоящего изобретения.2 is a block diagram of an audio signal processing apparatus 200 according to an embodiment of the present invention.

Обратимся к фиг.2, где устройство 200 обработки аудиосигнала согласно варианту настоящего изобретения может включать в себя блок 210 создания предварительно установленной информации и блок 2210 приема предварительно установленной информации, а также блок 230 настройки объекта.Referring to FIG. 2, where an audio signal processing apparatus 200 according to an embodiment of the present invention may include a preset information generating unit 210 and a preset information receiving unit 2210, as well as an object setting unit 230.

Блок 210 создания предварительно установленной информации создает предварительно установленную информацию для настройки объекта, включенного в аудиосигнал. Блок 210 создания предварительно установленной информации может включать в себя блок 212 создания метаданных и блок 214 создания предварительно установленных данных рендеринга. Блок 212 создания метаданных принимает на входе текстовую информацию для представления предварительно установленной информации, после чего он способен создавать предварительно установленные метаданные. Как упоминалось в предшествующем описании, предварительно установленные метаданные могут представлять собой информацию для представления характеристики или атрибута предварительно установленной информации. В этом случае блок 212 создания метаданных может дополнительно создавать информацию о предварительно установленной длине, указывающую число для длины предварительно установленных метаданных. В этом случае информация о предварительно установленной длине может быть представлена в байтах, но примеры информации о предварительно установленной длине этим не ограничиваются.The preset information creating unit 210 creates preset information for tuning an object included in the audio signal. The preset information creating unit 210 may include metadata creating unit 212 and preset rendering data creating unit 214. The metadata generating unit 212 receives input text information for presenting preset information, after which it is able to create predefined metadata. As mentioned in the preceding description, the preset metadata may be information for representing a characteristic or attribute of the preset information. In this case, the metadata generating unit 212 may further generate preset length information indicating a number for the length of the preset metadata. In this case, information about the preset length can be represented in bytes, but examples of information about the preset length are not limited to this.

Между тем, если в блок 214 создания предварительно установленных данных рендеринга введена информация об усилении для настройки уровня объекта и панорамировании объекта, то имеется возможность создания предварительно установленных данных рендеринга для их применения к объектам. В этом случае предварительно установленные данные рендеринга можно создавать для каждого объекта и реализовать по одному из возможных различных типов. Например, предварительно установленными данными рендеринга может быть предварительно установленная матрица, реализованная по матричному типу. Кроме того, блок 214 создания предварительно установленных данных рендеринга может дополнительно создавать предварительно установленную информацию о типе (preset_type_flag), указывающую, представлены ли предварительно установленные данные рендеринга в виде матрицы. Кроме того, блок 214 создания предварительно установленных данных рендеринга может создавать информацию о выходном канале, указывающую, сколько выходных каналов имеет объект.Meanwhile, if gain information for adjusting the level of the object and panning the object is entered into the block 214 for creating the preset rendering data, it is possible to create the preset rendering data for applying them to the objects. In this case, predefined rendering data can be created for each object and implemented in one of various possible types. For example, the pre-set rendering data may be a pre-installed matrix implemented in a matrix type. In addition, the preset rendering data creating unit 214 may further create preset type information (preset_type_flag) indicating whether the preset rendering data is presented in a matrix form. In addition, the block 214 creating pre-set rendering data can create information about the output channel, indicating how many output channels the object has.

Предварительно установленная информация о длине и предварительно установленные метаданные, созданные блоком 212 создания метаданных, а также предварительно установленная информация о типе, информация о выходном канале и предварительно установленные данные рендеринга, созданные блоком 214 создания предварительно установленных данных рендеринга, могут транспортироваться, будучи включенными в один битовый поток, и, в частности, будучи включенными в служебную область битового потока, включающего в себя аудиосигнал.The preset length information and the preset metadata created by the metadata creation unit 212, as well as the preset type information, the output channel information and the preset rendering data created by the preset rendering data block 214 can be transported, being included in one a bit stream, and, in particular, being included in the service area of a bit stream including an audio signal.

Между тем, блок 210 создания предварительно установленной информации может дополнительно создавать предварительно установленную информацию о наличии, указывающую, включены ли в битовый поток предварительно установленная информация о длине, предварительно установленные метаданные, предварительно установленная информация о типе, информация о выходном канале и предварительно установленные данные рендеринга. Предварительно установленная информация о наличии может относиться к контейнерному типу, дающему информацию о том, в какой области существует предварительно установленная информация, или относится к типу «флаг», но примеры предварительно установленной информации о наличии этим не ограничиваются.Meanwhile, the preset information creating unit 210 may further create preset availability information indicating whether preset length information, preset metadata, preset type information, output channel information, and preset rendering data are included in the bitstream . The preset availability information may be of the container type, giving information about which area the preset information exists in, or the flag type, but examples of preset availability information are not limited to this.

Кроме того, блок 210 создания предварительно установленной информации способен создавать предварительно установленную информацию. Предварительно установленная информация включает в себя предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходном канале и предварительно установленную информацию о рендеринге. В этом случае блок 210 создания предварительно установленной информации может дополнительно создавать предварительно установленную информацию о номерах, указывающую номер предварительно установленной информации.In addition, the preset information generating unit 210 is capable of generating preset information. The preset information includes preset length information, preset metadata, preset type information, output channel information, and preset rendering information. In this case, the preset information generating unit 210 may further create preset number information indicating a preset information number.

Блок 220 приема предварительно установленной информации принимает предварительно установленную информацию, созданную и переданную блоком 210 создания предварительно установленной информации. Блок 220 приема предварительно установленной информации может включать в себя блок 222 приема метаданных и блок 224 приема предварительно установленных данных рендеринга.The preset information receiving unit 220 receives the preset information created and transmitted by the preset information creating unit 210. The preset information receiving unit 220 may include a metadata receiving unit 222 and a preset rendering data receiving unit 224.

Блок 222 приема метаданных принимает, а затем выдает предварительно установленные метаданные, а блок 224 приема предварительно установленных данных рендеринга принимает предварительно установленные данные рендеринга (например, предварительно установленную матрицу), подробности которых объясняются со ссылками на фиг.3 и фиг.4.The metadata receiving unit 222 receives and then outputs the preset metadata, and the predefined rendering data receiving unit 224 receives the preset rendering data (e.g., a preset matrix), the details of which are explained with reference to FIG. 3 and FIG. 4.

Блок 230 настройки объекта принимает аудиосигнал, включающий в себя множество объектов, и предварительно установленные данные рендеринга, созданные блоком 224 приема данных рендеринга. В этом случае предварительно установленные данные рендеринга применяют к объекту, в результате чего может быть настроен уровень или положение объекта.The object setting unit 230 receives an audio signal including a plurality of objects and pre-set rendering data created by the rendering data receiving unit 224. In this case, the preset rendering data is applied to the object, as a result of which the level or position of the object can be adjusted.

На фиг.3 представлена блок-схема блока 310 приема метаданных и блока 320 приема предварительно установленных данных рендеринга, входящих в блок 200 приема предварительно установленной информации в устройстве 200 обработки аудиосигнала согласно варианту настоящего изобретения.FIG. 3 is a block diagram of a metadata reception unit 310 and a pre-set rendering data block 320 included in a pre-set information receiving unit 200 in an audio signal processing apparatus 200 according to an embodiment of the present invention.

Обратимся к фиг.3, где блок 310 приема метаданных включает в себя блок 312 приема предварительно установленной информации о длине и блок 314 приема предварительно установленных метаданных. Блок 312 приема предварительно установленной информации о длине принимает предварительно установленную информацию о длине, указывающую длину предварительно установленных метаданных, для представления предварительно установленной информации, а затем получает длину предварительно установленных метаданных. После этого блок 314 приема предварительно установленных метаданных считывает из битового потока длину, указанную в предварительно установленной информации о длине, а затем принимает предварительно установленные метаданные. Кроме того, блок 314 приема предварительно установленных метаданных преобразует предварительно установленные метаданные, которые указывают тип или атрибут предварительно установленной информации, в метаданные текстового типа, а затем выводит преобразованные предварительно установленные метаданные текстового типа.Referring to FIG. 3, the metadata receiving unit 310 includes a predefined length information receiving unit 312 and a predefined metadata receiving unit 314. The preset length information reception unit 312 receives the preset length information indicating the length of the preset metadata to represent the preset information, and then obtains the length of the preset metadata. After that, the pre-set metadata reception unit 314 reads the length indicated in the pre-set length information from the bitstream, and then receives the pre-set metadata. In addition, the pre-set metadata reception unit 314 converts the pre-set metadata, which indicates the type or attribute of the pre-set information, into text type metadata, and then outputs the converted pre-set text type metadata.

Блок 320 приема предварительно установленных данных рендеринга включает в себя блок 322 приема предварительно установленного флага типа, блок 324 приема информации о выходном канале и блок 326 приема предварительно установленной матрицы. Блок 322 приема предварительно установленного флага типа данных принимает предварительно установленный флаг типа (preset_type_flag), указывающий, относятся ли предварительно установленные данные рендеринга к матричному типу. В этом случае значение предварительно установленного флага типа показано в Таблице.The pre-set rendering data receiving unit 320 includes a pre-set type flag receiving unit 322, an output channel information receiving unit 324, and a pre-installed matrix receiving unit 326. The preset data type flag receiving unit 322 receives a preset type flag (preset_type_flag) indicating whether the preset rendering data is of a matrix type. In this case, the value of the preset type flag is shown in the Table.

Предварительно установленный флаг типаPreset type flag ЗначениеValue 00 Предварительно установленные данные рендеринга не относятся к матричному типуPreset rendering data is not matrix type 1one Предварительно установленные данные рендеринга относятся к матричному типуPreset rendering data are of matrix type

Если предварительно установленный флаг типа указывает на случай, когда предварительно установленные данные рендеринга относятся к матричному типу, блок 324 приема информации о выходном канале принимает информацию о выходных каналах, указывающую число выходных каналов, по которым будет воспроизводиться объект, включенный в аудиосигнал. Информация о выходных каналах может включать в себя моноканал, стереоканал или указывать на многоканальность (канал 5.1), но пример информации о выходных каналах этим не ограничивается.If the pre-set type flag indicates a case where the pre-set rendering data is of the matrix type, the output channel information reception unit 324 receives output channel information indicating the number of output channels through which the object included in the audio signal will be played. Information about the output channels may include a mono channel, a stereo channel, or indicate multi-channel (channel 5.1), but the example of information about the output channels is not limited to this.

Блок 326 приема предварительно установленной матрицы принимает и выводит предварительно установленную матрицу, указывающую степень вклада объекта в выходной канал в соответствии с предварительно установленными метаданными на основе информации о выходном канале. В этом случае предварительно установленная матрица может включать в себя одно из следующего: предварительно установленную матрицу моно, предварительно установленную матрицу стерео и предварительно установленную многоканальную матрицу. Размерность предварительно установленной матрицы определяется на основе номера объекта и номера выходного канала. Следовательно, предварительно установленная матрица может быть матрицей вида (номер объекта)*(номер выходного канала). Например, если имеется n объектов, содержащихся в аудиосигнале, и выходной канал из блока 324 приема информации о выходных каналах соответствует каналу 5.1 (то есть шесть каналов), то блок 326 приема предварительно установленной матрицы может определить предварительно установленную многоканальную матрицу (смотри формулу 1), реализованную в виде n*6.The pre-installed matrix receiving unit 326 receives and outputs a pre-installed matrix indicating the degree of contribution of the object to the output channel in accordance with the pre-set metadata based on the output channel information. In this case, the pre-installed matrix may include one of the following: a pre-installed mono matrix, a pre-installed stereo matrix, and a pre-installed multi-channel matrix. The dimension of the pre-installed matrix is determined based on the object number and the output channel number. Therefore, the pre-installed matrix can be a matrix of the form (object number) * (output channel number). For example, if there are n objects contained in the audio signal, and the output channel from the output channel information receiving unit 324 corresponds to channel 5.1 (i.e., six channels), then the preset matrix receiving unit 326 can determine the preset multichannel matrix (see formula 1) implemented as n * 6.

[Формула 1][Formula 1]

В формуле 1 матричная компонента m_a,b представляет собой значение усиления, указывающее меру, которая характеризует вклад a-го объекта в b-й канал. Затем, применив предварительно установленную многоканальную матрицу к аудиосигналу, можно настроить уровень соответствующего объекта.In formula 1, the matrix component m _{a, b} is a gain value indicating a measure that characterizes the contribution of the a-th object to the b-th channel. Then, applying a pre-installed multi-channel matrix to the audio signal, you can adjust the level of the corresponding object.

Таким образом, блок 220 приема предварительно установленной информации согласно настоящему изобретению эффективно представляет предварительно установленные метаданные путем считывания битового потока в необходимом объеме с использованием предварительно установленной информации о длине и способен эффективно настраивать усиление объекта, содержащегося в аудиосигнале, и т.п., получив предварительно установленную матрицу на основе информации о выходном канале.Thus, the pre-set information reception unit 220 according to the present invention efficiently represents the pre-set metadata by reading the bit stream in the required volume using the pre-set length information and is able to efficiently adjust the gain of the object contained in the audio signal and the like, having previously received an established matrix based on information about the output channel.

На фиг.4 показана блок-схема способа обработки аудиосигнала согласно варианту настоящего изобретения.4 is a flowchart of an audio signal processing method according to an embodiment of the present invention.

Обратимся к фиг.4, где на шаге S410 принимается аудиосигнал, включающий в себя по меньшей мере один объект. На шаге S415 принимают предварительно установленную информацию о наличии, указывающую, существует ли предварительно установленная информация для настройки усиления или указано панорамирование объекта. Если предварительно установленная информация существует, то принимают (шаг S420) предварительно установленную численную информацию, указывающую, сколько (n) видов предварительно установленной информации существует. Предварительно установленная численная информация предполагает, что предварительно установленная информация существует и может быть представлена в виде «(номер действительно существующей предварительно установленной информации) - 1». Затем принимают (шаг S430) предварительно установленную информацию о длине, указывающую, сколько имеется бит (или байт) метаданных для представления предварительно установленной информации. На основе предварительно установленной информации о длине принимают (шаг S435) предварительно установленные метаданные. Например, выводят (шаг S437) режим караоке, режим концертного зала, режим новостей или т.п. В этом случае предварительно установленные метаданные могут относиться к текстовому типу. Как упоминалось в вышеприведенном описании, предварительно установленные метаданные могут включать в себя данные, раскрывающие автора предварительно установленной информации, дату написания, название объекта, настраиваемого с помощью предварительно установленной информации, и т.п., а также метаданные, представляющие звуковой сценический эффект предварительно установленной информации, причем примеры предварительно установленных метаданных этим не ограничиваются.Referring to FIG. 4, in step S410, an audio signal including at least one object is received. In step S415, pre-set presence information is received indicating whether there is pre-set information for adjusting gain or whether the object is panned. If the preset information exists, then (step S420) a preset numerical information indicating how many (n) kinds of preset information exists is received. Pre-installed numerical information assumes that pre-installed information exists and can be represented in the form "(the number of truly existing pre-installed information) is 1". Then, pre-set length information is received (step S430) indicating how many metadata bits (or bytes) are available to represent the pre-set information. Based on the preset length information, the preset metadata is received (step S435). For example, a karaoke mode, a concert hall mode, a news mode, or the like are output (step S437). In this case, the predefined metadata may be of a text type. As mentioned in the above description, the preset metadata may include data disclosing the author of the preset information, the date of writing, the name of the object, customizable using the preset information, etc., as well as metadata representing the sound stage effect of the preset information, and examples of predefined metadata are not limited to this.

Затем принимают (шаг S440) предварительно установленную информацию о типе, указывающую тип предварительно установленных данных рендеринга, включенных в предварительно установленную информацию. На основе предварительно установленной информации о типе на шаге S445 определяют, относится ли тип предварительно установленных данных к матричному типу. Если типом предварительно установленных данных является матричный тип («да» на шаге S445), то на шаге S450 принимают информацию о выходном канале, указывающую, сколько объектных каналов существует. На основе информации о выходном канале на шаге S455 принимают соответствующую предварительно установленную матрицу из закодированной предварительно установленной матрицы. Размерность предварительно установленной матрицы определяют на основе номера объекта и номера выходного канала. Например, если выходным каналом объекта является стереоканал, то принятой предварительно установленной матрицей окажется предварительно установленная матрица стерео типа «(номер объекта)*2».Then, pre-set type information indicating the type of pre-set rendering data included in the pre-set information is received (step S440). Based on the preset type information, it is determined in step S445 whether the type of the preset data is of a matrix type. If the type of the preset data is a matrix type (“yes” in step S445), then in step S450, output channel information is received indicating how many object channels exist. Based on the output channel information in step S455, a corresponding pre-set matrix is received from the encoded pre-set matrix. The dimension of the pre-installed matrix is determined based on the object number and the output channel number. For example, if the object’s output channel is a stereo channel, then the received pre-installed matrix will be a pre-installed stereo matrix such as “(object number) * 2”.

На шаге S460 определяют, меньше ли индекс i предварительно установленной информации (i-й), включающей в себя принятую ранее предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходных каналах и предварительно установленную матрицу, чем число (n) предустановок, указанных в предварительно заданной численной информации. Если i меньше числа, указанного в предварительно установленной информации («да» на шаге S460), то процедура возвращается к шагу S430, а затем повторяется шаг приема предварительно установленной информации о длине для следующей предустановки [(i+1)-й]. Если i-я предустановка равна числу в предварительно установленной информации («нет» на шаге S460), то на шаге S465 настраивают уровень объекта с применением к аудиосигналу предварительно установленной матрицы. Между тем, если в матрице не присутствует упомянутая предварительно установленная матрица («нет» на шаге S445), то на шаге S457 принимают предварительно установленные данные, реализованные в типе, за исключением матрицы, установленной кодером. Затем на шаге S468 настраивают уровень объекта, применяя к аудиосигналу принятые предварительно установленные данные. Далее можно вывести аудиосигнал, включающий в себя настроенный объект (S470).In step S460, it is determined whether the index i of the pre-set information (i-th) including the previously received pre-set length information, pre-set metadata, pre-set type information, output channel information, and a preset matrix is smaller than the number (n) presets indicated in predefined numerical information. If i is less than the number specified in the preset information (“yes” in step S460), the procedure returns to step S430, and then the step of receiving the preset length information for the next preset is repeated [(i + 1) th]. If the i-th preset is equal to the number in the preset information (“no” in step S460), then in step S465, the level of the object is adjusted using a preset matrix for the audio signal. Meanwhile, if the pre-installed matrix is not present in the matrix (“no” in step S445), then in step S457, the pre-set data implemented in the type is received, with the exception of the matrix set by the encoder. Then, in step S468, the level of the object is adjusted by applying the received preset data to the audio signal. Next, you can output an audio signal including a tuned object (S470).

На шаге S465 настройки объекта с применением предварительно установленной матрицы можно использовать предварительно установленную матрицу, выбранную пользователем (не показано). Пользователь способен выбрать предварительно установленные метаданные, соответствующие предварительно установленной матрице, причем предварительно установленные метаданные выводят на шаге S437 вывода метаданных. Например, если пользователь выбирает из предварительно установленных метаданных метаданные, представленные как режим караоке, то из принятой на шаге S455 предварительно установленной матрицы на основе информации о выходном канале выбирается предварительно установленная матрица, соответствующая предварительно установленным метаданным для режима караоке. Затем с применением к аудиосигналу выбранной предварительно установленной матрицы, соответствующей режиму караоке, выполняют настройку уровня объекта. После этого выполняется вывод аудиосигнала, включающего в себя настроенный объект.In step S465, setting the object using the pre-installed matrix, you can use the pre-installed matrix selected by the user (not shown). The user is able to select the preset metadata corresponding to the preset matrix, wherein the preset metadata is output in metadata output step S437. For example, if the user selects metadata presented as a karaoke mode from the pre-set metadata, then a pre-set matrix corresponding to the pre-set metadata for the karaoke mode is selected from the pre-set matrix from the pre-set metadata in step S455. Then, using the selected pre-installed matrix corresponding to the karaoke mode to the audio signal, the level of the object is adjusted. After that, the audio signal including the tuned object is output.

На фиг.5 представлена схема синтаксиса согласно варианту настоящего изобретения.5 is a syntax diagram according to an embodiment of the present invention.

Обратимся к фиг.5, где информация, соответствующая предварительно установленной информации, может существовать в области заголовка битового потока. Таким образом, предварительно установленную численную информацию (bsNumPresets) можно получить из области заголовка битового потока.Referring to FIG. 5, where information corresponding to preset information may exist in the header area of the bitstream. Thus, preset numerical information (bsNumPresets) can be obtained from the header area of the bitstream.

Если предварительно установленная численная информация существует (если (bsNumPresets)), то получают номер предварительно установленной информации, который указан в предварительно установленной информации о номерах [numPresets = bsNumPresets+1]. Например, если существует одна предварительно установленная информация, то предварительно установленная информация о номерах может установить «bsNumPresets» в 0. В этом случае действительный номер предварительно установленной информации определяется и используется как «(предварительно установленная информация о номерах)+1». Сначала предварительно установленная информация о номерах может быть получена из битового потока.If pre-set numerical information exists (if (bsNumPresets)), then get the number of pre-set information, which is specified in the pre-set information about the numbers [numPresets = bsNumPresets + 1]. For example, if there is one pre-set information, then the pre-set number information can set “bsNumPresets” to 0. In this case, the actual number of the pre-set information is determined and used as “(pre-set number information) +1”. First, preset number information can be obtained from the bitstream.

На основе предварительно установленной информации о номерах можно получить информацию, указывающую тип предварительно установленных данных рендеринга для каждой предварительно установленной информации (i-я предустановка) (bsPresetType[i]). Если случай пересылки предварительно установленных данных рендеринга по матричному типу определить как специальный предварительно установленный тип (случай пересылки bsPresetType[i] при матричном типе), то информацией, указывающей тип предварительно установленных данных рендеринга, может быть вышеупомянутая предварительно установленная информация о типе (preset_type_flag), указывающая, были ли созданы и переданы предварительно установленные данные рендеринга по матричному типу. В этом случае предварительно установленная информация о типе может быть представлена в виде одного бита.Based on the preset information about the numbers, information can be obtained indicating the type of preset rendering data for each preset information (ith preset) (bsPresetType [i]). If the case of sending predefined rendering data by the matrix type is defined as a special predefined type (the case of sending bsPresetType [i] with the matrix type), then the information indicating the type of predefined rendering data may be the aforementioned preset type information (preset_type_flag), indicating whether the predefined matrix type rendering data has been created and transmitted. In this case, the preset type information can be represented as a single bit.

Если предварительно установленные данные рендеринга, включенные в i-ю предварительно установленную информацию, относятся к матричному типу (bsPresetType[i]), то получают информацию о выходных каналах (bsPresetCh[i]), указывающую, сколько каналов имеется в выходном канале. Наконец, получают предварительно установленную матрицу для настройки уровня объекта, содержащегося в аудиосигнале, на основе информации о выходном канале (getRenderingMatrix()).If the preset rendering data included in the ith preset information is of the matrix type (bsPresetType [i]), then information about the output channels (bsPresetCh [i]) is obtained, indicating how many channels are in the output channel. Finally, a pre-installed matrix is obtained for adjusting the level of the object contained in the audio signal based on information about the output channel (getRenderingMatrix ()).

На фиг.6 показана схема синтаксиса, представляющего способ обработки аудиосигнала согласно другому варианту настоящего изобретения. Предварительно установленная информация существует в области заголовка и впоследствии может быть применена ко всем кадрам одинаковым образом. В альтернативном варианте предварительно установленную информацию применяют по-разному в зависимости от времени (далее это называется «переменная во времени») для эффективной настройки уровня объекта. Если предварительно установленная информация является переменной во времени, то информация, соответствующая предварительно установленной информации, должна быть предусмотрена для каждого кадра. Таким образом, информацию, указывающую, предусмотрена ли предварительно установленная информация для каждого кадра, включают в заголовок, в результате чего можно обеспечить эффективную конфигурацию битового потока.6 is a syntax diagram showing an audio signal processing method according to another embodiment of the present invention. Preset information exists in the header area and can subsequently be applied to all frames in the same way. Alternatively, the preset information is applied differently depending on the time (hereinafter referred to as “time variable”) to effectively adjust the level of the object. If the preset information is variable over time, then information corresponding to the preset information should be provided for each frame. Thus, information indicating whether preset information is provided for each frame is included in the header, whereby an efficient bitstream configuration can be ensured.

Обратимся к фиг.6, где показан синтаксис, указывающий, включена ли предварительно установленная информация для каждого кадра. Этот синтаксис аналогичен прежнему синтаксису, показанному на фиг.5, который указывает способ обработки аудиосигнала, показанный на фиг.5. Синтаксис, показанный на фиг.6, может еще включать в себя предварительно установленную информацию об изменяющемся во времени флаге (bsPresetTimeVarying[i]), указывающую, является ли предварительно установленная информация переменной во времени, то есть для каждого кадра после получения информации о выходном канале (bsPresetCh[i]). Если в область заголовка битового потока включена предварительно установленная информация об изменяющемся во времени флаге, настраивается уровень объекта с использованием предварительно установленной матрицы и предварительно установленных метаданных, включенных в область кадра битового потока. Если предварительно установленная информация об изменяющемся во времени флаге в заголовке присутствует, то определяется, имеется ли обновление предварительно установленной информации для каждого кадра. Если обновления нет, то отдельный флаг устанавливают в состояние «удержание». Если обновление есть, то отдельный флаг устанавливают в состояние «считывание». Таким образом, предоставляется возможность эффективной настройки битового потока путем настройки отдельного флага.Referring to FIG. 6, a syntax is shown indicating whether preset information for each frame is included. This syntax is similar to the previous syntax shown in FIG. 5, which indicates the audio processing method shown in FIG. 5. The syntax shown in FIG. 6 may also include preset time-varying flag information (bsPresetTimeVarying [i]) indicating whether the preset information is time-varying, that is, for each frame after receiving the output channel information (bsPresetCh [i]). If the preset information about the time-varying flag is included in the header area of the bitstream, the level of the object is adjusted using the preset matrix and the preset metadata included in the frame area of the bitstream. If preset information about a time-varying flag is present in the header, then it is determined if there is an update of the preset information for each frame. If there is no update, then a separate flag is set to “hold”. If there is an update, then a separate flag is set to the "read" state. Thus, it is possible to efficiently configure the bitstream by setting a separate flag.

Кроме того, в битовом потоке имеется предварительно установленная информация о наличии (bsPresetExists), указывающая, существует ли предварительно установленная информация в битовом потоке. Если предварительно установленная информация о наличии указывает, что предварительно установленная информация не существует в битовом потоке, то может не выполняться цикл для получения предварительно установленной информации о номерах (bsNumPresets), предварительно установленной информации о типе (bsPresetType[i]), информации о выходном канале (bsPresetCh[i]) и предварительно установленной информации об изменяющемся во времени флаге (bsPresetTimeVarying[i]). Предварительно установленная информация может быть опущена в данном синтаксисе, если это необходимо.In addition, the bitstream has predefined availability information (bsPresetExists) indicating whether predefined information exists in the bitstream. If the preset availability information indicates that the preset information does not exist in the bitstream, then the loop may not be executed to obtain the preset number information (bsNumPresets), the preset type information (bsPresetType [i]), the output channel information (bsPresetCh [i]) and preset information about the time-varying flag (bsPresetTimeVarying [i]). Preset information can be omitted in this syntax, if necessary.

На фиг.7 показана схема синтаксиса, представляющего способ обработки аудиосигнала согласно дополнительному варианту настоящего изобретения. Вышеописанная предварительно установленная матрица представляет собой матрицу типа «(число объектов)*(число выходных каналов)» и указывает степень вклада объекта в выходной канал. В этом случае благодаря приему и использованию информации только о некоторых объектах можно уменьшить количество передаваемых битов, что повышает эффективность обработки. Таким образом, в дополнительном варианте настоящего изобретения предлагается синтаксис для способа обработки аудиосигнала, обеспечивающий настройку конкретного объекта с использованием только предварительно установленной информации.7 is a syntax diagram representing an audio signal processing method according to a further embodiment of the present invention. The predefined matrix described above is a matrix of the type “(number of objects) * (number of output channels)” and indicates the degree of contribution of the object to the output channel. In this case, due to the reception and use of information about only certain objects, the number of transmitted bits can be reduced, which increases the processing efficiency. Thus, in a further embodiment of the present invention, a syntax for an audio signal processing method is provided, which enables tuning of a particular object using only preset information.

Обратимся к фиг.7, где синтаксис может дополнительно включать в себя предварительно установленную информацию о применении к объекту (bsPresetObject[i][j]), указывающую применимость предварительно установленной информации для настройки уровня объекта к каждому объекту. Используя предварительно установленную информацию о применимости к объекту, можно дать знать, включает ли предварительно установленная информация информацию о соответствующем объекте. Предварительно установленная информация о применимости к объекту может существовать в области заголовка битового потока. Если предварительно установленная информация изменяется во времени, как показано на фиг.6, предварительно установленная информация о применимости к объекту может находиться в кадре. Можно дать знать, что предварительно установленная информация для каждого объекта включает в себя информацию о соответствующем объекте, как показано на фиг.7. Наконец, в битовый поток может быть включен индекс объекта, указывающий наличие или отсутствие включения. При использовании индекса объекта можно сконфигурировать битовый поток в более удобном виде, используя символ выхода.Referring to FIG. 7, where the syntax may further include preset application information for an object (bsPresetObject [i] [j]) indicating the applicability of the preset information to adjust the level of the object to each object. Using the predefined information about the applicability to the object, you can let know whether the preset information includes information about the corresponding object. Preset applicability information for the object may exist in the header area of the bitstream. If the preset information changes over time, as shown in FIG. 6, the preset information on applicability to the object may be in the frame. You can let know that the preset information for each object includes information about the corresponding object, as shown in Fig.7. Finally, an object index may be included in the bitstream indicating the presence or absence of inclusion. When using the object index, you can configure the bitstream in a more convenient way using the exit symbol.

В случае выполнения кодирования без потерь с использованием таблицы Хаффмана или т.п. символ выхода создает таблицу, имеющую параметры, превосходящие действующие параметры на 1. В этом случае в качестве параметра выхода может быть задан дополнительно распределенный параметр. В частности, если параметр выхода получают из битового потока, его можно использовать как определяющий то, что получена вся соответствующая информация. Например, если предварительно установленная информация включает в себя информацию только о двух объектах, а всего их 10 (информацию о 3-м объекте и информацию о 8-м объекте), то можно эффективно сконфигурировать битовый поток путем пересылки индекса Хаффмана, соответствующего 3-му и 8-му объектам, а затем индекса Хаффмана, соответствующего параметру выхода.In the case of lossless coding using a Huffman table or the like the output symbol creates a table having parameters that are 1 in excess of the current parameters. In this case, an additionally distributed parameter can be specified as the output parameter. In particular, if the output parameter is obtained from the bitstream, it can be used as determining that all relevant information has been received. For example, if the preset information includes information about only two objects, and there are 10 of them (information about the 3rd object and information about the 8th object), then you can effectively configure the bitstream by sending the Huffman index corresponding to the 3rd and 8 objects, and then the Huffman index corresponding to the exit parameter.

На фиг.8 представлена блок-схема блока приема предварительно установленных данных рендеринга для пошагового создания предварительно установленной матрицы согласно дополнительному варианту настоящего изобретения.FIG. 8 is a block diagram of a unit for receiving preset rendering data for step-by-step creating a preset matrix according to a further embodiment of the present invention.

Обратимся к фиг.8, где блок 320 приема предварительно установленных данных рендеринга включает в себя блок 322 приема предварительно установленного флага типа данных, блок 324 приема информации о выходном канале и блок 326 определения предварительно установленной матрицы. Остальные элементы имеют конфигурации и функции, подобные блокам 224-320 приема предварительно установленных данных рендеринга, показанным на фиг.2/3, в связи с чем их подробное описание далее опущено.Referring to FIG. 8, where a block 320 for receiving preset rendering data includes a block 322 for receiving a preset data type flag, a block 324 for receiving output channel information and a block 326 for determining a preset matrix. The remaining elements have configurations and functions similar to blocks 224-320 for receiving preset rendering data shown in FIGS. 2/3, and therefore their detailed description will be omitted hereinafter.

Между тем, блок 326 определения предварительно установленной матрицы, показанный на фиг.8, включает в себя блок 810 приема предварительно установленной матрицы типа «моно», блок 820 создания предварительно установленной матрицы типа «стерео» и блок 830 создания предварительно установленной матрицы многоканального типа.Meanwhile, the pre-installed matrix determining unit 326 shown in FIG. 8 includes a “mono” type pre-installed matrix receiving unit 810, a “stereo” type pre-installed matrix creating unit 820, and a multi-channel type pre-installed matrix creating unit 830.

Блок 810 приема предварительно установленной матрицы типа «моно» принимает предварительно установленную матрицу «моно», представленную в виде матрицы типа «число объектов» из блока создания предварительно установленной информации (не показан). Если информация о выходном канале, полученная из блока 324 приема информации о выходном канале, относится к типу «моно», то предварительно установленная матрица «моно» выводится, как она есть. Выведенная предварительно установленная матрица «моно» применяется к аудиосигналу для настройки уровня объекта.Block 810 receiving a pre-installed matrix of the type "mono" receives a pre-installed matrix of "mono", presented in the form of a matrix of the type "number of objects" from the block creating the preset information (not shown). If the output channel information obtained from the output channel information receiving unit 324 is of the “mono” type, then the pre-installed “mono” matrix is output as it is. The outputted pre-installed “mono” matrix is applied to the audio signal to adjust the level of the object.

Между тем, если информация о выходном канале относится к типу «стерео», то предварительно установленная матрица «моно» вводится в блок 820 создания предварительно установленной матрицы типа «стерео». Дополнительно вводится информация о расширении канала для создания предварительно установленной матрицы «стерео» типа «(число объектов)*2». Если информация о выходном канале указывает на многоканальный тип, то в блок 830 создания предварительно установленной матрицы многоканального типа вводится предварительно установленная матрица «стерео» и информация о многоканальном расширении для создания предварительно установленной многоканальной матрицы типа «(число объектов)*6».Meanwhile, if the information about the output channel is of the type “stereo”, then the pre-installed matrix “mono” is entered into block 820 creating a pre-installed matrix of the type “stereo”. Additionally, information is added about the channel extension to create a pre-installed matrix of "stereo" type "(number of objects) * 2". If the information about the output channel indicates a multi-channel type, then the preset matrix “stereo” and multi-channel extension information are input into the block 830 for creating a pre-installed matrix of the multi-channel type to create a pre-installed multi-channel matrix of the type “(number of objects) * 6”.

Таким образом, кодер создает только предварительно установленную матрицу «моно», а блок 326 определения предварительно установленной матрицы пошагово создает предварительно установленную матрицу с использованием информации о расширении каналов. Следовательно, если конфигурация воспроизведения сводится лишь к «стерео», то имеется возможность сэкономить некоторое количество передаваемых бит. И тогда предварительно установленную матрицу для стереоканала или многоканальную матрицу можно передавать без избыточности.Thus, the encoder only creates the “mono” pre-installed matrix, and the pre-installed matrix determining unit 326 step-by-step creates the pre-installed matrix using channel extension information. Therefore, if the playback configuration is reduced only to “stereo”, then it is possible to save a certain number of transmitted bits. And then the pre-installed matrix for the stereo channel or multi-channel matrix can be transmitted without redundancy.

В способе обработки аудиосигнала согласно дополнительному варианту настоящего изобретения предлагается способ пересылки значения усиления при передаче предварительно установленной или передаче нормализованной предварительно установленной матрицы, если это необходимо. Это можно распространить на способ передачи значения усиления только в том случае, если усиление необходимо для настройки объекта, содержащегося в аудиосигнале, или сравнительно легкой передачи всей предварительно установленной матрицы. Например, чтобы переслать предварительно установленную матрицу, показанную в формуле 1, первым делом следует переслать информацию о n*6 значениях усиления. В этом случае информацию об усилении можно вычислить по формуле 2.In an audio signal processing method according to a further embodiment of the present invention, there is provided a method of transmitting a gain value when transmitting a preset or transmitting a normalized preset matrix, if necessary. This can be extended to the method of transmitting the gain value only if the gain is necessary to adjust the object contained in the audio signal, or to relatively easily transmit the entire pre-installed matrix. For example, in order to send the preset matrix shown in formula 1, the first thing to do is send information about n * 6 gain values. In this case, gain information can be calculated by formula 2.

[Формула 2][Formula 2]

В формуле 2 'i' указывает объект, 'j' указывает выходной канал, а 'nCH' указывает количество выходных каналов. Поскольку количество Gi соответствует количеству объектов, для предварительно установленной информации потребуется число n.In formula 2, 'i' indicates an object, 'j' indicates an output channel, and 'nCH' indicates the number of output channels. Since the number of Gi corresponds to the number of objects, a number n is required for the preset information.

Если необходима информация о панорамировании и информация об усилении, то дополнительно используют нормализованную предварительно установленную матрицу. В этом случае нормализованная предварительно установленная матрица может быть определена согласно формуле 3.If panning information and gain information are needed, then a normalized pre-installed matrix is additionally used. In this case, the normalized pre-installed matrix can be determined according to formula 3.

[Формула 3][Formula 3]

В случае использования в раскрытом выше способе информации об усилении и нормализованной предварительно установленной матрицы потребуется пересылка информации о n*6 значениях усиления. Кроме того, в характеристиках нормализации имеется такая характеристика, как

, причем значение десятичного логарифма для

всегда меньше или равно 0. Следовательно, в случае использования таблицы приращений канального уровня для квантования информации об усилении, будет использована только половина известной таблицы. Это поможет сэкономить объем необходимых данных, а также сохранить скорость передачи в битах по сравнению с приемом с использованием ненормализованной предварительно установленной матрицы без отдельной пересылки информации об усилении. Кроме того, поскольку информация об усилении может быть включена только в предварительно установленную информацию, появляется возможность использования предварительно установленной информации в масштабируемом виде.In the case of using gain information and a normalized pre-installed matrix in the method disclosed above, it will be necessary to send information about n * 6 gain values. In addition, in the characteristics of normalization there is such a characteristic as

, and the value of the decimal logarithm for

always less than or equal to 0. Therefore, in the case of using the channel level increment table to quantize gain information, only half of the known table will be used. This will help to save the amount of necessary data, as well as save the bit rate in comparison with the reception using an abnormal pre-installed matrix without separate transmission of gain information. In addition, since gain information can only be included in preset information, it becomes possible to use the preset information in a scalable manner.

На фиг.9 представлена схема синтаксиса согласно еще одному дополнительному варианту настоящего изобретения, в котором информация об усилении и соответствующая информация о панорамировании пересылается по отдельности включенной в предварительно установленную информацию. Информация об усилении и информация о панорамировании могут быть включены в область заголовка или кадра.FIG. 9 is a syntax diagram according to yet another further embodiment of the present invention, in which gain information and corresponding panning information are sent individually included in preset information. Gain information and pan information can be included in the header or frame area.

Обратимся к фиг.9, где часть, набранная курсивным шрифтом, указывает, что из битового потока принимается действующее предварительно установленное значение. В наличии имеются различные схемы помехоустойчивого кодирования, которые представлены на фиг.9 в виде функций. Например, если вышеупомянутая информация находится в области кадра, то проверяют, имеется ли предварительно установленная информация. Если предварительно установленная информация существует, то принимают предварительно установленную информацию о номерах. Затем в первую очередь принимают информацию об усилении. Информацией об усилении является информация, указывающая, что соответствующий объект будет воспроизведен с предписанным значением усиления. В этом случае информацией об усилении может быть вышеупомянутый параметр G_i или произвольное усиление понижающего микширования (далее сокращенно обозначено как ADG), которое создается, если уровень аудиосигнала настраивают на значение, введенное извне.Turning to FIG. 9, a portion in italics indicates that a valid preset value is being received from the bitstream. Various jamming coding schemes are available, which are shown in FIG. 9 as functions. For example, if the above information is in the frame area, then it is checked whether there is predefined information. If pre-set information exists, then pre-set number information is received. Then, gain information is received first. Gain information is information indicating that a corresponding object will be reproduced with a prescribed gain value. In this case, the gain information may be the aforementioned parameter G_i or an arbitrary down-mix gain (hereinafter abbreviated as ADG), which is created if the audio signal level is adjusted to a value input from the outside.

Дополнительно получаемая информация о панорамировании может относиться к одному из нескольких различных типов. Информация о панорамировании может включать в себя вышеупомянутую нормализованную предварительно установленную матрицу. Информацию о панорамировании можно разделить на информацию о панорамировании стерео и информацию о многоканальном панорамировании.Additionally, obtained panning information may be one of several different types. The panning information may include the aforementioned normalized preset matrix. The panning information can be divided into stereo panning information and multi-channel panning information.

На фиг.10 представлена блок-схема устройства обработки аудиосигнала согласно другому варианту настоящего изобретения.10 is a block diagram of an audio signal processing apparatus according to another embodiment of the present invention.

Обратимся к фиг.10, где устройство обработки аудиосигнала согласно другому варианту настоящего изобретения в основном включает в себя блок 1010 понижающего микширования, блок 1020 создания информации об объекте, блок 1030 создания предварительно установленной информации, блок 1040 обработки сигнала понижающего микширования, блок 1050 обработки информации и блок 1060 многоканального декодирования.Referring to FIG. 10, where an audio signal processing apparatus according to another embodiment of the present invention mainly includes a downmix unit 1010, an object information creation unit 1020, a preset information creation unit 1030, a downmix signal processing unit 1040, and an information processing unit 1050 and block 1060 multi-channel decoding.

Прежде всего, в блок 1010 понижающего микширования вводится множество объектов, после чего создается моно- или стереосигнал понижающего микширования. Также в блок 1020 создания информации об объектах вводится множество объектов, после чего создается информация об уровне объекта, указывающая уровень объекта, информация об усилении объекта, указывающая меру вклада объекта, включенного в сигнал понижающего микширования в случае, когда значение усиления объекта включено в сигнал понижающего микширования, и/или стереосигнал понижающего микширования, а также информацию об объекте, включающую в себя информацию о корреляции объектов, указывающую о наличии или отсутствии корреляции между объектами.First of all, a plurality of objects are inputted to the downmix block 1010, after which a mono or stereo downmix signal is created. Also, a plurality of objects is inputted into the object information creating block 1020, after which the object level information indicating the level of the object, information about the gain of the object, indicating the measure of the contribution of the object included in the downmix signal when the gain value of the object is included in the downmix signal is created mixing, and / or stereo down-mixing signal, as well as object information, including object correlation information indicating the presence or absence of correlation between the object ktami.

Затем сигнал понижающего микширования и объектная информация вводятся в блок 1030 создания предварительно установленной информации, чтобы создать предварительно установленную информацию, включающую в себя предварительно установленные данные рендеринга для настройки уровня объекта и предварительно установленные метаданные для представления предварительно установленной информации. Процесс создания предварительно установленных данных рендеринга и предварительно установленных метаданных достаточно хорошо объяснен в предшествующем описании устройства и способа обработки аудиосигнала, показанных на фиг.1-9, в связи с чем в последующем описании соответствующие подробности опущены. Между тем, объектная информация, созданная блоком 1020 создания объектной информации, и предварительно установленная информация, созданная блоком 1030 создания предварительно установленной информации, могут пересылаться, будучи включенными в битовый поток SAOC.Then, the downmix signal and the object information are input to the preset information creating unit 1030 to create preset information including preset rendering data for adjusting the level of the object and preset metadata for representing the preset information. The process of creating preset rendering data and preset metadata is reasonably well explained in the previous description of the apparatus and method for processing the audio signal shown in FIGS. 1-9, and therefore, the corresponding details are omitted in the following description. Meanwhile, the object information created by the object information creating unit 1020 and the preset information created by the preset information creating unit 1030 can be sent while being included in the SAOC bitstream.

Блок 1050 обработки информации включает в себя блок 1051 обработки объектной информации и блок 1052 приема предварительно установленной информации. Наконец, блок 1050 обработки информации принимает битовый поток SAOC.The information processing unit 1050 includes an object information processing unit 1051 and a preset information reception unit 1052. Finally, the information processing unit 1050 receives the SAOC bitstream.

Блок 1052 приема предварительно установленной информации принимает из битового потока SAOC вышеупомянутую предварительно установленную информацию о наличии, предварительно установленную информацию о номерах, предварительно установленную информацию о длине, предварительно установленные метаданные, предварительно установленную информацию о типе, информацию о выходном канале и предварительно установленную матрицу и использует упомянутые способы согласно различным объясненным вариантам изобретения для способа и устройства обработки аудиосигнала, показанным на фиг.1-9. Наконец, блок 1052 приема предварительно установленной информации выводит предварительно установленные метаданные и предварительно установленную матрицу. Блок 1051 обработки объектной информации принимает предварительно установленные метаданные и предварительно установленную матрицу, а затем создает информацию, необходимую для обработки понижающего микширования, для предобработки сигнала понижающего микширования и многоканальную информацию для повышающего микширования сигнала понижающего микширования с использованием объектной информации, включенной в битовый поток SAOC вместе с предварительно установленными метаданными и предварительно установленной матрицей.The pre-set information reception unit 1052 receives from the SAOC bit stream the aforementioned pre-set availability information, pre-set number information, pre-set length information, pre-set metadata, pre-set type information, output channel information and a pre-set matrix and uses the above methods according to various explained variants of the invention for the method and processing device a the signal shown in figures 1-9. Finally, the preset information receiving unit 1052 outputs the preset metadata and the preset matrix. The object information processing unit 1051 receives the preset metadata and the preset matrix, and then generates the information necessary for downmix processing to preprocess the downmix signal and multichannel information for upmix the downmix signal using the object information included in the SAOC bitstream together with predefined metadata and a predefined matrix.

Затем, когда информация об обработке понижающего микширования введена в блок 1040 обработки сигнала понижающего микширования, появляется возможность выполнения панорамирования объекта, включенного в сигнал понижающего микширования. Предварительно обработанный вышеописанным образом сигнал понижающего микширования вводится в блок 1060 многоканального декодирования вместе с многоканальной информацией, выведенной из блока 1050 обработки информации, после чего выполняется повышающее микширование для создания многоканального аудиосигнала.Then, when the downmix processing information is inputted to the downmix signal processing unit 1040, it becomes possible to pan the object included in the downmix signal. The down-mix signal previously processed in the manner described above is input to the multi-channel decoding unit 1060 together with multi-channel information output from the information processing unit 1050, after which up-mixing is performed to create a multi-channel audio signal.

Таким образом, при декодировании аудиосигнала, содержащего множество объектов, в многоканальный сигнал с использованием объектной информации устройство обработки аудиосигнала согласно настоящему изобретению приспособлено для настройки уровня объекта с использованием предварительно установленной информации. Действуя таким образом, устройство обработки аудиосигнала согласно настоящему изобретению эффективно выполняет настройку уровня объекта, используя данные о типе матрицы, полученные на основе информации о выходном канале, в виде предварительно установленной матрицы, применяемой к объекту. Наконец, устройство обработки аудиосигнала согласно настоящему изобретению способно повысить эффективность кодирования путем вывода предварительно установленных метаданных на основе предварительно установленной информации о длине, переданной со стороны кодера.Thus, when decoding an audio signal containing a plurality of objects into a multi-channel signal using object information, the audio signal processing apparatus of the present invention is adapted to adjust the level of an object using preset information. Acting in this way, the audio signal processing apparatus of the present invention efficiently adjusts the level of an object using matrix type data obtained based on the output channel information in the form of a pre-installed matrix applied to the object. Finally, the audio signal processing apparatus of the present invention is capable of increasing encoding efficiency by outputting preset metadata based on preset length information transmitted from the encoder.

На фиг.11 представлена блок-схема оборудования, реализующего блок приема предварительно установленной информации, который включает в себя блок приема метаданных и блок приема предварительно установленных данных рендеринга согласно варианту настоящего изобретения, а на фиг.12 показана схема взаимосвязей между терминалом и сервером согласно оборудованию, показанному на фиг.11.Fig. 11 is a block diagram of equipment implementing a pre-set information reception unit, which includes a metadata reception unit and a pre-set rendering data reception unit according to an embodiment of the present invention, and Fig. 12 shows a relationship diagram between a terminal and a server according to equipment shown in Fig.11.

Обратимся к фиг.11, где блок 1110 проводной/беспроводной связи принимает битовый поток с помощью системы проводной/беспроводной связи. В частности, блок 1110 проводной/беспроводной связи может включать в себя по меньшей мере один блок из группы, состоящей из блока 1111 проводной связи, блока 1112 инфракрасной связи, блока 1113 Bluetooth и блока 1114 беспроводной связи по сети LAN.Referring to FIG. 11, a wired / wireless communication unit 1110 receives a bitstream using a wired / wireless communication system. In particular, the wired / wireless communication unit 1110 may include at least one unit from the group consisting of the wired communication unit 1111, the infrared communication unit 1112, the Bluetooth unit 1113, and the wireless communication unit 1114 via a LAN.

Блок 1120 аутентификации пользователя принимает введенную информацию о пользователе, а затем выполняет аутентификацию пользователя. Блок 1120 аутентификации пользователя может включать в себя по меньшей мере один блок из группы, состоящей их блока 1121 распознавания по отпечаткам пальцев, блок 1122 распознавания по радужной оболочке, блок 1123 распознавания по лицу и блок 1124 распознавания по голосу. В данном случае аутентификация пользователя может выполняться путем приема введенной информации об отпечатках пальцев, информации о радужной оболочке, информации о контуре лица или информации о голосе, преобразования введенной информации в информацию о пользователе с последующим определением того, соответствует ли информация о пользователе зарегистрированным данным об этом пользователе.The user authentication unit 1120 receives the entered user information, and then performs user authentication. The user authentication unit 1120 may include at least one block from the group consisting of their fingerprint recognition unit 1121, the iris recognition unit 1122, the face recognition unit 1123, and the voice recognition unit 1124. In this case, user authentication can be performed by receiving the entered fingerprint information, iris information, face contour information or voice information, converting the entered information into user information, and then determining whether the user information matches the registered data about it user.

Блок 1130 ввода представляет собой устройство ввода, позволяющее пользователю вводить команды различных видов. Блок 1130 ввода может включать в себя по меньшей мере один блок из группы, состоящей из блока 1131 клавиатуры, блока 1132 сенсорной панели и блока 1133 удаленного контроллера, причем указанные примеры блока 1130 ввода этим не ограничиваются. Между тем, если предварительно установленные метаданные для предварительно установленной информации, выводимой из блока 1141 приема данных, описываемого ниже, визуализируются на экране через блок 1162 отображения, пользователь имеет возможность выбрать предварительно установленные метаданные через блок 1130 ввода, а информация о выбранных предварительно установленных метаданных вводится в блок 1150 управления.Block 1130 input is an input device that allows the user to enter commands of various kinds. The input unit 1130 may include at least one unit from the group consisting of a keyboard unit 1131, a touch panel unit 1132, and a remote controller unit 1133, and these examples of the input unit 1130 are not limited to this. Meanwhile, if the preset metadata for the preset information output from the data receiving unit 1141 described below is visualized on the screen through the display unit 1162, the user is able to select the preset metadata through the input unit 1130, and information about the selected preset metadata is entered to a control unit 1150.

Блок 1140 декодирования сигнала включает в себя блок 1141 приема метаданных и блок 1142 приема предварительно установленных данных рендеринга. Блок 1141 приема метаданных принимает предварительно установленную информацию о длине, а затем принимает предварительно установленные метаданные на основе принятой предварительно установленной информации о длине. Если предустановка представлена в виде матрицы с помощью предварительно установленной информации о типе, то блок 1142 приема предварительно установленных данных рендеринга принимает информацию о выходном канале, а затем принимает предварительно установленную матрицу, представляющую собой предварительно установленные данные рендеринга, на основе принятой информации о выходном канале. Блок 1140 декодирования сигнала создает выходной сигнал путем декодирования аудиосигнала с использованием принятого битового потока, предварительно установленных метаданных и предварительно установленной матрицы и выводит предварительно установленные метаданные текстового типа.The signal decoding unit 1140 includes a metadata receiving unit 1141 and a predefined rendering data receiving unit 1142. The metadata receiving unit 1141 receives the preset length information, and then receives the preset metadata based on the received preset length information. If the preset is presented in the form of a matrix using the preset type information, then the block 1142 receiving the preset rendering data receives information about the output channel, and then receives a preset matrix representing the preset rendering data based on the received information about the output channel. A signal decoding unit 1140 generates an output signal by decoding an audio signal using a received bitstream, a preset metadata and a preset matrix, and outputs a preset text type metadata.

Блок 1150 управления принимает сигналы, поступившие из устройств ввода, и управляет всеми процессами в блоке 1140 декодирования сигнала и блоке 1160 вывода. Как упоминалось в вышеприведенном описании, если информация о выбранных предварительно установленных метаданных введена в блок 1150 управления из блока 1130 ввода, блок 1142 приема предварительно установленных данных рендеринга принимает предварительно установленную матрицу, соответствующую выбранным предварительно установленным метаданным, а затем декодирует аудиосигнал, используя принятую предварительно установленную матрицу.The control unit 1150 receives signals from input devices and controls all processes in the signal decoding unit 1140 and the output unit 1160. As mentioned in the above description, if information about the selected pre-set metadata is input to the control unit 1150 from the input unit 1130, the pre-set rendering data receiving unit 1142 receives a preset matrix corresponding to the selected pre-set metadata, and then decodes the audio signal using the received pre-set matrix.

Наконец, блок 1160 вывода является элементом, предназначенным для вывода выходного сигнала и т.п., созданного блоком 1140 декодирования сигнала. Блок 1160 вывода может включать в себя блок 1161 динамиков и блок 1162 отображения. Если выходным сигналом является аудиосигнал, то он выводится через блок 1161 динамиков. Если выходным сигналом является видеосигнал, то он выводится через блок 1162 отображения. Кроме того, блок 1160 вывода визуализирует предварительно установленные метаданные, введенные из блока 1150 управления, на экране через блок 1162 отображения.Finally, the output unit 1160 is an element for outputting an output signal or the like created by the signal decoding unit 1140. The output unit 1160 may include a speaker unit 1161 and a display unit 1162. If the output signal is an audio signal, then it is output through the block 1161 speakers. If the output signal is a video signal, then it is output through the display unit 1162. In addition, the output unit 1160 visualizes the preset metadata entered from the control unit 1150 on the screen through the display unit 1162.

На фиг.12 показаны взаимосвязи между терминалами или между терминалом и сервером, каждый из которых соответствует оборудованию, показанному на фиг.11.On Fig shows the relationship between the terminals or between the terminal and the server, each of which corresponds to the equipment shown in Fig.11.

Обратимся к части (А) на фиг.12, из которой можно видеть, что между первым терминалом 1210 и вторым терминалом 1220 может осуществляться двусторонняя передача данных или битовых потоков через блоки проводной/беспроводной связи.Turning to part (A) in FIG. 12, from which it can be seen that between the first terminal 1210 and the second terminal 1220, two-way data or bit streams can be transmitted through wired / wireless communication units.

Обратимся к части (В) на фиг.12, где можно видеть, что проводная/беспроводная передача может осуществляться между сервером 1230 и первым терминалом 1240.Turning to part (B) of FIG. 12, where it can be seen that wired / wireless transmission can take place between the server 1230 and the first terminal 1240.

На фиг.13 представлена блок-схема устройства 1300 декодирования широковещательного сигнала, который реализует функцию блока приема предварительно установленной информации, содержащего блок приема метаданных и блок приема предварительно установленных данных рендеринга согласно одному варианту настоящего изобретения.13 is a block diagram of a broadcast signal decoding apparatus 1300 that implements the function of a preset information receiving unit comprising a metadata receiving unit and a receiving unit of preset rendering data according to one embodiment of the present invention.

Обратимся к фиг.13, где демультиплексор 1320 принимает множество данных, относящихся к телевизионному вещанию, от селектора 1310 каналов. Принятые данные разделяются демультиплексором 1320, а затем декодируются декодером 1330 данных. Между тем, данные, разделенные демультиплексором 1320, могут быть запомнены на носителе 1350 данных, таком как HDD. Данные, разделенные демультиплексором 1320, вводятся в декодер, включающий в себя аудиодекодер 1341 и видеодекодер 1342, для их декодирования в аудиосигнал и видеосигнал. Аудиодекодер 1341 включает в себя блок 1341А приема метаданных и блок 1341В приема предварительно установленных данных рендеринга согласно одному варианту настоящего изобретения. Блок 1341А приема метаданных принимает предварительно установленную информацию о длине, а затем принимает предварительно установленные метаданные на основе принятой предварительно установленной информации о длине.Turning to FIG. 13, a demultiplexer 1320 receives a plurality of television broadcast data from a channel selector 1310. The received data is separated by a demultiplexer 1320, and then decoded by the data decoder 1330. Meanwhile, data shared by the demultiplexer 1320 may be stored on a storage medium 1350, such as an HDD. Data separated by a demultiplexer 1320 is input to a decoder including an audio decoder 1341 and a video decoder 1342 to decode them into an audio signal and a video signal. The audio decoder 1341 includes a metadata reception unit 1341A and a predefined rendering data reception unit 1341B according to one embodiment of the present invention. The metadata receiving unit 1341A receives the preset length information, and then receives the preset metadata based on the received preset length information.

Если предварительно установленная информация представлена в матрице, то блок 1341В приема предварительно установленных данных рендеринга принимает информацию о выходном канале, а затем принимает предварительно установленную матрицу, представляющую предварительно установленные данные рендеринга, на основе принятой информации о выходном канале. Аудиодекодер 1341 создает выходной сигнал путем декодирования аудиосигнала с использованием принятого битового потока, предварительно установленных метаданных и предварительно установленной матрицы и выводит предварительно установленные метаданные текстового типа.If the preset information is presented in the matrix, then the block 1341B receiving preset rendering data receives information about the output channel, and then receives a preset matrix representing the preset rendering data based on the received information about the output channel. An audio decoder 1341 generates an output signal by decoding an audio signal using a received bitstream, a preset metadata and a preset matrix, and outputs a preset text type metadata.

Блок 1370 отображения визуализирует видеосигнал, выведенный из видеодекодера 1342, и предварительно установленные метаданные, выведенные из аудиодекодера 1341. Блок 1370 отображения включает в себя блок динамиков (не показан). Аудиосигнал, в котором с использованием предварительно установленной матрицы настроен уровень объекта, выведенного из аудиодекодера 1341, выводится через блок динамиков, входящий в блок 1370 отображения. Кроме того, данные, декодированные декодером 1340, могут запоминаться на носителе 1350 данных, таком как HDD,The display unit 1370 renders the video signal output from the video decoder 1342 and the preset metadata output from the audio decoder 1341. The display unit 1370 includes a speaker unit (not shown). An audio signal in which the level of the object output from the audio decoder 1341 is set using a pre-installed matrix is output through the speaker unit included in the display unit 1370. In addition, data decoded by the decoder 1340 may be stored on a storage medium 1350, such as an HDD,

Между тем, устройство 1300 декодирования сигнала может дополнительно включать в себя администратор 1360 приложений, способный управлять множеством данных, имея информацию, введенную пользователем.Meanwhile, the signal decoding apparatus 1300 may further include an application manager 1360 capable of managing a plurality of data having information entered by a user.

Администратор 1360 приложений включает в себя администратор 1361 пользовательского интерфейса и сервисный администратор 1362. Администратор 1361 пользовательского интерфейса управляет интерфейсом для приема информации, вводимой пользователем. Например, администратор 1361 пользовательского интерфейса может управлять типом шрифта текста, визуализируемого в блоке 1370 отображения, яркостью экрана, конфигурацией меню и т.п. Между тем, если широковещательный сигнал декодируется и выводится декодером 1340 и блоком 1370 отображения, то сервисный менеджер 1362 может управлять принятым широковещательным сигналом, используя информацию, введенную пользователем. Например, сервисный менеджер 1362 способен обеспечить настройку широковещательного канала, настройку функции аварийной сигнализации, функцию аутентификации контента только для взрослых и т.д. Данные, выдаваемые администратором 1360 приложений, можно использовать путем их пересылки в блок 1370 отображения, а также декодер 1340.The application manager 1360 includes a user interface manager 1361 and a service manager 1362. The user interface manager 1361 controls the interface for receiving user input. For example, the user interface manager 1361 may control the font type of the text rendered in the display unit 1370, screen brightness, menu configuration, and the like. Meanwhile, if the broadcast signal is decoded and output by the decoder 1340 and the display unit 1370, then the service manager 1362 can control the received broadcast signal using information entered by the user. For example, a service manager 1362 is able to configure a broadcast channel, configure an alarm function, an adult-only content authentication function, etc. Data provided by the application manager 1360 can be used by sending them to the display unit 1370, as well as the decoder 1340.

На фиг.14 представлена схема блока отображения, состоящего из оборудования, которое включает в себя блок приема предварительно установленной информации согласно одному варианту настоящего изобретения. Блок отображения способен визуализировать все предварительно установленные метаданные, содержащиеся в битовом потоке. Например, на экране визуализируются режим караоке, режим концертного зала и режим новостей, как показано на фиг.14.On Fig presents a diagram of a display unit consisting of equipment, which includes a unit for receiving preset information according to one variant of the present invention. The display unit is able to visualize all the predefined metadata contained in the bitstream. For example, the screen displays karaoke mode, concert hall mode and news mode, as shown in FIG.

Если пользователь выбирает что-то одно из предварительно установленных метаданных, блок отображения визуализирует объекты, уровни которых настраиваются таким образом, что к множеству объектов применяется предварительно установленная матрица, соответствующая режиму караоке. Например, если пользователь выбирает режим караоке, то может быть визуализирована конфигурация настройки уровня вокального объекта на минимум. Кроме того, если пользователь выбирает режим новостей, то предварительно установленная матрица, применяемая к аудиосигналу, снизит уровни всех объектов за исключением вокального объекта.If the user selects one of the predefined metadata, the display unit visualizes objects whose levels are adjusted so that a pre-installed matrix corresponding to the karaoke mode is applied to many objects. For example, if the user selects karaoke mode, then the configuration of setting the level of the vocal object to a minimum can be visualized. In addition, if the user selects the news mode, then a pre-installed matrix applied to the audio signal will lower the levels of all objects except the vocal object.

Обратимся к фиг.14, где при выборе режима новостей блок отображения способен визуализировать конфигурацию, в которой уровень вокального объекта поднят выше, чем в режиме караоке, в то время как уровни остальных объектов сведены к минимуму.Turning to FIG. 14, when selecting a news mode, the display unit is able to visualize a configuration in which the level of the vocal object is raised higher than in karaoke mode, while the levels of the remaining objects are minimized.

Таким образом, при визуализации уровней объектов, настроенных с помощью предварительно установленной матрицы, а также предварительно установленных метаданных, указывающих предустановку в блоке отображения, пользователь способен прослушивать аудиосигнал, имеющий особый звуковой сценический эффект путем правильного выбора конкретного предварительно установленного режима.Thus, when visualizing the levels of objects configured using a pre-installed matrix, as well as pre-set metadata indicating a preset in the display unit, the user is able to listen to an audio signal that has a special sound stage effect by correctly selecting a specific preset mode.

Промышленная применимостьIndustrial applicability

Соответственно, настоящее изобретение применимо к кодированию и декодированию аудиосигналов.Accordingly, the present invention is applicable to encoding and decoding of audio signals.

Хотя настоящее изобретение было здесь описано и проиллюстрировано со ссылками на предпочтительные варианты его осуществления, специалистам в данной области техники будет очевидно, что в него могут быть внесены различные модификации и видоизменения, не выходящие за рамки существа и объема изобретения. Таким образом, предполагается, что настоящее изобретение покрывает упомянутые модификации и видоизменения этого изобретения, которые входят в объем прилагаемой формулы изобретения и ее эквивалентов.Although the present invention has been described and illustrated here with reference to preferred embodiments thereof, it will be apparent to those skilled in the art that various modifications and modifications can be made thereto without departing from the spirit and scope of the invention. Thus, it is intended that the present invention covers the modifications and variations of this invention that come within the scope of the appended claims and their equivalents.

Claims

1. A method for processing an audio signal, comprising:
receiving an audio signal and preset information, the audio signal including at least one object;
obtaining a pre-installed matrix from pre-installed information, and a pre-installed matrix indicates the degree of contribution of the object to the output channel;
setting the output level of the object according to the output channel by using a pre-installed matrix; and
outputting an audio signal including an object with a configured output level,
moreover, the pre-installed information is obtained on the basis of pre-installed information about the availability, indicating that the pre-installed information exists, and pre-installed information about the numbers indicating the number of pre-installed information,
wherein the pre-installed matrix is obtained based on the pre-installed type information indicating that the pre-installed information is presented in the matrix.

2. The method according to claim 1, in which a pre-installed matrix is obtained on the basis of information about the output channel, indicating that the output channel is one of a mono channel, stereo channel, or multi-channel.

3. The method of claim 2, wherein the pre-set type information is 1 bit.

4. The method according to claim 1, in which the dimension of the pre-installed matrix is determined based on the number of the object and the number of the output channel.

5. An apparatus for processing an audio signal, comprising:
an audio signal receiving unit receiving an audio signal including at least one object;
a pre-set metadata receiving unit receiving pre-set metadata from pre-set information;
a unit for receiving preset rendering data receiving a preset matrix from the preset information, the preset matrix indicating the degree of contribution of the object to the output channel;
an object setting unit that adjusts the output level of the object according to the output channel by using a pre-installed matrix; and
an output unit outputting an audio signal including an object with a configured output level,
wherein the pre-installed matrix is obtained based on the pre-installed type information indicating that the pre-installed information is presented in the matrix.

6. The device according to claim 5, in which the unit for receiving preset rendering data obtains a pre-installed matrix based on information about the output channel, indicating that the output channel is either a mono channel, or a stereo channel, or multi-channel.

7. The device according to claim 6, in which the preset type information is represented by 1 bit.

8. The device according to claim 5, in which the dimension of the pre-installed matrix is determined based on the number of the object and the number of the output channel.

9. Computer-readable recording medium storing digital audio data,
wherein the digital audio data comprises preset information and an audio signal including at least one object,
wherein the pre-set information contains pre-set metadata representing pre-set information, pre-set information about availability, indicating that pre-set information exists, pre-set information about numbers, indicating a number of pre-set information, a pre-set matrix indicating the degree of contribution of the object to the output channel, and preset type information, decrees ayuschuyu that preset information is represented in a matrix,
moreover, the pre-installed information is obtained on the basis of pre-installed information about the availability and pre-installed information about the numbers
wherein a pre-installed matrix is obtained based on pre-set type information.

10. The recording medium according to claim 9, in which a pre-installed matrix is obtained on the basis of information about the output channel, indicating that the output channel is either a mono channel, or a stereo channel, or multi-channel.

11. The recording medium of claim 10, wherein the pre-set type information is represented by 1 bit.

12. The recording medium according to claim 9, in which the dimension of the pre-installed matrix is determined based on the number of the object and the number of the output channel.

13. An apparatus for processing an audio signal, comprising:
an audio signal generating unit creating an audio signal performing down-mixing of at least one object;
a metadata creation unit creating predefined metadata for the predefined information; and
a unit for creating pre-set rendering data, creating a pre-installed matrix indicating the degree of contribution of the object to the output channel, and pre-set type information indicating that the pre-set information is presented in the matrix.

14. The device according to item 13, in which the unit for creating preset rendering data additionally creates information about the output channel, indicating that the output channel is either a mono channel, or a stereo channel, or multi-channel.

15. An audio signal processing method comprising:
creating an audio signal that down-mixes at least one object;
creating predefined availability information indicating whether or not predefined information exists;
creating pre-set information about the numbers indicating the number of pre-set information;
creating predefined metadata representing predefined information;
creating a pre-installed matrix indicating the degree of contribution of the object to the output signal; and
creating preset type information indicating that the preset information is presented in a matrix.