BR112017015930B1 - APPARATUS AND METHOD FOR PROCESSING A CODED AUDIO SIGNAL - Google Patents

APPARATUS AND METHOD FOR PROCESSING A CODED AUDIO SIGNAL Download PDF

Info

Publication number
BR112017015930B1
BR112017015930B1 BR112017015930-9A BR112017015930A BR112017015930B1 BR 112017015930 B1 BR112017015930 B1 BR 112017015930B1 BR 112017015930 A BR112017015930 A BR 112017015930A BR 112017015930 B1 BR112017015930 B1 BR 112017015930B1
Authority
BR
Brazil
Prior art keywords
group
signals
reduction
matrix
individual
Prior art date
Application number
BR112017015930-9A
Other languages
Portuguese (pt)
Other versions
BR112017015930A2 (en
Inventor
Adrian Murtaza
Jouni PAULUS
Harald Fuchs
Roberta CAMILLERI
Leon Terentiv
Sascha Disch
Jürgen Herre
Oliver Hellmuth
Original Assignee
Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V filed Critical Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V
Priority claimed from PCT/EP2016/052037 external-priority patent/WO2016124524A1/en
Publication of BR112017015930A2 publication Critical patent/BR112017015930A2/en
Publication of BR112017015930B1 publication Critical patent/BR112017015930B1/en

Links

Abstract

APARELHO E MÉTODO PARA PROCESSAR UM SINAL DE ÁUDIO CODIFICADO. Trata-se de um aparelho (1) para processar um sinal de áudio codificado (100) que compreende uma pluralidade de sinais de mixagem de redução (101) associados a uma pluralidade de objetos de áudio de entrada (111) e parâmetros de objeto (E). O aparelho (1) compreende um agrupador (2) configurado para agrupar os sinais de mixagem de redução (101) em grupos de sinais de mixagem de redução (102) associados a um conjunto de objetos de áudio de entrada (111). O aparelho (1) compreende um processador (3) configurado para realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (111) a fim de fornecer resultados em grupo (103, 104). Ademais, há um combinador (4) configurado para combinar os ditos resultados em grupo (103, 104) ou resultados em grupo processados a fim de fornecer um sinal de áudio decodificado (110). O agrupador (2) é configurado para agrupar os sinais de mixagem de redução (101) de modo que cada objeto de áudio de entrada (111) pertença a apenas um conjunto de objetos de áudio de entrada (111). A invenção também se refere a um método correspondente.APPARATUS AND METHOD FOR PROCESSING A CODED AUDIO SIGNAL. It is an apparatus (1) for processing a coded audio signal (100) comprising a plurality of downmix signals (101) associated with a plurality of input audio objects (111) and object parameters ( AND). The apparatus (1) comprises a grouper (2) configured to group the reduction mixing signals (101) into groups of reduction mixing signals (102) associated with a set of input audio objects (111). The apparatus (1) comprises a processor (3) configured to perform at least one individual processing step on the object parameters (Ek) of each set of input audio objects (111) in order to provide group results (103, 104). Furthermore, there is a combiner (4) configured to combine said group results (103, 104) or processed group results to provide a decoded audio signal (110). The grouper (2) is configured to group the reduction mix signals (101) so that each input audio object (111) belongs to only one set of input audio objects (111). The invention also relates to a corresponding method.

Description

[001] RELATÓRIO DESCRITIVO[001] DESCRIPTIVE REPORT

[002] A invenção refere-se a um aparelho e um método para processar um sinal de áudio codificado.[002] The invention relates to an apparatus and a method for processing a coded audio signal.

[003] Recentemente, técnicas paramétricas para a transmissão/armazenamento de taxa de bits eficaz de situações de áudio que contém múltiplos objetos de áudio foram propostas no campo de conversão em código de áudio (consultar as referências [BCC, JSC, SAOC, SAOC1, SAOC2] a seguir) e separação de fonte informada (consultar, por exemplo, as referências [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6] a seguir).[003] Recently, parametric techniques for effective bitrate transmission/storage of audio situations containing multiple audio objects have been proposed in the field of audio code conversion (see references [BCC, JSC, SAOC, SAOC1, SAOC2] below) and informed source separation (see, for example, references [ISS1, ISS2, ISS3, ISS4, ISS5, ISS6] below).

[004] Essas técnicas têm como objetivo reconstruir uma situação de áudio de saída desejada ou objetos de fonte de áudio desejados com base em informações de lado adicionais que descrevem os sinais e/ou objetos de fonte transmitidos/armazenados na situação de áudio. Essa reconstrução ocorre no decodificador com o uso de um esquema de separação de fonte informada paramétrica.[004] These techniques aim to reconstruct a desired output audio situation or desired audio source objects based on additional side information describing the signals and/or source objects transmitted/stored in the audio situation. This reconstruction occurs at the decoder using a parametric informed source separation scheme.

[005] Infelizmente, constatou-se que em alguns casos os esquemas de separação paramétrica podem resultar em artigos audíveis graves que causam uma experiência auditiva insatisfatória.[005] Unfortunately, it has been found that in some cases parametric separation schemes can result in severe audible articles that cause an unsatisfactory listening experience.

[006] Portanto, um objetivo da invenção é aprimorar a qualidade de áudio de sinais de áudio decodificados que usam técnicas de conversão em código paramétricas.[006] Therefore, an object of the invention is to improve the audio quality of decoded audio signals using parametric code conversion techniques.

[007] O objetivo é alcançado por um aparelho, de acordo com a reivindicação 1, e por um método correspondente, de acordo com a reivindicação 22.[007] The objective is achieved by an apparatus according to claim 1 and a corresponding method according to claim 22.

[008] O objetivo é alcançado por um aparelho para processar um sinal de áudio codificado. O sinal de áudio codificado compreende uma pluralidade de sinais de mixagem de redução associados a uma pluralidade de objetos de áudio de entrada e parâmetros de objeto (E). O aparelho compreende um agrupador, um processador e um combinador.[008] The objective is achieved by an apparatus for processing a coded audio signal. The encoded audio signal comprises a plurality of downmix signals associated with a plurality of input audio objects and object parameters (E). The apparatus comprises a grouper, a processor and a combiner.

[009] O agrupador é configurado para agrupar a pluralidade de sinais de mixagem de redução em uma pluralidade de grupos de sinais de mixagem de redução. Cada grupo de sinais de mixagem de redução é associado a um conjunto de objetos de áudio de entrada (ou sinais de áudio de entrada) dentre a pluralidade de objetos de áudio de entrada. Em outras palavras: os grupos cobrem subconjuntos do conjunto dos sinais de áudio de entrada representado pelo sinal de áudio codificado. Cada grupo de sinais de mixagem de redução também é associado a alguns dentre os parâmetros de objeto E que descrevem os objetos de áudio de entrada. No seguinte, os grupos individuais Gk são identificados com um índice k com 1 < k < K com K como o número de grupos de sinais de mixagem de redução.[009] The grouper is configured to group the plurality of reduction mix signals into a plurality of groups of reduction mix signals. Each group of downmix signals is associated with a set of input audio objects (or input audio signals) among the plurality of input audio objects. In other words: groups cover subsets of the set of input audio signals represented by the encoded audio signal. Each group of down mix signals is also associated with some of the E object parameters that describe the input audio objects. In the following, the individual groups Gk are identified with an index k with 1 < k < K with K as the number of groups of downmix signals.

[010] Ademais, o processador - após o agrupamento - é configurado para realizar pelo menos uma etapa de processamento individual dos parâmetros de objeto de cada conjunto de objetos de áudio de entrada. Dessa forma, pelo menos uma etapa de processamento não é realizada simultaneamente em todos os parâmetros de objeto, porém, individualmente nos parâmetros de objeto que pertencem ao respectivo grupo de sinais de mixagem de redução. Em uma modalidade, apenas uma etapa é realizada individualmente. Em uma modalidade diferente, mais que uma etapa é realizada, enquanto que em uma modalidade alternativa, o processamento inteiro é realizado individualmente nos grupos nos sinais de mixagem de redução. O processador fornece resultados em grupo para os grupos individuais.[010] Furthermore, the processor - after grouping - is configured to perform at least one individual processing step on the object parameters of each set of input audio objects. In this way, at least one processing step is not carried out simultaneously on all object parameters, but individually on the object parameters that belong to the respective group of downmix signals. In one embodiment, only one step is performed individually. In a different embodiment, more than one step is performed, while in an alternative embodiment, the entire processing is performed individually on the groups in the reduction mix signals. The processor provides batch results for the individual groups.

[011] Em uma modalidade diferente, o processador - após o agrupamento - é configurado para realizar pelo menos uma etapa de processamento individual em cada grupo dentre a pluralidade de grupos de sinais de mixagem de redução. Dessa forma, pelo menos uma etapa de processamento não é realizada simultaneamente em todos os sinais de mixagem de redução, porém, individualmente nos respectivos grupos de sinais de mixagem de redução.[011] In a different embodiment, the processor - after grouping - is configured to perform at least one individual processing step on each group among the plurality of groups of downmix signals. In this way, at least one processing step is not carried out simultaneously on all reduction mix signals, but individually on the respective groups of reduction mix signals.

[012] Eventualmente, o combinador é configurado para combinar os resultados em grupo ou resultados em grupo processados a fim de fornecer um sinal de áudio decodificado. Dessa forma, os resultados em grupo ou os resultados de etapas de processamento adicionais realizadas nos resultados em grupo são combinados para fornecer um sinal de áudio decodificado. O sinal de áudio decodificado corresponde à pluralidade de objetos de áudio de entrada que são codificados pelo sinal de áudio codificado.[012] Eventually, the combiner is configured to combine the group results or processed group results to provide a decoded audio signal. In this way, the group results or the results of additional processing steps performed on the group results are combined to provide a decoded audio signal. The decoded audio signal corresponds to the plurality of input audio objects that are encoded by the encoded audio signal.

[013] O agrupamento realizado pelo agrupador é realizado pelo menos sob a restrição de que cada objeto de áudio de entrada dentre a pluralidade de objetos de áudio de entrada pertence a apenas ou exatamente a um conjunto de objetos de áudio de entrada. Isso implica que cada objeto de áudio de entrada pertence a apenas um grupo de sinais de mixagem de redução. Isso também implica que cada sinal de mixagem de redução pertence a apenas um grupo de sinais de mixagem de redução.[013] The grouping performed by the grouper is performed at least under the restriction that each input audio object among the plurality of input audio objects belongs to only or exactly one set of input audio objects. This implies that each input audio object belongs to only one group of downmix signals. This also implies that each reduction mix signal belongs to only one reduction mix signal group.

[014] De acordo com uma modalidade, o agrupador é configurado para agrupar a pluralidade de sinais de mixagem de redução na pluralidade de grupos de sinais de mixagem de redução de modo que cada objeto de áudio de entrada de cada conjunto de objetos de áudio de entrada seja isenta de uma relação sinalizada no sinal de áudio codificado com outros objetos de áudio de entrada ou tem uma relação sinalizada no sinal de áudio codificado apenas com pelo menos um objeto de áudio de entrada que pertence ao mesmo conjunto de objetos de áudio de entrada. Isso implica que nenhum objeto de áudio de entrada tem uma relação sinalizada para um objeto de áudio de entrada que pertence a um grupo de sinais de mixagem de redução diferente. Tal relação sinalizada é, em uma modalidade, que dois objetos de áudio de entrada são os sinais estéreo decorrentes de uma fonte única.[014] According to one embodiment, the grouper is configured to group the plurality of reduction mix signals into the plurality of groups of reduction mix signals such that each input audio object of each set of input audio objects input is free from a signed relationship in the encoded audio signal with other input audio objects or has a signed relationship in the encoded audio signal only with at least one input audio object that belongs to the same set of input audio objects . This implies that no input audio object has a signed relationship to an input audio object that belongs to a different downmix signal group. Such a signaled relationship is, in one embodiment, that two input audio objects are stereo signals arising from a single source.

[015] O aparelho da invenção processa um sinal de áudio codificado que compreende sinais de mixagem de redução. A mixagem de redução é uma parte do processo de codificar um determinado número de sinais de áudio individuais e implica que um determinado número de objetos de áudio de entrada é combinado em um sinal de mixagem de redução. O número de objetos de áudio de entrada é, desse modo, reduzido a um número menor de sinais de mixagem de redução. Devido a isso, os sinais de mixagem de redução são associados a uma pluralidade de objetos de áudio de entrada.[015] The apparatus of the invention processes a coded audio signal comprising downmix signals. Down mixing is a part of the process of encoding a given number of individual audio signals and implies that a given number of input audio objects are combined into a down mixing signal. The number of input audio objects is thereby reduced to a smaller number of downmix signals. Because of this, the downmix signals are associated with a plurality of input audio objects.

[016] Os sinais de mixagem de redução são agrupados em grupos de sinais de mixagem de redução e são submetidos individualmente - isto é, como grupos únicos - a pelo menos uma etapa de processamento. Dessa forma, o aparelho realiza pelo menos uma etapa de processamento não em conjunto em todos os sinais de mixagem de redução, porém, individualmente nos grupos individuais de sinais de mixagem de redução. Em uma modalidade diferente, os parâmetros de objeto dos grupos são tratados separadamente a fim de obter as matrizes a serem aplicadas ao sinal de áudio codificado.[016] The reduction mix signals are grouped into reduction mix signal groups and are subjected individually - that is, as single groups - to at least one processing step. In this way, the device performs at least one processing step not jointly on all downmix signals, but individually on the individual groups of downmix signals. In a different embodiment, the object parameters of the groups are treated separately in order to obtain the matrices to be applied to the encoded audio signal.

[017] Em uma modalidade, o aparelho é um decodificador de sinais de áudio codificados. O aparelho é, em uma modalidade alternativa, uma parte de um decodificador.[017] In one embodiment, the apparatus is a decoder of coded audio signals. The apparatus is, in an alternative embodiment, a part of a decoder.

[018] Em uma modalidade, cada sinal de mixagem de redução é atribuído a um grupo de sinais de mixagem de redução e é, consequentemente, processado individualmente em relação a pelo menos uma etapa de processamento. Nessa modalidade, o número de grupos de sinais de mixagem de redução é igual ao número de sinais de mixagem de redução. Isso implica que o agrupamento e o processamento individual coincidem.[018] In one embodiment, each reduction mixing signal is assigned to a group of reduction mixing signals and is consequently processed individually with respect to at least one processing step. In this embodiment, the number of groups of down mix signals is equal to the number of down mix signals. This implies that grouping and individual processing coincide.

[019] Em uma modalidade, a combinação é uma dentre as etapas finais do processamento do sinal de áudio codificado. Em uma modalidade diferente, os resultados em grupo são adicionalmente submetidos a etapas de processamento diferentes que são realizadas individualmente ou em conjunto com os resultados em grupo.[019] In one embodiment, combining is one of the final steps of processing the encoded audio signal. In a different embodiment, the group results are further subjected to different processing steps that are performed individually or together with the group results.

[020] O agrupamento (ou a detecção dos grupos) e o tratamento individual dos grupos mostraram resultar em um aperfeiçoamento de qualidade de áudio. Isso se refere, especialmente, por exemplo, a técnicas de conversão em código paramétricas.[020] Grouping (or detection of groups) and individual treatment of groups have been shown to result in an improvement in audio quality. This especially concerns, for example, parametric code conversion techniques.

[021] De acordo com uma modalidade, o agrupador do aparelho é configurado para agrupar a pluralidade de sinais de mixagem de redução na pluralidade de grupos de sinais de mixagem de redução enquanto minimiza uma diversidade de sinais de mixagem de redução dentro cada grupo de sinais de mixagem de redução. Nessa modalidade, o aparelho tenta reduzir o número de sinais de mixagem de redução que pertence a cada grupo. Em um caso, apenas um sinal de mixagem de redução pertence a pelo menos um grupo de sinais de mixagem de redução.[021] According to one embodiment, the grouper of the apparatus is configured to group the plurality of downmix signals into the plurality of groups of downmix signals while minimizing a diversity of downmix signals within each group of signals. reduction mixer. In this mode, the device tries to reduce the number of reduction mix signals that belong to each group. In one case, only one reduction mix signal belongs to at least one group of reduction mix signals.

[022] De acordo com uma modalidade, o agrupador é configurado para agrupar a dita pluralidade de sinais de mixagem de redução na dita pluralidade de grupos de sinais de mixagem de redução de modo que apenas um único sinal de mixagem de redução pertença a um grupo de sinais de mixagem de redução. Em outras palavras: O agrupamento resulta em vários grupos de sinais de mixagem de redução em que pelo menos um grupo de sinal de mixagem de redução é determinado, ao qual pertence apenas um sinal de mixagem de redução. Desse modo, pelo menos um grupo de sinais de mixagem de redução se refere a apenas um único sinal de mixagem de redução. Em uma modalidade adicional, o número de grupos de sinais de mixagem de redução ao qual apenas um sinal de mixagem de redução pertence é maximizado.[022] According to one embodiment, the grouper is configured to group said plurality of down mix signals into said plurality of groups of down mix signals such that only a single down mix signal belongs to a group of reduction mix signals. In other words: Grouping results in several groups of reduction mix signals in which at least one reduction mix signal group is determined, to which only one reduction mix signal belongs. In this way, at least one group of reduction mix signals refers to only a single reduction mix signal. In a further embodiment, the number of groups of downmix signals to which only one downmix signal belongs is maximized.

[023] Em uma modalidade, o agrupador do aparelho é configurado para agrupar a pluralidade de sinais de mixagem de redução na pluralidade de grupos de sinais de mixagem de redução com base em informações dentro do sinal de áudio codificado. Em uma modalidade adicional, o aparelho usa apenas informações dentro do sinal de áudio codificado para agrupar os sinais de mixagem de redução. Com o uso das informações dentro o fluxo de bits do sinal de áudio codificado compreende - em uma modalidade - levando as informações de correlação ou covariância em conta. O agrupador, especialmente, extrai do sinal de áudio codificado as informações sobre a relação entre objetos de áudio de entrada diferentes.[023] In one embodiment, the grouper of the apparatus is configured to group the plurality of downmix signals into the plurality of groups of downmix signals based on information within the encoded audio signal. In a further embodiment, the apparatus uses only information within the encoded audio signal to group the downmix signals. With the use of information within the bitstream of the encoded audio signal comprises - in one embodiment - taking correlation or covariance information into account. The grouper, in particular, extracts information about the relationship between different input audio objects from the encoded audio signal.

[024] Em uma modalidade, o agrupador é configurado para agrupar a dita pluralidade de sinais de mixagem de redução na dita pluralidade de grupos de sinais de mixagem de redução com base em valores de bsRelatedTo dentro do dito sinal de áudio codificado. Com relação a esses valores consultar, por exemplo, o documento no WO 2011 /039195 A1.[024] In one embodiment, the grouper is configured to group said plurality of downmix signals into said plurality of groups of downmix signals based on bsRelatedTo values within said encoded audio signal. Regarding these values, see, for example, the document in WO 2011 /039195 A1.

[025] De acordo com uma modalidade, o agrupador é configurado para agrupar a pluralidade de sinais de mixagem de redução na pluralidade de grupos de sinais de mixagem de redução aplicando-se pelo menos as seguintes etapas (a cada grupo de sinais de mixagem de redução):[025] According to one embodiment, the grouper is configured to group the plurality of down mix signals into the plurality of groups of down mix signals by applying at least the following steps (to each group of down mix signals) reduction):

[026] • detectar a possibilidade de um sinal de mixagem de redução ser atribuído a um grupo existente de sinais de mixagem de redução;[026] • detect the possibility of a reduction mix signal being assigned to an existing group of reduction mix signals;

[027] • detectar a possibilidade de pelo menos um objeto de áudio de entrada dentre a pluralidade de objetos de áudio de entrada associados ao sinal de mixagem de redução ser parte de um conjunto de objetos de áudio de entrada associados a um grupo existente de sinais de mixagem de redução;[027] • detect the possibility that at least one input audio object among the plurality of input audio objects associated with the downmix signal is part of a set of input audio objects associated with an existing group of signals reduction mixing;

[028] • atribuir o sinal de mixagem de redução a um novo grupo de sinais de mixagem de redução no caso de o sinal de mixagem de redução ser isento de uma atribuição a um grupo existente de sinais de mixagem de redução (dessa forma, o sinal de mixagem de redução não é atribuído prontamente a um grupo) e no caso de todos os objetos de áudio de entrada dentre a pluralidade de objetos de áudio de entrada associados ao sinal de mixagem de redução serem isentos de uma associação a um grupo existente de sinais de mixagem de redução (dessa forma, os objetos de áudio de entrada do sinal de mixagem de redução não são prontamente - por meio de um sinal de mixagem de redução diferente - atribuídos a um grupo); e[028] • assign the reduction mix signal to a new group of reduction mix signals in the event that the reduction mix signal is exempt from an assignment to an existing group of reduction mix signals (thus the down mix signal is not readily assigned to a group) and in the event that all input audio objects among the plurality of input audio objects associated with the down mix signal are exempt from an association with an existing group of reduction mix signals (in this way, the input audio objects of the reduction mix signal are not readily - via a different reduction mix signal - assigned to a group); It is

[029] • combinar o sinal de mixagem de redução com um grupo existente de sinais de mixagem de redução no caso de o sinal de mixagem de redução ser atribuído ao grupo existente de sinal de mixagem de redução ou, no caso de pelo menos um objeto de áudio de entrada dentre a pluralidade de objetos de áudio de entrada associados ao sinal de mixagem de redução ser associado ao grupo existente de sinais de mixagem de redução.[029] • combine the reduction mix signal with an existing group of reduction mix signals in the case where the reduction mix signal is assigned to the existing group of reduction mix signal or, in the case of at least one object of input audio objects from among the plurality of input audio objects associated with the down mixing signal be associated with the existing group of down mixing signals.

[030] Se uma relação sinalizada no sinal de áudio codificado também for levada em consideração, então, outra etapa de detectar será adicionada, resultando em uma exigência adicional por atribuir e combinar os sinais de mixagem de redução.[030] If a signaled relationship in the encoded audio signal is also taken into consideration, then another detect step will be added, resulting in an additional requirement for assigning and combining the reduction mix signals.

[031] De acordo com uma modalidade, o processador é configurado para realizar várias etapas de processamento individuais nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (ou de cada grupo de sinais de mixagem de redução) a fim de fornecer matrizes individuais como resultados em grupo. O combinador é configurado para combinar as matrizes individuais a fim de fornecer o dito sinal de áudio decodificado. Os parâmetros de objeto (Ek) pertencem aos objetos de áudio de entrada do respectivo grupo de sinais de mixagem de redução com índice k e são processados para obter matrizes individuais para esse grupo que tem índice k.[031] According to one embodiment, the processor is configured to perform several individual processing steps on the object parameters (Ek) of each set of input audio objects (or each group of downmix signals) in order to of providing individual matrices as group results. The combiner is configured to combine the individual matrices to provide said decoded audio signal. The object parameters (Ek) belong to the input audio objects of the respective group of reduction mix signals with index k and are processed to obtain individual matrices for this group having index k.

[032] De acordo com a modalidade diferente, o processador é configurado para realizar várias etapas de processamento individuais em cada grupo da dita pluralidade de grupos de sinais de mixagem de redução a fim de fornecer sinais de áudio de saída como resultados em grupo. O combinador é configurado para combinar os sinais de áudio de saída a fim de fornecer o dito sinal de áudio decodificado.[032] According to the different embodiment, the processor is configured to perform several individual processing steps on each group of said plurality of groups of downmix signals in order to provide output audio signals as group results. The combiner is configured to combine the output audio signals to provide said decoded audio signal.

[033] Nessa modalidade, os grupos de sinais de mixagem de redução são processados de modo que os sinais de áudio de saída sejam obtidos, os quais correspondem aos objetos de áudio de entrada que pertencem ao respectivo grupo de sinais de mixagem de redução. Dessa forma, combinar os sinais de áudio de saída aos sinais de áudio decodificados está próximo das etapas finais dos processos de decodificação realizados no sinal de áudio codificado. Nessa modalidade, desse modo, cada grupo de sinais de mixagem de redução é submetido individualmente a todas as etapas de processamento após a detecção dos grupos de sinais de mixagem de redução.[033] In this embodiment, groups of reduction mixing signals are processed so that output audio signals are obtained, which correspond to input audio objects that belong to the respective group of reduction mixing signals. Therefore, combining the output audio signals with the decoded audio signals is close to the final steps of the decoding processes performed on the encoded audio signal. In this embodiment, each group of downmix signals is individually subjected to all processing steps after detecting the groups of downmix signals.

[034] Em uma modalidade diferente, o processador é configurado para realizar pelo menos uma etapa de processamento individual em cada grupo da dita pluralidade de grupos de sinais de mixagem de redução a fim de fornecer sinais processados como resultados em grupo. O aparelho compreende ademais um pós-processador configurado para processar em conjunto os ditos sinais processados a fim de fornecer sinais de áudio de saída. O combinador é configurado para combinar os sinais de áudio de saída como resultados em grupo processados a fim de fornecer o dito sinal de áudio decodificado.[034] In a different embodiment, the processor is configured to perform at least one individual processing step on each group of said plurality of groups of downmix signals in order to provide processed signals as group results. The apparatus further comprises a post-processor configured to jointly process said processed signals in order to provide output audio signals. The combiner is configured to combine the output audio signals as processed group results in order to provide said decoded audio signal.

[035] Nessa modalidade, os grupos de sinal de mixagem de redução são submetidos a pelo menos uma etapa de processamento individual e a pelo menos uma etapa de processamento em conjunto com outros grupos. O processamento individual resulta em sinais processados que - em uma modalidade - são processados em conjunto.[035] In this embodiment, the reduction mixing signal groups are subjected to at least one individual processing step and at least one processing step together with other groups. Individual processing results in processed signals that - in one embodiment - are processed together.

[036] Referindo-se às matrizes, em uma modalidade, o processador é configurado para realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada a fim de fornecer matrizes individuais. Um pós-processador compreendido pelo aparelho é configurado para processar, em conjunto, parâmetros de objeto a fim de fornecer pelo menos uma matriz geral. O combinador é configurado para combinar as ditas matrizes individuais e a dita pelo menos uma matriz geral. Em uma modalidade, os pós-processadores realizam pelo menos uma etapa de processamento em conjunto nas matrizes individuais a fim de obter pelo menos uma matriz geral.[036] Referring to matrices, in one embodiment, the processor is configured to perform at least one individual processing step on the object parameters (Ek) of each set of input audio objects in order to provide individual matrices. A post-processor comprised by the apparatus is configured to jointly process object parameters to provide at least one general matrix. The combiner is configured to combine said individual matrices and said at least one general matrix. In one embodiment, the post-processors perform at least one processing step together on the individual matrices in order to obtain at least one overall matrix.

[037] As modalidades a seguir se referem a etapas de processamento realizadas pelo processador. Algumas dessas etapas também são adequadas para o pós-processador mencionado na modalidade anterior.[037] The following embodiments refer to processing steps performed by the processor. Some of these steps are also suitable for the postprocessor mentioned in the previous embodiment.

[038] Em uma modalidade, o processador compreende um desmixador configurado para desmixar os sinais de mixagem de redução dos respectivos grupos da dita pluralidade de grupos de sinais de mixagem de redução. Desmixando-se os sinais de mixagem de redução o processador obtém representações dos objetos de áudio de entrada originais que foram submetidos à mixagem de redução no sinal de mixagem de redução.[038] In one embodiment, the processor comprises a demixer configured to demix the downmix signals of respective groups of said plurality of downmix signal groups. By demixing the downmix signals the processor obtains representations of the original input audio objects that were subjected to downmixing in the downmix signal.

[039] De acordo com uma modalidade, o desmixador é configurado para desmixar os sinais de mixagem de redução dos respectivos grupos da dita pluralidade de grupos de sinais de mixagem de redução com base em um algoritmo Mínimo Erro Médio Quadrático (MMSE). Tal algoritmo será explicado na descrição a seguir.[039] According to one embodiment, the demixer is configured to demix the downmix signals of respective groups of said plurality of downmix signal groups based on a Minimum Mean Square Error (MMSE) algorithm. This algorithm will be explained in the following description.

[040] Em uma modalidade diferente na qual o processador compreende um desmixador configurado para processar os parâmetros de objeto de cada conjunto de objetos de áudio de entrada individualmente a fim de fornecer matrizes de desmixagem individuais.[040] In a different embodiment in which the processor comprises a demixer configured to process the object parameters of each set of input audio objects individually to provide individual demix matrices.

[041] Em uma modalidade, o processador compreende uma calculadora configurada para computar, individualmente, para cada grupo de sinais de mixagem de redução, matrizes com tamanhos que dependem de pelo menos um dentre uma variedade de objetos de áudio de entrada do conjunto de objetos de áudio de entrada associados ao respectivo grupo de sinais de mixagem de redução e uma variedade de sinais de mixagem de redução que pertencem ao respectivo grupo de sinais de mixagem de redução. Visto que os grupos de sinais de mixagem de redução são menores que o conjunto inteiro de sinais de mixagem de redução e visto que os grupos de sinais de mixagem de redução se referem a números menores de sinais de áudio de entrada, as matrizes usadas para o processamento dos grupos de sinais de mixagem de redução são menores que esses usados no estado da técnica. Isso facilita a computação.[041] In one embodiment, the processor comprises a calculator configured to compute, individually, for each group of downmix signals, matrices with sizes that depend on at least one of a variety of input audio objects from the set of objects of input audio associated with the respective down mix signal group and a variety of down mix signals that belong to the respective down mix signal group. Since the reduction mix signal groups are smaller than the entire set of reduction mix signals, and since the reduction mix signal groups refer to smaller numbers of input audio signals, the matrices used for the processing of the reduction mixing signal groups are smaller than those used in the prior art. This makes computing easier.

[042] De acordo com uma modalidade, a calculadora é configurada para computar para as matrizes de desmixagem individuais um limiar individual com base em um valor máximo de energia dentro do respectivo grupo de sinais de mixagem de redução.[042] According to one embodiment, the calculator is configured to compute for the individual demixing matrices an individual threshold based on a maximum energy value within the respective group of downmixing signals.

[043] De acordo com uma modalidade, o processador é configurado para computar um limiar individual com base em um valor máximo de energia dentro do respectivo grupo de sinais de mixagem de redução para cada grupo de sinais de mixagem de redução, individualmente.[043] According to one embodiment, the processor is configured to compute an individual threshold based on a maximum energy value within the respective group of downmix signals for each group of downmix signals, individually.

[044] Em uma modalidade, a calculadora é configurada para computar quanto a uma etapa de regularização para desmixar os sinais de mixagem de redução de cada grupo de sinais de mixagem de redução um limiar individual com base em um valor máximo de energia dentro do respectivo grupo de sinais de mixagem de redução. Os limiares para os grupos de sinais de mixagem de redução são computados em uma modalidade diferente pelo próprio desmixador.[044] In one embodiment, the calculator is configured to compute for a regularization step to demix the downmix signals from each group of downmix signals an individual threshold based on a maximum energy value within the respective group of reduction mix signals. The thresholds for the groups of downmix signals are computed in a different modality by the demixer itself.

[045] A discussão a seguir mostrará o efeito interessante de computar o limiar para os grupos (um limiar para cada grupo) e não para todos os sinais de mixagem de redução.[045] The following discussion will show the interesting effect of computing the threshold for groups (one threshold for each group) and not for all downmix signals.

[046] De acordo com uma modalidade, o processador compreende um renderizador configurado para renderizar os sinais de mixagem de redução desmixados dos respectivos grupos para uma situação de saída do dito sinal de áudio decodificado a fim de fornecer sinais renderizados. A renderização tem como base a entrada fornecida pelo ouvinte ou com base em dados sobre a situação de saída real.[046] According to one embodiment, the processor comprises a renderer configured to render the demixed downmix signals of the respective groups to an output situation of said decoded audio signal in order to provide rendered signals. Rendering is based on input provided by the listener or based on data about the actual output situation.

[047] Em uma modalidade, o processador compreende um renderizador configurado para processar os parâmetros de objeto a fim de fornecer pelo menos uma matriz de renderização.[047] In one embodiment, the processor comprises a renderer configured to process object parameters to provide at least one rendering matrix.

[048] O processador compreende em uma modalidade um pós-mixador configurado para processar os parâmetros de objeto a fim de fornecer pelo menos uma matriz de descorrelação.[048] The processor comprises in one embodiment a post-mixer configured to process object parameters to provide at least one decorrelation matrix.

[049] De acordo com uma modalidade, o processador compreende a pós- mixador configurado para realizar pelo menos uma etapa de descorrelação nos ditos sinais renderizados e configurados para combinar resultados (Ycomprimido(wet)) da etapa de descorrelação realizada com os ditos respectivos sinais renderizados (Ynão comprimido(dry)).[049] According to one embodiment, the processor comprises a post-mixer configured to perform at least one decorrelation step on said rendered signals and configured to combine results (Ycompressed(wet)) of the decorrelation step performed with said respective signals. rendered (Yuncompressed(dry)).

[050] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de mixagem de redução individual (Dk) para cada grupo de sinais de mixagem de redução (em que k é o índice do respectivo grupo), o processador é configurado para determinar uma matriz de covariância de grupo individual (Ek) para cada grupo de sinais de mixagem de redução, o processador é configurado para determinar uma matriz de covariância de mixagem de redução de grupo individual (Δk) para cada grupo de sinais de mixagem de redução com base na matriz de mixagem de redução individual (Dk) e na matriz de covariância de grupo individual (Ek), e o processador é configurado para determinar uma matriz de grupo inversa regularizada individual (Jk) para cada grupo de sinais de mixagem de redução.[050] According to one embodiment, the processor is configured to determine an individual reduction mixing matrix (Dk) for each group of reduction mixing signals (where k is the index of the respective group), the processor is configured To determine an individual group covariance matrix (Ek) for each group of downmix signals, the processor is configured to determine an individual group downmix covariance matrix (Δk) for each group of downmix signals. reduction based on the individual reduction mixing matrix (Dk) and the individual group covariance matrix (Ek), and the processor is configured to determine an individual regularized inverse group matrix (Jk) for each group of mixing signals. reduction.

[051] De acordo com uma modalidade, o combinador é configurado para combinar a matriz de grupo inversas regularizadas individuais (Jk) para obter uma matriz de grupo inversa regularizada geral (J).[051] According to one embodiment, the combiner is configured to combine the individual regularized inverse group matrix (Jk) to obtain an overall regularized inverse group matrix (J).

[052] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de desmixagem paramétrica de grupo individual (Uk) para cada grupo de sinais de mixagem de redução com base na matriz de mixagem de redução individual (Dk), na matriz de covariância de grupo individual (Ek) e na matriz de grupo inversa regularizada individual (Jk), e o combinador é configurado para combinar a uma matriz de desmixagem paramétrica de grupo individual (Uk) para obter uma matriz de desmixagem paramétrica de grupo geral (U).[052] According to one embodiment, the processor is configured to determine an individual group parametric demix matrix (Uk) for each group of down mix signals based on the individual down mix matrix (Dk) in the matrix of individual group covariance (Ek) and the individual regularized inverse group matrix (Jk), and the combiner is configured to combine an individual group parametric unmixing matrix (Uk) to obtain an overall group parametric unmixing matrix ( U).

[053] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de desmixagem paramétrica de grupo individual (Uk) para cada grupo de sinais de mixagem de redução com base na matriz de mixagem de redução individual (Dk), na matriz de covariância de grupo individual (Ek) e na matriz de grupo inversa regularizada individual (Jk), e o combinador é configurado para combinar a matriz de desmixagem paramétrica de grupo individual (Uk) para obter uma matriz de desmixagem paramétrica de grupo geral (U).[053] According to one embodiment, the processor is configured to determine an individual group parametric demix matrix (Uk) for each group of down mix signals based on the individual down mix matrix (Dk) in the matrix of individual group covariance (Ek) and the individual regularized inverse group matrix (Jk), and the combiner is configured to combine the individual group parametric unmixing matrix (Uk) to obtain an overall group parametric unmixing matrix (U ).

[054] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de renderização de grupo individual (Rk) para cada grupo de sinais de mixagem de redução.[054] According to one embodiment, the processor is configured to determine an individual group rendering matrix (Rk) for each group of downmix signals.

[055] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de mixagem de aumento individual (RkUk) para cada grupo de sinais de mixagem de redução com base na matriz de renderização de grupo individual (Rk) e na matriz de desmixagem paramétrica de grupo individual (Uk), e o combinador é configurado para combinar as matrizes de mixagem de aumento individuais (RkUk) para obter uma matriz de mixagem de aumento geral (RU).[055] According to one embodiment, the processor is configured to determine an individual upmix matrix (RkUk) for each group of downmix signals based on the individual group rendering matrix (Rk) and the individual group parametric demixing (Uk), and the combiner is configured to combine the individual boost mixing matrices (RkUk) to obtain an overall boost mixing matrix (RU).

[056] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de covariância de grupo individual (Ck) para cada grupo de sinais de mixagem de redução com base na matriz de renderização de grupo individual (Rk) e na matriz de covariância de grupo individual (Ek), e o combinador é configurado para combinar as matrizes de covariância de grupo individuais (Ck) para obter uma matriz de covariância de grupo geral (C).[056] According to one embodiment, the processor is configured to determine an individual group covariance matrix (Ck) for each group of downmix signals based on the individual group rendering matrix (Rk) and the individual group covariance (Ek), and the combiner is configured to combine the individual group covariance matrices (Ck) to obtain an overall group covariance matrix (C).

[057] De acordo com uma modalidade, o processador é configurado para determinar uma matriz de covariância de grupo individual do sinal estimado parametricamente (Eynão comprimido(dry))k com base na matriz de renderização de grupo individual (Rk), na matriz de desmixagem paramétrica de grupo individual (Uk), na matriz de mixagem de redução individual (Dk) e na matriz de covariância de grupo individual (Ek), e o combinador é configurado para combinar as matrizes de covariância de grupo individuais do sinal estimado parametricamente (Eynão comprimido(dry))k para obter um sinal estimado parametricamente geral Eynão comprimido(dry) .[057] According to one embodiment, the processor is configured to determine an individual group covariance matrix of the parametrically estimated signal (Eyuncompressed(dry))k based on the individual group rendering matrix (Rk), in the individual group parametric unmixing (Uk), into the individual downmixing matrix (Dk) and the individual group covariance matrix (Ek), and the combiner is configured to combine the individual group covariance matrices of the parametrically estimated signal ( Eyuncompressed(dry))k to obtain a general parametrically estimated signal Eyuncompressed(dry) .

[058] De acordo com uma modalidade, o processador é configurado para determinar a matriz inversa regularizada (J) com base em uma decomposição de valor singular de uma matriz de covariância de mixagem de redução (EDMX).[058] According to one embodiment, the processor is configured to determine the regularized inverse matrix (J) based on a singular value decomposition of a reduction mixing covariance matrix (EDMX).

[059] De acordo com uma modalidade, o processador é configurado para determinar uma submatriz (Δk) para uma determinação de uma matriz de desmixagem paramétrica (U), selecionando-se elementos (Δ (m, n)) que correspondem aos sinais de mixagem de redução (m, n) atribuídos ao respectivo grupo (que tem índice k) de sinais de mixagem de redução. Cada grupo de sinais de mixagem de redução cobre um número específico de sinais de mixagem de redução e um conjunto de objetos de áudio de entrada associados e é denotado aqui por um índice k.[059] According to one embodiment, the processor is configured to determine a submatrix (Δk) for a determination of a parametric demixing matrix (U), selecting elements (Δ (m, n)) that correspond to the signals of reduction mix (m, n) assigned to the respective group (which has index k) of reduction mix signals. Each group of reduction mix signals covers a specific number of reduction mix signals and a set of associated input audio objects and is denoted here by an index k.

[060] De acordo com essa modalidade, as submatrizes individuais (Δk) são obtidas selecionando-se ou coletando-se os elementos da matriz de covariância de mixagem de redução Δ que pertencem ao respectivo grupo k.[060] According to this embodiment, individual submatrices (Δk) are obtained by selecting or collecting the elements of the reduction mixing covariance matrix Δ that belong to the respective group k.

[061] Em uma modalidade, as submatrizes individuais (Δk) são invertidas individualmente e os resultados são combinados na matriz inversa regularizada (J).[061] In one embodiment, individual submatrices (Δk) are individually inverted and the results are combined into the regularized inverse matrix (J).

[062] Em uma modalidade diferente, a submatriz (Δk) é obtida com o uso de sua definição como Δk = DkEkDk* com a matriz de mixagem de redução individual (Dk)[062] In a different embodiment, the submatrix (Δk) is obtained using its definition as Δk = DkEkDk* with the individual reduction mixing matrix (Dk)

[063] De acordo com uma modalidade, o combinador é configurado para determinar a matriz de pós-mixagem (P) com base nas matrizes determinadas individualmente para cada grupo de sinais de mixagem de redução e o combinador é configurado para aplicar a matriz de pós-mixagem (P) à pluralidade de sinais de mixagem de redução a fim de obter o sinal de áudio decodificado. Nessa modalidade, a partir de parâmetros de objetos uma matriz de pós- mixagem é computada, a qual é aplicada ao sinal de áudio codificado a fim de obter o sinal de áudio decodificado.[063] According to one embodiment, the combiner is configured to determine the post-mix matrix (P) based on the matrices determined individually for each group of reduction mix signals and the combiner is configured to apply the post matrix -mixing (P) to reduce the plurality of mixing signals in order to obtain the decoded audio signal. In this embodiment, from object parameters a post-mix matrix is computed, which is applied to the encoded audio signal in order to obtain the decoded audio signal.

[064] De acordo com uma modalidade, o aparelho e seus respectivos componentes são configuradas para realizar para cada grupo de sinais de mixagem de redução, individualmente, pelo menos uma dentre as seguintes computações:[064] According to one embodiment, the apparatus and its respective components are configured to perform for each group of reduction mixing signals, individually, at least one of the following computations:

[065] • computação de matriz de covariância de grupo Ek de tamanho Nk vezes Nk com os elementos: [065] • computation of group covariance matrix Ek of size Nk times Nk with the elements:

[066] • computação de matriz de covariância de mixagem de redução de grupo Δk de tamanho Mk vezes [066] • computing group reduction mixing covariance matrix Δk of size Mk times

[067] • computação de decomposição de valor singular de matriz de covariância de mixagem de redução de grupo [067] • computation of singular value decomposition of group reduction mixing covariance matrix

[068] • computação da aproximação de matriz de grupo inversa regularizadaincluindo a computação da matriz individual Ainv k (os detalhes serão dados abaixo),[068] • computation of regularized inverse group matrix approximation including computing the individual matrix Ainv k (details will be given below),

[069] • computação do grupo matriz de desmixagem paramétrica Uk de tamanho Nk vezes Mk: [069] • computation of the parametric unmixing matrix group Uk of size Nk times Mk:

[070] • multiplicação da matriz de renderização de grupo Rk de tamanho NMixagem de aumento vezes Nk com a matriz de desmixagem Uk de tamanho Nk vezes [070] • multiplication of the group rendering matrix Rk of size NK times increase mixing with the unmixing matrix Uk of size Nk times

[071] • computação da matriz de covariância de grupo Ck de tamanho Nsaída vezes Nsaída: [071] • computation of the group covariance matrix Ck of size Noutput times Noutput:

[072] • computação do covariância de grupo do sinal estimado parametricamente (Eynão comprimido(dry))k de tamanho Nsaída vezes Nsaída: [072] • computation of the group covariance of the parametrically estimated signal (Eynot compressed(dry))k of size Noutput times Noutput:

[073] Com relação a isso, k denota um índice de grupo do respectivo grupo de sinais de mixagem de redução, Nk denota o número de objetos de áudio de entrada do conjunto associado de objetos de áudio de entrada, Mk denota o número de sinais de mixagem de redução que pertence ao respectivo grupo de sinais de mixagem de redução, e Nsaída denota o número de canais de saída submetidos à mixagem de aumento ou renderizados.[073] In this regard, k denotes a group index of the respective group of downmix signals, Nk denotes the number of input audio objects of the associated set of input audio objects, Mk denotes the number of signals downmix signal that belongs to the respective downmix signal group, and Noutput denotes the number of output channels upmixed or rendered.

[074] As matrizes computadas estão em tamanhos menores que aquelas usadas no estado da técnica. Consequentemente, em uma modalidade o máximo de etapas de processamento possíveis são realizadas individualmente nos grupos de sinais de mixagem de redução.[074] The computed matrices are smaller in size than those used in the prior art. Consequently, in one embodiment as many processing steps as possible are performed individually on the reduction mix signal groups.

[075] O objetivo da invenção também é alcançado por um método correspondente para processar um sinal de áudio codificado. O sinal de áudio codificado compreende uma pluralidade de sinais de mixagem de redução associados a uma pluralidade de objetos de áudio de entrada e parâmetros de objeto. O método compreende as seguintes etapas:[075] The object of the invention is also achieved by a corresponding method for processing a coded audio signal. The encoded audio signal comprises a plurality of downmix signals associated with a plurality of input audio objects and object parameters. The method comprises the following steps:

[076] • agrupamento os sinais de mixagem de redução em uma pluralidade de grupos de sinais de mixagem de redução associados a um conjunto de objetos de áudio de entrada dentre a pluralidade de objetos de áudio de entrada,[076] • grouping the reduction mixing signals into a plurality of groups of reduction mixing signals associated with a set of input audio objects among the plurality of input audio objects,

[077] • realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto de cada conjunto de objetos de áudio de entrada a fim de fornecer resultados em grupo, e[077] • perform at least one individual processing step on the object parameters of each set of input audio objects in order to provide group results, and

[078] • combinar os ditos resultados em grupo a fim de fornecer um sinal de áudio decodificado.[078] • combining said results into a group in order to provide a decoded audio signal.

[079] O agrupamento é realizado pelo menos com a restrição de que cada objeto de áudio de entrada dentre a pluralidade de objetos de áudio de entrada pertence a apenas um conjunto de objetos de áudio de entrada.[079] Grouping is performed at least with the restriction that each input audio object among the plurality of input audio objects belongs to only one set of input audio objects.

[080] As modalidades mencionadas acima do aparelho também podem ser realizadas pelas etapas do método e modalidades correspondentes do método. Portanto, as explicações dadas para as modalidades do aparelho também são mantidas para o método.[080] The above-mentioned modalities of the apparatus can also be carried out by the method steps and corresponding modalities of the method. Therefore, the explanations given for the modalities of the device are also maintained for the method.

[081] A invenção será explicada a seguir com relação aos desenhos anexos e às modalidades retratadas nos desenhos anexos, nos quais:[081] The invention will be explained below in relation to the attached drawings and the embodiments depicted in the attached drawings, in which:

[082] A Figura 1 mostra uma visão geral de um conceito de mixagem de redução/mixagem de aumento paramétrico com base em MMSE,[082] Figure 1 shows an overview of a parametric down mixing/up mixing concept based on MMSE,

[083] A Figura 2 mostra um sistema de reconstrução paramétrica com descorrelação aplicada em saída renderizada,[083] Figure 2 shows a parametric reconstruction system with decorrelation applied to rendered output,

[084] A Figura 3 mostra uma estrutura de um processador de mixagem de redução,[084] Figure 3 shows a structure of a reduction mixing processor,

[085] A Figura 4 mostra espectrogramas de cinco objetos de áudio de entrada (coluna do lado esquerdo) e espectrogramas dos canais de mixagem de redução correspondentes (coluna do lado direito),[085] Figure 4 shows spectrograms of five input audio objects (left-hand column) and spectrograms of the corresponding reduction mix channels (right-hand column),

[086] A Figura 5 mostra espectrogramas de sinais de saída de referência (coluna do lado esquerdo) e espectrogramas dos sinais de saída decodificados e renderizados de 3D de SAOC correspondentes (coluna do lado direito),[086] Figure 5 shows spectrograms of reference output signals (left side column) and spectrograms of the corresponding decoded and 3D rendered SAOC output signals (right side column),

[087] A Figura 6 mostra espectrogramas dos sinais de saída de 3D de SAOC com o uso da invenção,[087] Figure 6 shows spectrograms of the 3D SAOC output signals using the invention,

[088] A Figura 7 mostra um processamento de parâmetro de quadro de acordo com o estado da técnica,[088] Figure 7 shows a frame parameter processing according to the prior art,

[089] A Figura 8 mostra um processamento de parâmetro de quadro de acordo com a invenção,[089] Figure 8 shows a frame parameter processing according to the invention,

[090] A Figura 9 mostra um exemplo de uma implantação de uma função de detecção de grupo,[090] Figure 9 shows an example of an implementation of a group detection function,

[091] A Figura 10 mostra esquematicamente um aparelho para codificar objetos de áudio de entrada,[091] Figure 10 schematically shows an apparatus for encoding input audio objects,

[092] A Figura 11 mostra esquematicamente um exemplo de um aparelho da invenção para processar um sinal de áudio codificado,[092] Figure 11 schematically shows an example of an apparatus of the invention for processing a coded audio signal,

[093] A Figura 12 mostra esquematicamente um exemplo diferente de um aparelho da invenção para processar um sinal de áudio codificado,[093] Figure 12 schematically shows a different example of an apparatus of the invention for processing a coded audio signal,

[094] A Figura 13 mostra uma sequência de etapas de uma modalidade do método da invenção,[094] Figure 13 shows a sequence of steps of an embodiment of the method of the invention,

[095] A Figura 14 mostra esquematicamente um exemplo de um aparelho da invenção,[095] Figure 14 schematically shows an example of an apparatus of the invention,

[096] A Figura 15 mostra esquematicamente um exemplo adicional de um aparelho,[096] Figure 15 schematically shows an additional example of an apparatus,

[097] A Figura 16 mostra esquematicamente um processador de um aparelho da invenção, e[097] Figure 16 schematically shows a processor of a device of the invention, and

[098] A Figura 17 mostra esquematicamente a aplicação de um aparelho da invenção.[098] Figure 17 schematically shows the application of an apparatus of the invention.

[099] No seguinte, uma visão geral de esquemas de separação paramétrica será fornecida, com o uso do exemplo da tecnologia de Codificação de Áudio Espacial Orientada a Objetos (SAOC) de MPEG ([SAOC]) e parte de processamento 3D de SAOC de Áudio 3D de MPEG-H ([SAOC3D, SAOC3D2]). As propriedades matemáticas desses métodos são consideradas.[099] In the following, an overview of parametric separation schemes will be provided, using the example of MPEG's Spatial Audio Object-Oriented Coding (SAOC) technology ([SAOC]) and SAOC's 3D processing part of MPEG-H 3D Audio ([SAOC3D, SAOC3D2]). The mathematical properties of these methods are considered.

[100] A seguinte notação matemática é usada:[100] The following mathematical notation is used:

[101] N número de objetos de áudio de entrada (alternativamente: objetos de entrada)[101] N number of input audio objects (alternatively: input objects)

[102] Ndmx número de canais de mixagem de redução (transporte)[102] Ndmx number of downmix (transport) channels

[103] Nsaída número de canais de mixagem de aumento (renderizados)[103] Noutput number of boost mix channels (rendered)

[104] Namostras número de amostras por sinal de áudio[104] Samples number of samples per audio signal

[105] D matriz de mixagem de redução, tamanho Ndmx vezes N[105] D reduction mixing matrix, size Ndmx times N

[106] S sinal de objeto de áudio de entrada, tamanho N vezes Namostras[106] S input audio object signal, size N times NaSamples

[107] E matriz de covariância de objeto, tamanho N vezes N, aproximação de [107] And object covariance matrix, size N times N, approximation of

[108] X sinais de áudio de mixagem de redução, tamanho Ndmx vezes Namostras, definidos como [108] X down mix audio signals, size Ndmx times Na samples, defined as

[109] EDMX matriz de covariância dos sinais de mixagem de redução, tamanho Ndmx vezes Ndmx,[109] EDMX covariance matrix of reduction mixing signals, size Ndmx times Ndmx,

[110] definida como [110] defined as

[111] U matriz de estimativa de fonte paramétrica, tamanho N vezes Ndmx,[111] U parametric font estimation matrix, size N times Ndmx,

[112] que se aproxima de [112] which approaches

[113] R matriz de renderização (especificada no lado de decodificador), tamanho Nsaída vezes N ^ .,[113] R render matrix (specified on the decoder side), size Noutput times N^.,

[114] S sinais de objeto reconstruído parametricamente, tamanho N vezes Namostras,[114] S parametrically reconstructed object signals, size N times Na samples,

[115] que se aproxima de S e é definido como [115] which approaches S and is defined as

[116] Ynão comprimido(dry) sinais de objeto reconstruídos e renderizados parametricamente,[116] Uncompressed (dry) object signals reconstructed and rendered parametrically,

[117] tamanho Nsaída vezes Namostras, definidos como Ynão comprimido(dry) = RUX[117] size Noutput times Nasamples, defined as Yuncompressed(dry) = RUX

[118] Ycomprimido(wet) saídas de descorrelacionador, tamanho Nsaída vezes Namostras[118] Ycompressed(wet) decorrelator outputs, size Noutput times Nasamples

[119] Y saída final, tamanho Nsaída vezes Namostras[119] Y final output, size Noutput times Nasamples

[120] (•)* operador autoadjunto (hermitiano),[120] (•)* self-adjoint operator (Hermitian),

[121] que representa a transposição de conjugado de (•)[121] which represents the conjugate transposition of (•)

[122] F descorr (• ) função de descorrelacionador[122] F decorrelator function (• ) decorrelator

[123] Sem perda de generalidade, a fim de aprimorar a capacidade de leitura das equações, para todas as variáveis introduzidas os índices que denotam dependência de tempo e frequência são omitidos.[123] Without loss of generality, in order to improve the readability of the equations, for all introduced variables the indices denoting time and frequency dependence are omitted.

[124] Sistemas de separação de objeto paramétrico:[124] Parametric object separation systems:

[125] Esquemas de separação paramétrica tem como objetivo estimar um número de fontes de áudio da mistura de sinal (mixagem de redução) com o uso de informações paramétricas auxiliares. A solução típica dessa tarefa tem como base a aplicação dos algoritmos de estimação de Erro Quadrático Médio Mínimo (MMSE). A tecnologia de SAOC é um exemplo de tal sistemas de conversão em código de áudio paramétrico.[125] Parametric separation schemes aim to estimate a number of audio sources from the signal mix (reduction mix) with the use of auxiliary parametric information. The typical solution for this task is based on the application of Minimum Mean Square Error (MMSE) estimation algorithms. SAOC technology is an example of such parametric audio code conversion systems.

[126] A Figura 1 retrata o princípio geral da arquitetura de codificador/decodificador de SAOC.[126] Figure 1 depicts the general principle of the SAOC encoder/decoder architecture.

[127] O processamento de mixagem de redução/mixagem de aumento paramétrico geral é realizado de uma forma seletiva de tempo/frequência e pode ser descrito como uma sequência das seguintes etapas:[127] General parametric downmix/boost mix processing is performed in a time/frequency selective manner and can be described as a sequence of the following steps:

[128] • O “codificador” é dotado de entrada “objetos de áudio” S e “parâmetros de mixagem” D. O “mixador” submete os “objetos de áudio” S à mixagem de redução em um número de “sinais de mixagem de redução” X com o uso de “parâmetros de mixagem” D (por exemplo, ganhos de mixagem de redução).[128] • The “encoder” is provided with input “audio objects” S and “mixing parameters” D. The “mixer” subjects the “audio objects” S to downmixing into a number of “mixing signals reduction”

[129] • O “estimador de informações secundárias” extrai as informações de lado que descrevem características da entrada “objetos de áudio” S (por exemplo, propriedades de covariância).[129] • The “side information estimator” extracts side information that describes characteristics of the input “audio objects” S (e.g., covariance properties).

[130] • Os “sinais de mixagem de redução” X e as informações de lado são transmitidos ou armazenados. Esses sinais de áudio de mixagem de redução podem ser adicionalmente comprimidos com o uso de conversores em código de áudio (tais como Camada de MPEG-1/2 II ou III, Codificação de Áudio Avançado de MPEG-2/4 (AAC), Codificação de Fala e Áudio Unificada de MPEG (USAC), etc.). As informações de lado também podem ser representadas e codificadas de modo eficaz (por exemplo, como relações convertidas em código das potências de objeto e dos coeficientes de correlação de objeto).[130] • “Reduction mixing signals” X and side information are transmitted or stored. These downmix audio signals can be further compressed using converters into audio code (such as MPEG-1/2 Layer II or III, MPEG-2/4 Advanced Audio Coding (AAC), MPEG Unified Speech and Audio (USAC), etc.). Side information can also be represented and encoded effectively (for example, as coded relations of object powers and object correlation coefficients).

[131] O “decodificador” restaura os “objetos de áudio” originais dos “sinais de mixagem de redução” decodificados com o uso das informações de lado transmitidas (essas informações fornecem os parâmetros de objeto). O “processador de informações secundárias” estima os coeficientes de desmixagem a serem aplicados nos “sinais de mixagem de redução” dentro de “separador de objeto paramétrico” para obter a reconstrução de objeto paramétrico de S. Os “objetos de áudio” reconstruídos são renderizados para uma situação-alvo (múltiplos canais), representada pelos canais de saída Y, aplicando-se “parâmetros de renderização” R.[131] The “decoder” restores the original “audio objects” from the “reduction mix signals” decoded using the transmitted side information (this information provides the object parameters). The “secondary information processor” estimates the demixing coefficients to be applied to the “reduction mix signals” within the “parametric object separator” to obtain the parametric object reconstruction of S. The reconstructed “audio objects” are rendered for a target situation (multiple channels), represented by output channels Y, applying “rendering parameters” R.

[132] O mesmo princípio e as etapas sequências são aplicados no processamento 3D de SAOC, que incorpora uma trajetória de descorrelação adicional.[132] The same principle and sequence steps are applied in 3D SAOC processing, which incorporates an additional decorrelation trajectory.

[133] A Figura 2 fornece uma visão geral do conceito de mixagem de redução/mixagem de aumento paramétrico com trajetória de descorrelação integrada.[133] Figure 2 provides an overview of the concept of parametric step-down mixing/boost mixing with integrated decorrelation trajectory.

[134] Com o uso do exemplo da técnica de 3D de SAOC, parte do Áudio 3D de MPEG-H, as etapas de processamento principais de tal sistema de separação paramétrica podem ser resumidas conforme o seguinte:[134] Using the example of the SAOC 3D technique, part of MPEG-H 3D Audio, the main processing steps of such a parametric separation system can be summarized as follows:

[135] O decodificador de 3D de SAOC produz a saída renderizada modificada Y como uma mistura do sinal reconstruído e renderizado parametricamente (sinal não comprimido (dry)) Ynão comprimido(dry) e sua versão descorrelacionada (sinal comprimido (wet)) Ycomprimido(wet).[135] The SAOC 3D decoder produces the modified rendered output Y as a mixture of the reconstructed and parametrically rendered signal (uncompressed (dry) signal) Yuncompressed (dry) and its uncorrelated version (compressed (wet) signal) Ycompressed ( wet).

[136] Para a discussão da invenção relevante - as etapas de processamento podem ser diferenciadas conforme ilustrado na Figura 3:[136] For the discussion of the relevant invention - the processing steps can be differentiated as illustrated in Figure 3:

[137] • Desmixar, que reconstrói parametricamente os objetos de áudio de entrada com o uso de matriz U,[137] • Unmix, which parametrically reconstructs input audio objects using U-matrix,

[138] • Renderizar com o uso de informações de renderização (matriz R),[138] • Render using rendering information (R matrix),

[139] • Descorrelacionar,[139] • Uncorrelate,

[140] • Pós-mixar com o uso de matriz P, computada com base em informações contidas no fluxo de bits.[140] • Post-mix using matrix P, computed based on information contained in the bit stream.

[141] A separação de objeto paramétrico é obtida a partir do sinal de mixagem de redução X com o uso da matriz de desmixagem U com base nas ê informações de lado adicionais: [141] Parametric object separation is achieved from the reduction mix signal X using the demix matrix U based on ê additional side information:

[142] As informações de renderização R são usadas para obter o sinal não , comprimido (dry) como: [142] The R rendering information is used to obtain the dry compressed signal as:

[143] O sinal de saída final Y é computado a partir dos sinais Ynão comprimido(dry) e Ycomprimido(wet) como [143] The final output signal Y is computed from the signals Yuncompressed(dry) and Ycompressed(wet) as

[144] A matriz de mixagem P é computada, por exemplo, com base em informações de renderização, informações de correlação, informações de energia, informações de covariância, etc.[144] The mixing matrix P is computed, for example, based on rendering information, correlation information, energy information, covariance information, etc.

[145] Na invenção, essa será a matriz de pós-mixagem aplicada ao sinal de áudio codificado a fim de obter o sinal de áudio decodificado.[145] In the invention, this will be the post-mix matrix applied to the encoded audio signal in order to obtain the decoded audio signal.

[146] No seguinte, a operação de separação de objeto paramétrico comum que usa MMSE será explicada.[146] In the following, the common parametric object separation operation using MMSE will be explained.

[147] A matriz de desmixagem U é obtida com base em informações derivadas de variáveis contidas no fluxo de bits (por exemplo, a matriz de mixagem de redução D e as informações de covariância E), que usam o algoritmo de estimação de Erro Quadrático Médio Mínimo (MMSE): U = ED*J.[147] The demixing matrix U is obtained based on information derived from variables contained in the bitstream (e.g., the demixing matrix D and the covariance information E), which use the Quadratic Error estimation algorithm Minimum Average (MMSE): U = ED*J.

[148] A matriz J de tamanho Ndmx vezes Ndmx representa uma aproximação da pseudoinversa da matriz de covariância de mixagem de redução as [148] The matrix J of size Ndmx times Ndmx represents an approximation of the pseudoinverse of the reduction mixing covariance matrix to the

[149] A computação da matriz J é derivada de acordo com: [149] The computation of matrix J is derived according to:

[150] em que as matrizes V e A são determinadas com o uso da decomposição de valor singular (SVD) da matriz EDMX as: [150] in which the matrices V and A are determined using the singular value decomposition (SVD) of the EDMX matrix as:

[151] Deve-se observar que resultados semelhantes podem ser obtidos com o uso de métodos de decomposição diferentes tais como: decomposição de autovalor, decomposição de Schur, etc.[151] It should be noted that similar results can be obtained using different decomposition methods such as: eigenvalue decomposition, Schur decomposition, etc.

[152] A operação de inversa regularizada (• )inv, usada para a matriz de valor singular diagonal A, pode ser determinada, por exemplo, conforme feito em 3D de SAOC, com o uso de um truncamento dos valores singulares relativos ao maior valor singular: [152] The regularized inverse operation (• )inv, used for the diagonal singular value matrix A, can be determined, for example, as done in SAOC 3D, with the use of a truncation of the singular values relative to the largest value singular:

[153] Em uma modalidade diferente, a seguinte fórmula é usada: [153] In a different embodiment, the following formula is used:

[154] A escalar de regularização relativa é determinada com o uso de limiar absoluto Treg e valor maximal de Λ como:com Treg = 10-2, por exemplo.[154] The relative regularization scalar is determined using absolute threshold Treg and maximum value of Λ as: with Treg = 10-2, for example.

[155] Dependendo dos valores singulares, Ai,i pode ser restringido apenas a valores positivos (se λi,i < 0, então, λi,i = abs(λi,i) e o sinal (λi,i) é multiplicado com o vetor singular esquerdo ou direito correspondente) ou valores negativos podem ser permitidos.[155] Depending on the singular values, Ai,i can be restricted to positive values only (if λi,i < 0, then λi,i = abs(λi,i) and the sign (λi,i) is multiplied with the corresponding left or right singular vector) or negative values may be allowed.

[156] No segundo caso com valores negativos de Ai,i a escalar de regularização relativa é computada como: [156] In the second case with negative values of Ai, relative regularization scalar is computed as:

[157] Para simplicidade, no seguinte a segunda definição de Treg será usada.[157] For simplicity, in the following the second definition of Treg will be used.

[158] Resultados semelhantes podem ser obtidos com o uso de truncamento dos valores singulares relativos a um valor absoluto ou outros métodos de regularização usados para inversão de matriz.[158] Similar results can be obtained using truncation of singular values relative to an absolute value or other regularization methods used for matrix inversion.

[159] A inversão de valores singulares muito pequenos pode resultar em coeficientes de desmixagem muito altos e, consequentemente, a amplificações altas dos canais de mixagem de redução correspondentes. Em tal caso, canais com níveis de energia muito baixos podem ser amplificados com o uso de ganhos altos e isso pode resultar em artigos audíveis. A fim de reduzir esse efeito .... . . TA ~ . indesejado, os valores singulares menores que o limiar relativo reg são truncados a zero.[159] Inverting very small singular values can result in very high demixing coefficients and consequently high amplifications of the corresponding downmix channels. In such a case, channels with very low energy levels can be amplified using high gains and this can result in audible articles. In order to reduce this effect.... . TA ~ . undesirable, singular values smaller than the relative threshold reg are truncated to zero.

[160] Agora, as desvantagens constatadas na técnica de separação de objeto paramétrico do estado da técnica são explicadas.[160] Now, the disadvantages found in the prior art parametric object separation technique are explained.

[161] Os métodos de separação de objeto paramétrico do estado da técnica descritos especificam o uso de inversão regularizada da matriz de covariância de mixagem de redução a fim de evitar artigos de separação. No entanto, para alguns casos de uso real em situações de mixagem, artigos prejudiciais causados por regularização muito agressiva foram identificados na saída do sistema.[161] The described prior art parametric object separation methods specify the use of regularized inversion of the reduction mixing covariance matrix in order to avoid separation articles. However, for some real use cases in mixing situations, harmful articles caused by too aggressive smoothing have been identified in the system output.

[162] No seguinte, um exemplo de tal situação é construído e analisado.[162] In the following, an example of such a situation is constructed and analyzed.

[163] Um número N = 5 de objetos de áudio de entrada (S) é codificado com o uso da técnica descrita (mais precisamente, o método de parte de processamento 3D de SAOC de Áudio 3D de MPEG-H) em um número Ndmx = 3 de canais de mixagem de redução (X).[163] An N = 5 number of input audio objects (S) are encoded using the described technique (more precisely, the MPEG-H 3D Audio SAOC 3D processing part method) into a number Ndmx = 3 reduction mix channels (X).

[164] Os objetos de áudio de entrada do exemplo podem consistir em:[164] The example input audio objects might consist of:

[165] • um grupo de dois objetos de áudio correlacionados que contém sinais de acompanhamento musical (Lado Esquerdo e Lado Direito de um par estéreo),[165] • a group of two correlated audio objects that contain musical accompaniment signals (Left Side and Right Side of a stereo pair),

[166] • um grupo de um objeto de áudio independente que contém um sinal de fala, e[166] • a group of an independent audio object that contains a speech signal, and

[167] • um grupo de dois objetos de áudio correlacionados que contém uma gravação de piano (Lado Esquerdo e Lado Direito de um par estéreo).[167] • a group of two correlated audio objects that contain a piano recording (Left Side and Right Side of a stereo pair).

[168] Os sinais de entrada são submetidos à mixagem de redução em três grupos de canais de transporte:[168] Input signals are downmixed into three groups of transport channels:

[169] • grupo G1 com M1 = 1 canais de mixagem de redução, que contém o primeiro grupo de objetos,[169] • group G1 with M1 = 1 down mix channels, which contains the first group of objects,

[170] • grupo G2 com M2 = 1 canais de mixagem de redução, que contém o segundo grupo de objetos, e[170] • group G2 with M2 = 1 down mix channels, which contains the second group of objects, and

[171] • grupo G3 com M3 = 1 canais de mixagem de redução, que contém o terceiro grupo de objetos,[171] • group G3 with M3 = 1 reduction mix channels, which contains the third group of objects,

[172] de modo que Ndmx = M1 + M2 + M3.[172] so that Ndmx = M1 + M2 + M3.

[173] As matrizes de mixagem de redução Dk correspondentes a cada grupo Gk, para k = 1, 2, 3, são construídas com o uso de ganhos de mixagem unitários, e a matriz de mixagem de redução completa D são fornecidas por: [173] The reduction mixing matrices Dk corresponding to each group Gk, for k = 1, 2, 3, are constructed using unity mixing gains, and the full reduction mixing matrix D is given by:

[174] Pode-se observar a ausência de mixagem cruzada entre o grupo de primeiros dois sinais de objeto, o terceiro sinal de objeto, e do grupo dos últimos dois sinais de objeto. Observa-se também que o terceiro sinal de objeto que contém a fala é mixado sozinho em um canal de mixagem de redução. Portanto, espera-se uma boa reconstrução desse objeto e, consequentemente, também uma boa renderização. Os espectrogramas dos sinais de entrada e do sinal de mixagem de redução obtidos são ilustrados na Figura 4.[174] One can observe the absence of cross-mixing between the group of first two object signals, the third object signal, and the group of last two object signals. It is also noted that the third object signal containing speech is mixed alone in a down mixing channel. Therefore, a good reconstruction of this object is expected and, consequently, also a good rendering. The spectrograms of the input signals and the reduction mixing signal obtained are illustrated in Figure 4.

[175] A conversão em código de núcleo de sinal de mixagem de redução possível usada em um sistema real é omitida aqui para mais bem destacar o efeito indesejado. No lado de decodificador, a decodificação paramétrica de 3D de SAOC é usada para reconstruir e renderizar os sinais de objeto de áudio a uma configuração de 3 canais (Nsaída = 3): Os canais Esquerdo (L), Central (C) e Direito (R).[175] The possible downmix signal core code conversion used in a real system is omitted here to better highlight the undesired effect. On the decoder side, SAOC 3D parametric decoding is used to reconstruct and render the audio object signals to a 3-channel configuration (Noutput = 3): The Left (L), Center (C), and Right channels ( R).

[176] Uma remixagem simples dos objetos de áudio de entrada do exemplo é usada no seguinte:[176] A simple remix of the example input audio objects is used in the following:

[177] • os primeiros dois objetos de áudio (o acompanhamento musical) são silenciados (isto é, renderizados com um ganho 0),[177] • the first two audio objects (the musical accompaniment) are muted (that is, rendered with a gain of 0),

[178] • o terceiro objeto de entrada (a fala) é renderizado para o canal central, e[178] • the third input object (speech) is rendered to the center channel, and

[179] • o objeto 4 é renderizado para o canal esquerdo e o objeto 5 para o canal direito.[179] • object 4 is rendered to the left channel and object 5 to the right channel.

[180] Consequentemente, a matriz de renderização usada é fornecida por: [180] Consequently, the rendering matrix used is given by:

[181] A saída de referência pode ser computada aplicando-se a matriz de renderização especificada diretamente aos sinais de entrada: Yref = RS.[181] The reference output can be computed by applying the specified render matrix directly to the input signals: Yref = RS.

[182] Os espectrogramas da saída de referência e os sinais de saída da decodificação e renderização de 3D de SAOC são ilustrados pelas duas colunas da Figura 5.[182] Spectrograms of the reference output and the SAOC 3D decoding and rendering output signals are illustrated by the two columns of Figure 5.

[183] A partir dos espectrogramas mostrados da saída de decodificador de 3D de SAOC, as seguintes observações podem ser notadas:[183] From the spectrograms shown of the SAOC 3D decoder output, the following observations can be noted:

[184] • O canal central que contém apenas o sinal de fala é danificado gravemente em comparação ao sinal de referência. Orifícios espectrais grandes podem ser observados. Esses orifícios espectrais (que são regiões de tempo e frequência com energia ausente) resultam em artigos audíveis graves.[184] • The central channel containing only the speech signal is severely damaged compared to the reference signal. Large spectral holes can be observed. These spectral holes (which are regions of time and frequency with missing energy) result in bass audible articles.

[185] • Lacunas espectrais pequenas também estão presentes nos canais esquerdo e direito, especialmente, nas regiões de baixa frequência, nas quais a maior parte da energia de sinal está concentrada. Essas lacunas espectrais também resultam em artigos audíveis.[185] • Small spectral gaps are also present in the left and right channels, especially in the low-frequency regions where most of the signal energy is concentrated. These spectral gaps also result in audible articles.

[186] • Não há mixagem cruzada de grupos de objetos nos canais de mixagem de redução, isto é, os objetos submetidos à mixagem em um canal de mixagem de redução não estão presentes em qualquer outro canal de mixagem de redução. O segundo canal de mixagem de redução contém apenas um objeto (a fala); portanto, as lacunas espectrais na saída de sistema podem ser geradas apenas devido ao fato de serem processadas em conjunto com os outros canais de mixagem de redução.[186] • There is no cross-mixing of groups of objects on the down mix channels, that is, objects downmixed on one down mix channel are not present on any other down mix channel. The second down mix channel contains only one object (speech); therefore, spectral gaps in the system output may be generated simply due to the fact that it is processed in conjunction with the other down mix channels.

[187] Com base nas observações mencionadas, pode-se concluir que:[187] Based on the aforementioned observations, it can be concluded that:

[188] • O sistema 3D de SAOC não é um sistema “atravessante”, isto é, se um sinal de entrada for mixado sozinho em um canal de mixagem de redução, a qualidade de áudio desse sinal de entrada deve ser preservada na decodificação e renderização.[188] • The SAOC 3D system is not a “through” system, that is, if an input signal is mixed alone on a down mix channel, the audio quality of that input signal must be preserved upon decoding and rendering.

[189] • O sistema 3D de SAOC pode introduzir artigos audíveis devido ao processamento de sinais de mixagem de redução de múltiplos canais. A qualidade de saída de objetos contidos em um grupo de canais de mixagem de redução depende do processamento do restante dos canais de mixagem de redução.[189] • The 3D system of SAOC can introduce audible articles due to multi-channel downmix signal processing. The output quality of objects contained in a group of down mix channels depends on the processing of the rest of the down mix channels.

[190] As lacunas espectrais, especialmente, aquelas no canal central, indicam que algumas informações úteis contidas nos canais de mixagem de redução são descartadas pelo processamento. Essa perda de informações pode ser traçada até a etapa de separação o objeto paramétrico, mais precisamente, à etapa de regularização da inversão de matriz de covariância de mixagem de redução.[190] Spectral gaps, especially those in the center channel, indicate that some useful information contained in the down mix channels is discarded by processing. This loss of information can be traced back to the step of separating the parametric object, more precisely, to the regularization step of the reduction mixing covariance matrix inversion.

[191] Por definição, a matriz de mixagem de redução no exemplo tem, uma estrutura bloco-diagonal: [191] By definition, the reduction mixing matrix in the example has a block-diagonal structure:

[192] Ademais, devido à relação especificada entre objetos de entrada (por exemplo, sinalização de correlações paramétricas) também a matriz de covariância de sinal de objeto de entrada disponível no decodificador tem uma estrutura bloco-diagonal: [192] Furthermore, due to the specified relationship between input objects (e.g. signaling parametric correlations) also the input object signal covariance matrix available in the decoder has a block-diagonal structure:

[193] Como consequência, a matriz de covariância de mixagem de redução pode ser representada em uma forma bloco-diagonal: [193] As a consequence, the reduction mixing covariance matrix can be represented in a block-diagonal form:

[194] Nesse caso, a matriz EDMX já está no bloco-diagonal, porém, para o caso geral, sua forma diagonal em bloco pode ser obtida após a permutação de fileiras/colunas com o uso do operador de permutação [194] In this case, the EDMX matrix is already in the block-diagonal, however, for the general case, its block-diagonal form can be obtained after permuting rows/columns using the permutation operator

[195] Um operador de permutação Φ é definido como uma matriz obtida por permutação das fileiras de uma matriz de identidade. Se uma matriz simétrica A puder ser representada em uma forma bloco-diagonal permutando-se fileiras e colunas, o operador de permutação pode ser usado para expressar a matriz resultante à como: [195] A permutation operator Φ is defined as a matrix obtained by permuting the rows of an identity matrix. If a symmetric matrix A can be represented in block-diagonal form by permuting rows and columns, the permutation operator can be used to express the resulting matrix à as:

[196] Se Φ for um operador de permutação, então, as seguintes propriedades são verdadeiras:[196] If Φ is a permutation operator, then the following properties are true:

[197] • primeiro, se V for uma matriz unitária, então, também é uma matriz unitária, e[197] • first, if V is a unitary matrix, then, is also a unitary matrix, and

[198] • segundo,com a matriz de identidade I.[198] • second, with the identity matrix I.

[199] Como consequência, os operadores de permutação são transparentes para algoritmos de decomposição de valor singular. Isso significa que a matriz original A e a matriz permutada à compartilham os mesmos valores singulares e vetores singulares permutados: [199] As a consequence, permutation operators are transparent to singular value decomposition algorithms. This means that the original matrix A and the permuted matrix à share the same singular values and permuted singular vectors:

[200] Devido à representação bloco-diagonal, os valores singulares de matriz EDMX podem ser computados aplicando-se a SVD à matriz EDMX ou aplicando-se a SVD às submatrizes diagonais de blocos EDMXk e combinando-se os resultados: [200] Due to the block-diagonal representation, the singular values of the EDMX matrix can be computed by applying the SVD to the EDMX matrix or by applying the SVD to the EDMXk block diagonal submatrices and combining the results:

[201] Uma vez que os valores singulares da matriz de covariância de mixagem de redução sejam diretamente relacionados aos níveis de energia dos canais de mixagem de redução (que são descritos pela diagonal principal da matriz EDMX): [201] Since the singular values of the downmix covariance matrix are directly related to the power levels of the downmix channels (which are described by the main diagonal of the EDMX matrix):

[202] e objetos contidos em um canal não serem contidos em qualquer outro canal de mixagem de redução, pode-se concluir que cada valor singular corresponde a um canal de mixagem de redução.[202] and objects contained in one channel are not contained in any other down mix channel, it can be concluded that each singular value corresponds to a down mix channel.

[203] Portanto, se um dentre os canais de mixagem de redução tiver nível de energia muito menor que o restante dos canais de mixagem de redução, o valor singular correspondente a esse canal será muito menor que o restante dos valores singulares.[203] Therefore, if one of the reduction mix channels has a much lower energy level than the rest of the reduction mix channels, the singular value corresponding to that channel will be much lower than the rest of the singular values.

[204] A etapa de truncar usada na inversão da matriz que contém os valores singulares da matriz EDMX: [204] The truncate step used in inverting the matrix containing the singular values of the EDMX matrix:

[205] pode resultar em truncamento de valores singulares correspondentes ao canal de mixagem de redução com o nível de energia pequeno (em relação ao canal de mixagem de redução com a maior energia). Devido a isso, as informações presentes nesse canal de mixagem de redução com energia relativamente baixa são descartadas e as lacunas espectrais observadas nas Figuras de espectrograma e saída de áudio são geradas[205] can result in truncation of singular values corresponding to the reduction mix channel with the small energy level (relative to the reduction mix channel with the highest energy). Due to this, the information present in this relatively low energy reduction mix channel is discarded and the spectral gaps observed in the Spectrogram and Audio Output Figures are generated.

[206] Para um melhor entendido, considerou-se que a mixagem de redução dos objetos de áudio de entrada ocorre para cada amostra e para cada banda de frequência separadamente. Especialmente a separação em bandas diferentes ajuda a entender o motivo de lacunas poderem ser constatadas nos espectrogramas dos sinais de saída em frequências diferentes.[206] For a better understanding, it was considered that the downmixing of input audio objects occurs for each sample and for each frequency band separately. Especially the separation into different bands helps to understand why gaps can be seen in the spectrograms of output signals at different frequencies.

[207] O problema identificado pode ser isolado ao fato de que o limiar de regularização relativa é computado para valores singulares sem considerar que a matriz a ser invertida é bloco-diagonal: [207] The identified problem can be isolated to the fact that the relative regularization threshold is computed for singular values without considering that the matrix to be inverted is block-diagonal:

[208] Cada matriz bloco-diagonal corresponde a um grupo independente de canais de mixagem de redução. O truncamento é realizado com relação ao maior valor singular, porém, esse valor descreve apenas um grupo de canais. Desse modo, a reconstrução de objetos contidos em todos os grupos independentes de canais de mixagem de redução se torna dependente do grupo que contém o maior valor singular.[208] Each block-diagonal matrix corresponds to an independent group of downmix channels. Truncation is performed with respect to the largest singular value, however, this value describes only a group of channels. In this way, the reconstruction of objects contained in all independent groups of downmix channels becomes dependent on the group containing the largest singular value.

[209] No seguinte, a invenção será explicada com base na modalidade discutida acima com relação ao estado da técnica:[209] In the following, the invention will be explained based on the embodiment discussed above with respect to the prior art:

[210] Considerando o exemplo descrito acima, as três matrizes de covariância podem ser associadas aos três grupos diferentes de canais de mixagem de redução Gk com 1 < k < 3. Os objetos de áudio ou objetos de áudio de entrada contidos nos canais de mixagem de redução de cada grupo não estão contidos em qualquer outro grupo. Adicionalmente, nenhuma relação (por exemplo, correlação) é assinalada entre objetos contidos em canais de mixagem de redução dos grupos diferentes.[210] Considering the example described above, the three covariance matrices can be associated with the three different groups of Gk reduction mixing channels with 1 < k < 3. The audio objects or input audio objects contained in the mixing channels of each group are not contained in any other group. Additionally, no relationship (e.g., correlation) is noted between objects contained in reduction mix channels of different groups.

[211] A fim de solucionar o problema identificado do sistema de reconstrução paramétrica, o método da invenção propõe aplicar a etapa de regularização independentemente para cada grupo. Isso implica que três limiares diferentes são computados para a inversão das três matrizes de Teg = max (abs (Ai)) T: covariância de mixagem de redução independentes:, em que 1 ≤ k ≤ 3. Dessa forma, na invenção, em uma modalidade tal limiar é computado para cada grupo separadamente e não como no estado da técnica, um limiar geral para as respectivas bandas e amostras de frequência.[211] In order to solve the identified problem of the parametric reconstruction system, the method of the invention proposes to apply the regularization step independently for each group. This implies that three different thresholds are computed for the inversion of the three independent Teg = max (abs (Ai)) T: reduction mixing covariance matrices: , where 1 ≤ k ≤ 3. Thus, in the invention, in one embodiment such threshold is computed for each group separately and not, as in the prior art, a general threshold for the respective bands and frequency samples.

[212] A inversão dos valores singulares é, consequentemente, obtida aplicando-se a regularização independentemente às submatrizes EDMXk, com 1 ≤ k ≤ 3: [212] The inversion of singular values is, consequently, obtained by applying regularization independently to the EDMXk submatrices, with 1 ≤ k ≤ 3:

[213] Em uma modalidade diferente, a seguinte fórmula é usada: [213] In a different embodiment, the following formula is used:

[214] Com o uso do método da invenção proposto em um sistema 3D de SAOC, de outra forma, idêntico para o exemplo discutido na seção anterior, a qualidade de saída de áudio da saída decodificada e renderizada é aprimorada. Os sinais resultantes são ilustrados na Figura 6.[214] With the use of the method of the proposed invention in an otherwise identical 3D SAOC system to the example discussed in the previous section, the audio output quality of the decoded and rendered output is improved. The resulting signals are illustrated in Figure 6.

[215] Comparando-se os espectrogramas na coluna direita da Figura 5 e da Figura 6, pode-se observar que o método da invenção soluciona os problemas identificados no sistema de separação paramétrica da técnica anterior existente. O método da invenção garante o recurso “atravessante” do sistema, e, mais importante, as lacunas espectrais são removidas.[215] Comparing the spectrograms in the right column of Figure 5 and Figure 6, it can be seen that the method of the invention solves the problems identified in the existing prior art parametric separation system. The method of the invention guarantees the “through” capability of the system, and, more importantly, spectral gaps are removed.

[216] A solução descrita para processar três grupos independentes de canais de mixagem de redução pode ser facilmente generalizada para qualquer número de grupos.[216] The described solution for processing three independent groups of downmix channels can be easily generalized to any number of groups.

[217] O método da invenção propõe modificar a técnica de separação de objeto paramétrico usando as informações de agrupamento na inversão da matriz de covariância de sinal de mixagem de redução. Isso resulta em aprimoramento significativo da qualidade de saída de áudio.[217] The method of the invention proposes to modify the parametric object separation technique by using the grouping information in the inversion of the reduction mixing signal covariance matrix. This results in significant improvement in audio output quality.

[218] O agrupamento pode ser obtido, por exemplo, a partir de mixagem e/ou informações de correlação já disponíveis no decodificador sem sinalização adicional.[218] Grouping can be obtained, for example, from mixing and/or correlation information already available in the decoder without additional signaling.

[219] Mais precisamente, um grupo é definido em uma modalidade pelo menor conjunto de sinais de mixagem de redução com as seguintes duas propriedades nesse exemplo:[219] More precisely, a group is defined in an embodiment by the smallest set of downmix signals with the following two properties in this example:

[220] • Em primeiro lugar, os objetos de áudio de entrada contidos nesses canais de mixagem de redução não estão conditos em qualquer outro canal de mixagem de redução.[220] • First, the input audio objects contained in these down mix channels are not contained in any other down mix channel.

[221] • Em segundo lugar, todos os sinais de entrada contidos nos canais de mixagem de redução de um grupo não são relacionados (por exemplo, nenhuma intercorrelação é sinalizada dentro do sinal de áudio codificado) a quaisquer sinais de entrada contidos nos canais de mixagem de redução de qualquer outro grupo. Tal uma intercorrelação implica um tratamento combinado dos respectivos objetos de áudio durante a decodificação.[221] • Second, any input signals contained in the down mix channels of a group are unrelated (e.g., no intercorrelation is signaled within the encoded audio signal) to any input signals contained in the down mix channels. reduction mix from any other group. Such an intercorrelation implies a combined treatment of the respective audio objects during decoding.

[222] Com base na definição de grupo introduzida, um número de grupos K (1 < K < Ndmx) pode ser definido: Gk (1 < k < K) e a matriz de covariância de mixagem de redução EDMX pode ser expressa com o uso de uma forma bloco- diagonal aplicando-se um operador de permutação Φ: [222] Based on the introduced group definition, a number of groups K (1 < K < Ndmx) can be defined: Gk (1 < k < K) and the EDMX reduction mixing covariance matrix can be expressed with the use of a block-diagonal form applying a permutation operator Φ:

[223] As submatrizes EDMXk são construídas selecionando-se elementos da matriz de covariância de mixagem de redução correspondentes aos grupos independentes Gk. Para cada grupo Gk, a matriz EDMXk de tamanho Mk vezes Mk é expressa com o uso de SVD como: EDMXk = V k A k V k* [223] The EDMXk submatrices are constructed by selecting elements from the reduction mixing covariance matrix corresponding to the independent groups Gk. For each group Gk, the EDMXk matrix of size Mk times Mk is expressed using SVD as: EDMXk = V k A k V k*

[224] A pseudoinversa da matriz EDMXk é computada como (EDMXk)-1 = V k Ainv k V k* em que a matriz inversa regularizada Ainv k é fornecida em uma modalidade por: [224] The pseudoinverse of the matrix EDMXk is computed as (EDMXk)-1 = V k Ainv k V k* where the regularized inverse matrix Ainv k is given in one embodiment by:

[225] e em uma modalidade diferente por: [225] and in a different modality by:

[226] A escalar de regularização relativa é determinada com o uso de limiar absoluto Treg e valor maximal de Λ como: com Treg = 10-2, por exemplo.[226] The relative regularization scalar is determined using absolute threshold Treg and maximum value of Λ as: with Treg = 10-2, for example.

[227] A inversa da matriz permutada de covariância de mixagem de redução EDMX é obtida como: [227] The inverse of the EDMX reduction mixing covariance permuted matrix is obtained as:

[228] e a inversa da matriz de covariância de mixagem de redução é computada aplicando-se a operação de permutação de inversa: [228] and the inverse of the reduction mixing covariance matrix is computed by applying the inverse permutation operation:

[229] Adicionalmente, o método da invenção propõe, em uma modalidade, determinar os grupos inteiramente com base nas informações contidas no fluxo de bits. Por exemplo, essas informações podem ser fornecidas por informações de mixagem de redução e informações de correlação.[229] Additionally, the method of the invention proposes, in one embodiment, to determine the groups entirely based on the information contained in the bit stream. For example, this information may be provided by reduction mixing information and correlation information.

[230] Mais precisamente, um grupo Gk é definido pelo menor conjunto de canais de mixagem de redução com as seguintes propriedades:[230] More precisely, a Gk group is defined by the smallest set of downmix channels with the following properties:

[231] • Os objetos de áudio de entrada contidos nos canais de mixagem de redução do grupo Gk não estão contidos em qualquer outro canal de mixagem de redução. Um objeto de áudio de entrada não está contido em um canal de mixagem de redução, por exemplo, se o ganho de mixagem de redução correspondente for fornecido pelo menor índice de quantização ou se o mesmo for igual a zero.[231] • Input audio objects contained in Gk group down mix channels are not contained in any other down mix channels. An input audio object is not contained in a down mix channel, for example, if the corresponding down mix gain is provided by the lowest quantization index or if it is equal to zero.

[232] • Todos os sinais de entrada i contidos nos canais de mixagem de redução do grupo Gk não são relacionados a qualquer sinal de entrada j contido em qualquer canal de mixagem de redução de qualquer outro grupo. Por exemplo (comparar, por exemplo, documento no WO 2011/039195 A1), a variável de fluxo de bits bsRelatedTo[i][j] pode ser usada para sinalizar se dois objetos são relacionados (bsRelatedTo[i][j] == 1) ou se os mesmos não são relacionados (bsRelatedTo[i][j] == 0). Ademais, métodos diferentes de sinalizar que dois objetos são relacionados podem ser usados com base nas informações de correlação ou covariância, por exemplo.[232] • All input signals i contained in the reduction mix channels of group Gk are unrelated to any input signal j contained in any reduction mix channels of any other group. For example (compare e.g. document in WO 2011/039195 A1), the bitstream variable bsRelatedTo[i][j] can be used to signal whether two objects are related (bsRelatedTo[i][j] == 1) or if they are not related (bsRelatedTo[i][j] == 0). Furthermore, different methods of signaling that two objects are related can be used based on correlation or covariance information, for example.

[233] Os grupos podem ser determinados uma vez por quadro ou uma vez por conjunto de parâmetros para todas as bandas de processamento, ou uma vez por quadro ou uma vez por conjunto de parâmetros para cada banda de processamento.[233] Groups may be determined once per frame or once per parameter set for all processing bands, or once per frame or once per parameter set for each processing band.

[234] O método da invenção também permite, em uma modalidade, reduzir significativamente a complexidade computacional do sistema de separação paramétrica (por exemplo, decodificador de 3D de SAOC) usando-se as informações de agrupamento nos componentes de processamento paramétrico com maior despesa computacional.[234] The method of the invention also allows, in one embodiment, to significantly reduce the computational complexity of the parametric separation system (e.g., SAOC 3D decoder) by using the grouping information in the parametric processing components with greater computational expense .

[235] Portanto, o método da invenção propõe remover computações que não resultam em qualquer contribuição para a qualidade de áudio de saída final. Essas computações podem ser selecionadas com base nas informações de agrupamento.[235] Therefore, the method of the invention proposes to remove computations that do not result in any contribution to the final output audio quality. These computations can be selected based on the clustering information.

[236] Mais precisamente, o método da invenção propõe computar todas as etapas de processamento paramétrico, independentemente, para cada grupo predeterminado e combinar os resultados no término.[236] More precisely, the method of the invention proposes to compute all parametric processing steps independently for each predetermined group and combine the results at the end.

[237] Com o uso do exemplo de parte de processamento 3D de SAOC de Áudio 3D de MPEG-H, as operações computacionalmente complexas são fornecidas por:[237] Using the example 3D processing part of MPEG-H 3D Audio SAOC, computationally complex operations are provided by:

[238] • computação de matriz de covariância E de tamanho N vezes N com os elementos: [238] • computation of covariance matrix E of size N times N with the elements:

[239] • computação de matriz de covariância de sinal de mixagem de redução Δ de tamanho Ndmx vezes Ndmx: [239] • computation of reduction mixing signal covariance matrix Δ of size Ndmx times Ndmx:

[240] • computação de decomposição de valor singular de matriz [240] • matrix singular value decomposition computation

[241] • computação da aproximação de matriz inversa regularizada [241] • computation of regularized inverse matrix approximation

[242] • computação da matriz de desmixagem paramétrica U de tamanho N vezes Ndmx: [242] • computation of parametric demixing matrix U of size N times Ndmx:

[243] • multiplicação da matriz de renderização R de tamanho Nsaída vezes N com a matriz de desmixagem U de tamanho N vezes Ndmx: RU,[243] • multiplication of the rendering matrix R of size Noutput times N with the demixing matrix U of size N times Ndmx: RU,

[244] computação da matriz de covariância C de tamanho Nsaída vezes Nsaída: [244] computation of covariance matrix C of size Nout times Nout:

[245] • computação da covariância do sinal estimado parametricamente Eynão comprimido(dry) de tamanho Nsaída vezes Nsaída: [245] • computation of the covariance of the parametrically estimated signal Eyuncompressed(dry) of size Noutput times Noutput:

[246] As Diferenças de Nível de Objeto (OLD) se referem à energia relativa de um objeto ao objeto com mais energia por uma determinada banda de tempo e frequência e Coerência Cruzada Entre Objetos (IOC) descreve a quantidade de semelhança, ou correlação cruzada, para dois objetos em uma determinada banda de tempo e frequência.[246] Object Level Differences (OLD) refers to the relative energy of an object to the object with the most energy for a given time and frequency band and Inter-Object Cross Coherence (IOC) describes the amount of similarity, or cross-correlation , for two objects in a given time and frequency band.

[247] O método da invenção propõe reduzir a complexidade computacional computando-se todas as etapas de processamento paramétrico para todos os grupos K predeterminados Gk com 1 < k < K, independentemente, e combinar os resultados no término do processamento de parâmetro.[247] The method of the invention proposes to reduce computational complexity by computing all parametric processing steps for all predetermined K groups Gk with 1 < k < K, independently, and combining the results at the end of parameter processing.

[248] Um grupo Gk contém Mk canais de mixagem de redução e Nk objetos de áudio de entrada de modo que: [248] A group Gk contains Mk reduction mix channels and Nk input audio objects such that:

[249] For cada grupo Gk, um grupo matriz de mixagem de redução é definida como Dk selecionando-se elementos de matriz de mixagem de redução D correspondentes a canais de mixagem de redução e objetos de áudio de entrada contidos pelo grupo Gk.[249] For each Gk group, a reduction mixing matrix group is defined as Dk by selecting reduction mixing matrix elements D corresponding to reduction mixing channels and input audio objects contained by the Gk group.

[250] De modo semelhante, um grupo matriz de renderização Rk é obtido a partir da matriz de renderização R selecionando-se a fileiras correspondentes a objetos de áudio de entrada contidos pelo grupo Gk.[250] Similarly, a rendering matrix group Rk is obtained from the rendering matrix R by selecting the rows corresponding to input audio objects contained by the group Gk.

[251] De modo semelhante, um vetor de grupo OLDk e uma matriz de grupo IOCk são obtidos a partir de vetor OLD e a IOC de matriz selecionando-se os elementos correspondentes a objetos de áudio de entrada contidos pelo grupo Gk.[251] Similarly, an OLDk group vector and an IOCk group matrix are obtained from the OLD vector and the IOC matrix by selecting the elements corresponding to input audio objects contained by the Gk group.

[252] Para cada grupo Gk, as etapas de processamento descritas são substituídas por etapas de processamento menos computacionais conforme o seguinte:[252] For each Gk group, the described processing steps are replaced by less computational processing steps as follows:

[253] • computação de matriz de covariância de grupo Ek de tamanho Nk vezes Nk com os elementos: [253] • computing group covariance matrix Ek of size Nk times Nk with the elements:

[254] • computação de matriz de covariância de mixagem de redução de grupo Δk de tamanho Mk vezes Mk: [254] • computation of group reduction mixing covariance matrix Δk of size Mk times Mk:

[255] • computação de decomposição de valor singular de matriz de covariância de mixagem de redução de grupo [255] • computing singular value decomposition of group reduction mixing covariance matrix

[256] • computação da aproximação de matriz de grupo inversa regularizada [256] • computation of regularized inverse group matrix approximation

[257] • computação do grupo matriz de desmixagem paramétrica Uk de tamanho Nk vezes Mk: [257] • computation of the parametric unmixing matrix group Uk of size Nk times Mk:

[258] • multiplicação da matriz de renderização de grupo Rk de tamanho NMixagem de aumento vezes Nk com a matriz de desmixagem Uk de tamanho Nk vezes Mk: RkUk,[258] • multiplication of the group rendering matrix Rk of size NMixing boost times Nk with the demixing matrix Uk of size Nk times Mk: RkUk,

[259] • computação da matriz de covariância de grupo Ck de tamanho Nsaída vezes Nsaída: [259] • computation of the group covariance matrix Ck of size Nout times Nout:

[260] • computação do covariância de grupo do sinal estimado parametricamente (Eynão comprimido(dry))k de tamanho Nsaída vezes Nsaída: [260] • computation of the group covariance of the parametrically estimated signal (Eyuncompressed(dry))k of size Noutput times Noutput:

[261] E os resultados de etapas de processamento de grupo individuais são combinados no fim:[261] And the results of individual group processing steps are combined at the end:

[262] • a matriz de mixagem de aumento RU de tamanho Nsaída vezes Ndmx é obtida mesclando-se as matrizes de grupo RkUk: [262] • the RU boost mixing matrix of size Nout times Ndmx is obtained by merging the RkUk group matrices:

[263] • a matriz de covariância C de tamanho Nsaída vezes Nsaída é obtida somando-se as matrizes de grupo Ck: [263] • the covariance matrix C of size Noutput times Noutput is obtained by summing the group matrices Ck:

[264] • a covariância do sinal estimado parametricamente Eynão comprimido(dry) de tamanho Nsaída vezes Nsaída é obtida somando-se matrizes de grupo (Eynão comprimido(dry))k : [264] • the covariance of the parametrically estimated signal Eyuncompressed(dry) of size Noutput times Noutput is obtained by summing group matrices (Eyuncompressed(dry))k:

[265] Resumindo-se as etapas de processamento, de acordo com a estrutura do processador de mixagem de redução ilustrado na Figura 3, enquanto omite a etapa de descorrelação, o processamento de parâmetro de quadro da técnica anterior existente pode ser retratado como na Figura 7.[265] Summarizing the processing steps, according to the structure of the reduction mixing processor illustrated in Figure 3, while omitting the decorrelation step, the frame parameter processing of the existing prior art can be depicted as in Figure 7.

[266] Com o uso do método da invenção proposto, a complexidade de computação é reduzida usando-se a detecção de grupo conforme ilustrada na Figura 8.[266] With the use of the proposed invention method, the computation complexity is reduced using group detection as illustrated in Figure 8.

[267] Um exemplo de uma implantação de uma função de detecção de grupo, chamada: [K,Gk]= groupDetect(D,RelatedTo) , é fornecido na Figura 9 com o uso de código ANSI C e a função estática “getSaocCoreGroups()”.[267] An example of an implementation of a group detection function, called: [K,Gk]= groupDetect(D,RelatedTo) , is provided in Figure 9 using ANSI C code and the static function “getSaocCoreGroups( )”.

[268] O método da invenção proposto se mostra, significativamente de modo computacional, muito mais eficaz que realizar as operações sem o agrupamento. O mesmo também permite mais bem alocar e usar a memória, suporta paralelização computacional, reduz acúmulo de erro número, etc.[268] The proposed method of the invention proves, computationally significantly, much more effective than performing the operations without grouping. It also allows better allocation and use of memory, supports computational parallelization, reduces the accumulation of error numbers, etc.

[269] O método da invenção proposto e o aparelho da invenção proposto solucionam um problema existente dos sistemas de separação de objeto paramétrico do estado da técnica e oferecem qualidade de áudio de saída significativamente maior.[269] The proposed method of the invention and the proposed apparatus of the invention solve an existing problem of prior art parametric object separation systems and provide significantly higher output audio quality.

[270] O método da invenção proposto descreve um método de detecção de grupo que é realizado inteiramente com base nas informações de fluxo de bits existentes.[270] The proposed method of the invention describes a group detection method that is performed entirely based on existing bit stream information.

[271] A solução de agrupamento inventivo proposta resulta em uma redução significativa na complexidade computacional. Em general, a decomposição de valor singular é computacionalmente dispendiosa e sua complexidade cresce exponencialmente com o tamanho da matriz a ser invertida: [271] The proposed inventive clustering solution results in a significant reduction in computational complexity. In general, singular value decomposition is computationally expensive and its complexity grows exponentially with the size of the matrix to be inverted:

[272] Para um número grande de canais de mixagem de redução, computer K vezes uma operação de SVD para uma matriz de tamanho menor é computacionalmente muito mais eficaz: [272] For a large number of downmix channels, computer K times an SVD operation for a smaller matrix size is computationally much more efficient:

[273] Com o uso das mesmas considerações, todas as etapas de processamento paramétrico no decodificador podem ser implantadas de modo eficaz computando-se todas as multiplicações de matriz descritas no sistema apenas para os grupos independentes e combinando-se os resultados.[273] Using the same considerations, all parametric processing steps in the decoder can be implemented effectively by computing all matrix multiplications described in the system for the independent groups only and combining the results.

[274] Uma estimativa da redução de complexidade para número diferente de objetos de áudio de entrada, isto é, objetos de áudio de entrada, canais de mixagem de redução e um número fixo de 24 canais de saída é fornecida na seguinte tabela: [274] An estimate of the reduction in complexity for different number of input audio objects, i.e., input audio objects, reduction mix channels, and a fixed number of 24 output channels is provided in the following table:

[275] A invenção apresente as seguintes vantagens adicionais:[275] The invention presents the following additional advantages:

[276] • Para situações em que apenas um grupo pode ser criado, a saída é idêntica a bit com o sistema do estado atual da técnica.[276] • For situations where only one group can be created, the output is bit identical with the current state of the art system.

[277] • O agrupamento presente o recurso “atravessante” do sistema. Isso implica que se um objeto de áudio de entrada for misturado sozinho em um canal de mixagem de redução, o decodificador tem a capacidade para reconstruir o mesmo perfeitamente.[277] • Grouping presents the “through” feature of the system. This implies that if an input audio object is mixed alone in a downmix channel, the decoder has the ability to reconstruct it perfectly.

[278] A invenção resulta nas seguintes modificações exemplificativas propostas para o texto-padrão.[278] The invention results in the following proposed exemplary modifications to the standard text.

[279] Adicionadas em “9.5.4.2.4 Operação inversa regularizada”:[279] Added in “9.5.4.2.4 Regularized inverse operation”:

[280] A aproximação de matriz inversa regularizadaé calculada como [280] The regularized inverse matrix approximation is calculated as

[281] As matrizes V e A são determinadas como a decomposição de valor singular da matriz Δ como: ∆ = V Λ V*[281] The matrices V and A are determined as the singular value decomposition of the matrix Δ as: ∆ = V Λ V*

[282] O inverso regularizado Ainv da matriz de valor singular diagonal A é computado de acordo com 9.5.4.2.5.[282] The regularized inverse Ainv of the diagonal singular value matrix A is computed in accordance with 9.5.4.2.5.

[283] No caso de a matriz Δ ser usada no cálculo da matriz de desmixagem paramétrica U, as operações descritas são aplicadas a todas as submatrizes Δk. Uma submatriz Δk é obtida selecionando-se os elementos Δ (m, n) que correspondem aos canais de mixagem de redução m e n atribuídos ao grupo k.[283] In case the matrix Δ is used in the calculation of the parametric unmixing matrix U, the described operations are applied to all submatrices Δk. A submatrix Δk is obtained by selecting the elements Δ (m, n) that correspond to the reduction mix channels m and n assigned to group k.

[284] O grupo k é definido pelo menor conjunto de canais de mixagem de redução com as seguintes propriedades:[284] Group k is defined by the smallest set of down mix channels with the following properties:

[285] • Os sinais de entrada contidos nos canais de mixagem de redução de grupo k não são contidos em qualquer outro canal de mixagem de redução. Um sinal de entrada não está contido em um canal de mixagem de redução se o ganho de mixagem de redução correspondente for fornecido pelo menor índice de quantização (Tabela 49 do ISO/IEC 23003-2:2010).[285] • Input signals contained in the k-group reduction mix channels are not contained in any other reduction mix channels. An input signal is not contained in a down mix channel if the corresponding down mix gain is provided by the lowest quantization index (Table 49 of ISO/IEC 23003-2:2010).

[286] • Todos os sinais de entrada i contidos nos canais de mixagem de redução do grupo k não são relacionados a qualquer sinal de entrada contido em qualquer canal de mixagem de redução de qualquer outro grupo (isto é, bsRelatedTo[i][j] == 0).[286] • All input signals i contained in the reduction mix channels of group k are unrelated to any input signal contained in any reduction mix channel of any other group (i.e., bsRelatedTo[i][j ] == 0).

[287] Os resultados das operações de inversão regularizada independentes Jk ~Δk são combinados para obter a matriz J.[287] The results of the independent regularized inversion operations Jk ~Δk are combined to obtain the matrix J.

[288] A invenção também resulta nas seguintes modificações exemplificativas propostas para o texto-padrão.[288] The invention also results in the following proposed exemplary modifications to the standard text.

[289] 9.5.4.2.5 Operação inversa regularizada[289] 9.5.4.2.5 Regularized inverse operation

[290] A aproximação de matriz inversa regularizada J J ~ Δ1 é calculada como: [290] The regularized inverse matrix approximation JJ ~ Δ1 is calculated as:

[291] A matrizes V e A são determinadas como a decomposição de valor singular da matriz Δ as: [291] The matrices V and A are determined as the singular value decomposition of the matrix Δ as:

[292] O inverso regularizado Ainv da matriz de valor singular diagonal A é computado de acordo com 9.5.4.2.6.[292] The regularized inverse Ainv of the diagonal singular value matrix A is computed in accordance with 9.5.4.2.6.

[293] No caso de a matriz Δ ser usada no cálculo da matriz de desmixagem paramétrica U , as operações descritas são aplicadas a todas as submatrizes Δd. Uma submatriz Δd de tamanho NgX Ng, com elementos Δ((idx1,idx2), é obtida selecionando-se os elementos Δ(ch1,ch2) correspondentes aos canais de mixagem de redução ch1 e ch2 atribuída ao grupo gq (isto é, gq( idx1)=ch1 e gq(idx2)=ch2).[293] In case the matrix Δ is used in the calculation of the parametric unmixing matrix U , the described operations are applied to all sub-matrices Δd. A submatrix Δd of size Ng ( idx1)=ch1 and gq(idx2)=ch2).

[294] O grupo de gq de tamanho 1X Ngq é definido pelo menor conjunto de canais de mixagem de redução com as seguintes propriedades:[294] The GQ group of size 1X Ngq is defined by the smallest set of down mix channels with the following properties:

[295] • Os sinais de entrada contidos nos canais de mixagem de redução do grupo gq não estão contidos em qualquer outro canal de mixagem de redução. Um sinal de entrada não está contido em um canal de mixagem de redução se o ganho de mixagem de redução correspondente for fornecido pelo menor índice de quantização (Tabela 49 do ISO/IEC 23003-2:2010).[295] • Input signals contained in the GQ Group Reduction Mix channels are not contained in any other Reduction Mix channels. An input signal is not contained in a down mix channel if the corresponding down mix gain is provided by the lowest quantization index (Table 49 of ISO/IEC 23003-2:2010).

[296] • Todos os sinais de entrada i contidos nos canais de mixagem de redução do grupo gq não são relacionadas a qualquer sinal de entrada j contido em qualquer canal de mixagem de redução de qualquer outro grupo (isto é, bsRelatedTo[i][j] == 0).[296] • All input signals i contained in the reduction mix channels of group gq are unrelated to any input signal j contained in any reduction mix channel of any other group (i.e. bsRelatedTo[i][ j] == 0).

[297] Os resultados das operações de inversão regularizada independents Jq Δq são combinados para obter a matriz J como: [297] The results of the independent regularized inversion operations Jq Δq are combined to obtain the matrix J as:

[298] 9.5.4.2.6 Regularização de valores singulares[298] 9.5.4.2.6 Regularization of singular values

[299] A operação de inversa regularizada (.)inv usada para a matriz de valor singular diagonal A é determinada como: [299] The regularized inverse operation (.)inv used for the diagonal singular value matrix A is determined as:

[300] A escalar de regularização relativa é determinada com o uso de limiar absoluto reg e valor maximal de A conforme o seguinte: [300] The relative regularization scalar is determined using absolute threshold reg and maximum value of A as follows:

[301] Em algumas dentre as seguintes Figuras, os sinais individuais são mostrados como obtidos a partir de etapas de processar. Isso é feito para um melhor entendimento da invenção e é uma possibilidade para realizar a invenção, isto é, extrair sinais individuais e realizar etapas de processamento nesses sinais ou sinais processados.[301] In some of the following Figures, individual signals are shown as obtained from processing steps. This is done for a better understanding of the invention and is a possibility for carrying out the invention, i.e. extracting individual signals and carrying out processing steps on these signals or processed signals.

[302] A outra modalidade é calcular todas as matrizes necessárias e aplicar as mesmas como uma última etapa ao sinal de áudio codificado a fim de obter o sinal de áudio decodificado. Isso inclui o calcula das diferentes matrizes e suas respectivas combinações.[302] The other embodiment is to calculate all necessary matrices and apply them as a last step to the encoded audio signal in order to obtain the decoded audio signal. This includes the calculation of different matrices and their respective combinations.

[303] Uma modalidade combina ambas as formas.[303] One modality combines both forms.

[304] A Figura 10 mostra esquematicamente um aparelho 10 para processar uma pluralidade (aqui, nesse exemplo, cinco) de objetos de áudio de entrada 111 a fim de fornecer uma representação dos objetos de áudio de entrada 111 por um sinal de áudio codificado 100.[304] Figure 10 schematically shows an apparatus 10 for processing a plurality (here, in this example, five) of input audio objects 111 to provide a representation of the input audio objects 111 by a coded audio signal 100 .

[305] Os objetos de áudio de entrada 111 são alocados ou submetidos à mixagem de redução em sinais de mixagem de redução 101. Na modalidade mostrada, quatro dentre os cinco objetos de áudio de entrada 111 são atribuídos a dois sinais de mixagem de redução 101. Um objeto de áudio de entrada 111 sozinho é atribuído a um terceiro sinal de mixagem de redução 101. Desse modo, cinco objetos de áudio de entrada 111 são representados por três sinais de mixagem de redução 101.[305] Input audio objects 111 are allocated or downmixed into downmix signals 101. In the shown embodiment, four out of five input audio objects 111 are assigned to two downmix signals 101 A single input audio object 111 is assigned to a third reduction mix signal 101. Thus, five input audio objects 111 are represented by three reduction mix signals 101.

[306] Esses sinais de mixagem de redução 101, após isso, - possivelmente, após algumas dentre as etapas de processamento não mostradas - são combinados ao sinal de áudio codificado 100.[306] These reduction mix signals 101 are then - possibly after some of the processing steps not shown - combined with the encoded audio signal 100.

[307] Tal sinal de áudio codificado 100 é alimentado a um aparelho da invenção 1, para o qual uma modalidade é mostrada na Figura 11.[307] Such coded audio signal 100 is fed to an apparatus of invention 1, for which an embodiment is shown in Figure 11.

[308] A partir do sinal de áudio codificado 100, os três sinais de mixagem de redução 101 (comparar à Figura 10) são extraídos.[308] From the encoded audio signal 100, the three reduction mix signals 101 (compare to Figure 10) are extracted.

[309] Os sinais de mixagem de redução 101 são agrupados - no exemplo mostrado - em dois grupos de sinais de mixagem de redução 102.[309] The reduction mix signals 101 are grouped - in the example shown - into two groups of reduction mix signals 102.

[310] Visto que cada sinal de mixagem de redução 101 é associado a um determinado número de objetos de áudio de entrada, cada grupo de sinais de mixagem de redução 102 se refere a um determinado número de objetos de áudio de entrada (uma expressão correspondente é o objeto de entrada). Dessa forma, cada grupo de sinais de mixagem de redução 102 é associado a um conjunto de objetos de áudio de entrada dentre a pluralidade de objetos de áudio de entrada que são codificados pelo sinal de áudio codificado 100 (comparar à Figura 10).[310] Since each reduction mix signal 101 is associated with a certain number of input audio objects, each group of reduction mix signals 102 refers to a certain number of input audio objects (a corresponding expression is the input object). In this way, each group of downmix signals 102 is associated with a set of input audio objects among the plurality of input audio objects that are encoded by the encoded audio signal 100 (compare to Figure 10).

[311] O agrupamento ocorre na modalidade mostrada sob as seguintes restrições:[311] Grouping occurs in the embodiment shown under the following restrictions:

[312] 1. Cada objeto de áudio de entrada 111 pertence a apenas um conjunto de objetos de áudio de entrada e, desse modo, a um grupo de sinais de mixagem de redução 102.[312] 1. Each input audio object 111 belongs to only one set of input audio objects and thus to one group of downmix signals 102.

[313] 2. Cada objeto de áudio de entrada 111 não tem relação sinalizada no sinal de áudio codificado a um objeto de áudio de entrada 111 que pertence a um conjunto diferente associado a um grupo de sinais de mixagem de redução diferente. Isso significa que o sinal de áudio codificado não tem tais informações que devido ao padrão resultariam em uma computação combinada dos respectivos objetos de áudio de entrada.[313] 2. Each input audio object 111 has no signed relationship in the encoded audio signal to an input audio object 111 that belongs to a different set associated with a different downmix signal group. This means that the encoded audio signal does not have such information that due to the standard would result in a combined computation of the respective input audio objects.

[314] 3. O número de sinais de mixagem de redução 101 dentro os respectivos grupos 102 é minimizado.[314] 3. The number of downmix signals 101 within respective groups 102 is minimized.

[315] Os (aqui: dois) grupos de sinais de mixagem de redução 102 são processados individualmente no seguinte para obter cinco sinais de áudio de saída 103 correspondentes aos cinco objetos de áudio de entrada 111.[315] The (here: two) groups of reduction mix signals 102 are processed individually in the following to obtain five output audio signals 103 corresponding to the five input audio objects 111.

[316] Um grupo de sinais de mixagem de redução 102 que é associado aos dois sinais de mixagem de redução 101 que cobre dois pares de objetos de áudio de entrada 111 (comparar à Figura 10) permite obter quatro sinais de áudio de saída 103.[316] A group of reduction mixing signals 102 that is associated with the two reduction mixing signals 101 that covers two pairs of input audio objects 111 (compare to Figure 10) allows obtaining four output audio signals 103.

[317] O outro grupo de sinais de mixagem de redução 102 resulta em um sinal de saída 103 como o único sinal de mixagem de redução 101 ou esse grupo de sinais de mixagem de redução 102 (ou mais precisamente: grupo de um sinal de sinal de mixagem de redução) se refere a um objeto de áudio de entrada 111 (comparar à Figura 10).[317] The other group of reduction mix signals 102 results in an output signal 103 as the only reduction mix signal 101 or this group of reduction mix signals 102 (or more precisely: group of a signal signal mixdown) refers to an input audio object 111 (compare to Figure 10).

[318] Os cinco sinais de áudio de saída 103 são combinados em um sinal de áudio decodificado 110 como a saída do aparelho 1.[318] The five output audio signals 103 are combined into a decoded audio signal 110 as the output of the device 1.

[319] Na modalidade da Figura 11, todas as etapas de processamento são realizadas individualmente nos grupos de sinais de mixagem de redução 102.[319] In the embodiment of Figure 11, all processing steps are performed individually on the reduction mix signal groups 102.

[320] A modalidade do aparelho 1 mostrada na Figura 12 pode receber, aqui, o mesmo sinal de áudio codificado 100 que o aparelho 1 mostrado na Figura 11 e obtido por um aparelho 10, conforme na Figura 10.[320] The embodiment of the device 1 shown in Figure 12 can receive, here, the same coded audio signal 100 as the device 1 shown in Figure 11 and obtained by a device 10, as in Figure 10.

[321] A partir do sinal de áudio codificado 100, os três sinais de mixagem de redução 101 (para três canais de transporte) são obtidos e agrupados em dois grupos de sinais de mixagem de redução 102. Esses grupos 102 são processados individualmente para obter cinco sinais processados 104 que correspondem aos cinco objetos de áudio de entrada mostrados na Figura 10.[321] From the encoded audio signal 100, the three reduction mixing signals 101 (for three transport channels) are obtained and grouped into two groups of reduction mixing signals 102. These groups 102 are processed individually to obtain five processed signals 104 that correspond to the five input audio objects shown in Figure 10.

[322] Nas seguintes etapas, a partir dos cinco sinais processados 104 em conjunto, oito sinais de áudio de saída 103 são obtidos, por exemplo, renderizados para serem usados para oito canais de saída. Os sinais de áudio de saída 103 são combinados no sinal de áudio decodificado 110 que é a saída do aparelho 1. Nessa modalidade, um processamento individual, bem como processamento conjunto, é realizado nos grupos de os sinais de mixagem de redução 102.[322] In the following steps, from the five processed signals 104 together, eight output audio signals 103 are obtained, for example, rendered to be used for eight output channels. The output audio signals 103 are combined into the decoded audio signal 110 which is the output of the apparatus 1. In this embodiment, individual processing as well as joint processing is performed on the groups of the downmix signals 102.

[323] A Figura 13 mostra algumas etapas de uma modalidade do método da invenção no qual um sinal de áudio codificado é decodificado.[323] Figure 13 shows some steps of an embodiment of the method of the invention in which a coded audio signal is decoded.

[324] Na etapa 200, os sinais de mixagem de redução são extraídos do sinal de áudio codificado. Na seguinte etapa 201, os sinais de mixagem de redução são alocados a grupos de sinais de mixagem de redução.[324] In step 200, the downmix signals are extracted from the encoded audio signal. In the following step 201, the reduction mix signals are allocated to reduction mix signal groups.

[325] Na etapa 202, cada grupo de sinais de mixagem de redução é processado individualmente a fim de fornecer resultados em grupo individuais. O tratamento individual dos grupos compreende pelo menos o desmixador para obter representações dos sinais de áudio que foram combinados por meio da mixagem de redução dos objetos de áudio de entrada no processo de codificação. Em uma modalidade - não mostrada aqui - o processamento individual é seguido por um processamento em conjunto.[325] In step 202, each group of reduction mix signals is processed individually to provide individual group results. The individual processing of the groups comprises at least the demixer to obtain representations of the audio signals that have been combined through downmixing of the input audio objects in the encoding process. In one embodiment - not shown here - individual processing is followed by joint processing.

[326] Na etapa 203, esses resultados em grupo são combinados em um sinal de áudio decodificado para ser a saída.[326] In step 203, these group results are combined into a decoded audio signal to be the output.

[327] A Figura 14 mostra novamente uma modalidade do aparelho 1, na qual todas as etapas de processamento após o agrupamento dos sinais de mixagem de redução 101 do sinal de áudio codificado 100 em grupos de sinais de mixagem de redução 102 são realizadas individualmente. O aparelho 1, que recebe o sinal de áudio codificado 100 com os sinais de mixagem de redução 101, compreende um agrupador 2 que agrupa os sinais de mixagem de redução 101 a fim de fornecer os grupos de sinais de mixagem de redução 102. Os grupos de sinais de mixagem de redução 102 são processados por um processador 3 que realiza todas as etapas necessárias individualmente em cada grupo de sinais de mixagem de redução 102. Os resultados em grupo individuais do processamento dos grupos de sinais de mixagem de redução 102 são sinais de áudio de saída 103 que são combinados pelo combinador 4 a fim de obter o sinal de áudio decodificado 110 a ser emitido pelo aparelho 1.[327] Figure 14 again shows an embodiment of the apparatus 1, in which all processing steps after grouping the reduction mixing signals 101 of the encoded audio signal 100 into groups of reduction mixing signals 102 are performed individually. The apparatus 1, which receives the encoded audio signal 100 with the down mixing signals 101, comprises a grouper 2 that groups the down mixing signals 101 to provide the groups of down mixing signals 102. The groups of reduction mix signals 102 are processed by a processor 3 that performs all necessary steps individually on each group of reduction mix signals 102. The individual group results of processing the groups of reduction mix signals 102 are output audio 103 which are combined by combiner 4 in order to obtain the decoded audio signal 110 to be output by device 1.

[328] O aparelho 1 mostrado na Figura 15 difere da modalidade mostrada na Figura 14 após o agrupamento dos sinais de mixagem de redução 101. No exemplo, nem todas as etapas de processamento são realizadas individualmente nos grupos de sinais de mixagem de redução 102, porém, algumas etapas são realizadas em conjunto, desse modo, levam mais que um grupo de sinais de mixagem de redução 102 em consideração.[328] The apparatus 1 shown in Figure 15 differs from the embodiment shown in Figure 14 after grouping the reduction mix signals 101. In the example, not all processing steps are performed individually on the groups of reduction mix signals 102, however, some steps are performed together, thus taking more than one group of reduction mix signals 102 into consideration.

[329] Devido a isso, o processador 3 nessa modalidade é configurado para realizar apenas parte ou pelo menos uma etapa de processamento individual. O resultado do processamento são sinais processados 104 que são processados em conjunto pelo pós-processador 5. Os sinais de áudio de saída obtidos 103 são finalmente combinados pelo combinador 4 que resulta no sinal de áudio decodificado 110.[329] Because of this, the processor 3 in this embodiment is configured to perform only part or at least one individual processing step. The result of the processing are processed signals 104 which are processed together by post-processor 5. The obtained output audio signals 103 are finally combined by combiner 4 which results in decoded audio signal 110.

[330] Na Figura 16, é mostrado esquematicamente um processador 3 que recebe os grupos de sinais de mixagem de redução 102 e fornece os sinais de áudio de saída 103.[330] In Figure 16, a processor 3 is schematically shown that receives the groups of reduction mixing signals 102 and provides the output audio signals 103.

[331] O processador 3 compreende um desmixador 300 configurado para desmixar os sinais de mixagem de redução 101 dos respectivos grupos de sinais de mixagem de redução 102. O desmixador 300, desse modo, reconstrói os objetos de áudio de entrada individuais que foram combinados pelo codificador nos respectivos sinais de mixagem de redução 101.[331] Processor 3 comprises a demixer 300 configured to demix the down mix signals 101 from respective groups of down mix signals 102. The demixer 300 thereby reconstructs the individual input audio objects that have been combined by the encoder into the respective reduction mix signals 101.

[332] Os objetos de áudio de entrada reconstruídos ou separados são submetidos a um renderizador 302. O renderizador 302 é configurado para renderizar os sinais de mixagem de redução desmixados dos respectivos grupos para uma situação de saída do dito sinal de áudio decodificado 110 a fim de fornecer sinais renderizados 112. Os sinais renderizados 112, desse modo, são adaptados ao tipo de situação de repetição do sinal de áudio decodificado. A renderização depende, por exemplo, do número de alto-falantes a serem usados, das suas disposições ou do tipo de efeitos a serem obtidos na reprodução do sinal de áudio decodificado.[332] The reconstructed or separated input audio objects are submitted to a renderer 302. The renderer 302 is configured to render the demixed downmix signals of the respective groups to an output situation of said decoded audio signal 110 in order to of providing rendered signals 112. The rendered signals 112 are thus adapted to the type of repetition situation of the decoded audio signal. The rendering depends, for example, on the number of speakers to be used, their arrangement or the type of effects to be obtained when reproducing the decoded audio signal.

[333] Os sinais renderizados 112, Ynão comprimido(dry), ademais, são submetidos a um pós-mixador 303 configurado para realizar pelo menos uma etapa de descorrelação nos ditos sinais renderizados 112 e configurado para combinar os resultados Ycomprimido(wet) da etapa de descorrelação realizada com os ditos respectivos sinais renderizados 112, Ynão comprimido(dry). O pós-mixador 303, desse modo, realiza etapas para descorrelacionar os sinais que foram combinados em um sinal de mixagem de redução.[333] The rendered signals 112, Yuncompressed(dry), furthermore, are submitted to a post-mixer 303 configured to perform at least one decorrelation step on said rendered signals 112 and configured to combine the Ycompressed(wet) results of the step decorrelation performed with said respective rendered signals 112, Yuncompressed(dry). The post mixer 303 thereby takes steps to decorrelate the signals that have been combined into a down mix signal.

[334] Os sinais resultantes de áudio de saída 103 são finalmente submetidos a um combinador, conforme mostrado acima.[334] The resulting output audio signals 103 are finally submitted to a combiner as shown above.

[335] Para as etapas, o processador 3 depende de uma calculadora 301 que aqui é separada das diferentes unidades do processador 3, porém, é em uma modalidade alternativa - não mostrada - um recurso do agrupador 300, do renderizador 302 e do pós-mixador 303, respectivamente.[335] For the steps, the processor 3 depends on a calculator 301 which here is separate from the different units of the processor 3, however, it is in an alternative embodiment - not shown - a resource of the grouper 300, the renderer 302 and the post- mixer 303, respectively.

[336] É relevante o fato de que as matrizes, os valores etc. necessários são calculados individualmente para os respectivos grupos de sinais de mixagem de redução 102. Isso implica, por exemplo, que as matrizes a serem computadas são menores que as matrizes usadas no estado da técnica. As matrizes têm tamanhos que dependem de um número de objetos de áudio de entrada do respectivo conjunto de objetos de áudio de entrada associados aos grupos de sinais de mixagem de redução e/ou de um número de sinais de mixagem de redução que pertencem ao respectivo grupo de sinais de mixagem de redução.[336] It is relevant that matrices, values, etc. required are calculated individually for the respective groups of reduction mixing signals 102. This implies, for example, that the matrices to be computed are smaller than the matrices used in the prior art. The matrices have sizes that depend on a number of input audio objects from the respective set of input audio objects associated with the down mix signal groups and/or a number of down mix signals that belong to the respective group of reduction mix signals.

[337] No estado da técnica, a matriz a ser usada para a desmixagem tem um tamanho do número de objetos de áudio de entrada ou sinais de áudio de entrada vezes esse número. A invenção permite computar uma matriz menor com um tamanho que depende do número de sinais de áudio de entrada que pertencem ao respectivo grupo de sinais de mixagem de redução.[337] In the prior art, the matrix to be used for demixing has a size of the number of input audio objects or input audio signals times that number. The invention allows computing a smaller matrix with a size that depends on the number of input audio signals that belong to the respective group of downmix signals.

[338] Na Figura 17, o propósito da renderização é explicado.[338] In Figure 17, the purpose of rendering is explained.

[339] O aparelho 1 recebe um sinal de áudio codificado 100 e decodifica o mesmo fornecendo um sinal de áudio decodificado 110.[339] Apparatus 1 receives a coded audio signal 100 and decodes it providing a decoded audio signal 110.

[340] Esse sinal de áudio decodificado 110 é reproduzido em uma situação de saída específica ou saída situação 400. O sinal de áudio decodificado 110 deve, no exemplo, ser emitido por cinco alto-falantes 401: Esquerdo, Direito, Central, Surround esquerdo e Surround direito. O ouvinte 402 está no meio dessa situação 400 voltado para o alto-falante central.[340] This decoded audio signal 110 is played back in a specific output situation or output situation 400. The decoded audio signal 110 should, in the example, be output from five speakers 401: Left, Right, Center, Surround Left and Surround right. The listener 402 is in the middle of this situation 400 facing the center speaker.

[341] O renderizador no aparelho 1 distribui os sinais de áudio reconstruídos a serem entregues aos alto-falantes individuais 401 e, desse modo, distribuir uma representação reconstruída dos objetos de áudio originais como fontes dos sinais de áudio na determinada situação de saída 400.[341] The renderer in apparatus 1 distributes the reconstructed audio signals to be delivered to individual speakers 401 and thereby distributes a reconstructed representation of the original audio objects as sources of the audio signals in the given output situation 400.

[342] A renderização, dessa forma, dependo do tipo de situação de saída 400 e das preferências do ouvinte 402.[342] Rendering thus depends on the type of output situation 400 and the preferences of the listener 402.

[343] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa do método ou a um recurso de uma etapa do método. De modo análogo, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item correspondente ou um recurso de um aparelho correspondente. Parte ou todas as etapas do método podem ser executadas por (ou com o uso de) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, uma ou mais dentre as etapas de método mais importantes podem ser executadas por tal aparelho.[343] Although some aspects have been described in the context of an apparatus, it is clear that these aspects also represent a description of the corresponding method, where a block or device corresponds to a method step or a feature of a method step. Similarly, aspects described in the context of a method step also represent a description of a corresponding block or item or a resource of a corresponding apparatus. Part or all of the steps of the method may be performed by (or with the use of) a hardware device, such as, for example, a microprocessor, a programmable computer, or an electronic circuit. In some embodiments, one or more of the most important method steps may be performed by such an apparatus.

[344] Dependendo de determinadas exigências de implantação, as modalidades da invenção podem ser implantadas em hardware ou em software ou pelo menos parcialmente em hardware ou pelo menos parcialmente em software. A implantação pode ser realizada com o uso de um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória Flash, que tem sinais de controle eletronicamente legíveis armazenados no mesmo, que cooperam (ou têm capacidade para cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legível por computador.[344] Depending on certain implementation requirements, embodiments of the invention may be implemented in hardware or in software or at least partially in hardware or at least partially in software. Implantation can be performed using a digital storage medium, for example, a floppy disk, a DVD, a Blu-Ray, a CD, a ROM, a PROM, an EPROM, an EEPROM or a Flash memory, which has electronically readable control signals stored therein, which cooperate (or have the ability to cooperate) with a programmable computer system, so that the respective method is carried out. Therefore, the digital storage medium can be computer readable.

[345] Algumas modalidades, de acordo com a invenção, compreendem uma portadora de dados que tem sinais de controle eletronicamente legíveis, que têm capacidade para cooperar com um sistema de computador programável, de modo que um dentre os métodos descritos no presente documento seja realizado.[345] Some embodiments, in accordance with the invention, comprise a data carrier having electronically readable control signals, which are capable of cooperating with a programmable computer system, so that one of the methods described herein is performed .

[346] De modo geral, as modalidades da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, sendo que o código de programa é operacional para realizar um dentre os métodos quando o produto de programa de computador for executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível por máquina.[346] Generally, embodiments of the present invention may be implemented as a computer program product with a program code, the program code being operative to perform one of the methods when the computer program product is run on a computer. Program code can, for example, be stored on a machine-readable carrier.

[347] Outras modalidades compreendem o programa de computador para realizar um dentre os métodos descritos no presente documento, armazenado em uma portadora legível por máquina.[347] Other embodiments comprise the computer program for carrying out one of the methods described herein, stored on a machine-readable carrier.

[348] Em outras palavras, uma modalidade do método da invenção é, portanto, um programa de computador que tem um código de programa para realizar um dentre os métodos descritos no presente documento, quando o programa de computador for executado em um computador.[348] In other words, an embodiment of the method of the invention is therefore a computer program that has a program code to perform one of the methods described herein, when the computer program is executed on a computer.

[349] Uma modalidade adicional dos métodos da invenção é, portanto, uma portadora de dados (ou um meio de armazenamento digital, ou um meio legível por computador) que compreende, gravado na mesma, o programa de computador para realizar um dentre os métodos descritos no presente documento. A portadora de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.[349] A further embodiment of the methods of the invention is therefore a data carrier (or a digital storage medium, or a computer readable medium) comprising, recorded thereon, the computer program for carrying out one of the methods described in this document. The data carrier, digital storage medium, or recorded medium is typically tangible and/or non-transitory.

[350] Uma modalidade adicional do método da invenção é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dentre os métodos descritos no presente documento. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.[350] A further embodiment of the method of the invention is, therefore, a data stream or a sequence of signals that represents the computer program for carrying out one of the methods described herein. The data stream or signal sequence may, for example, be configured to be transferred via a data communication connection, for example via the Internet.

[351] Uma modalidade adicional compreende meios de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado ou adaptado para realizar um dentre os métodos descritos no presente documento.[351] An additional embodiment comprises processing means, for example, a computer or a programmable logic device, configured or adapted to perform one of the methods described herein.

[352] Uma modalidade adicional compreende um computador que tem instalado no mesmo o programa de computador para realizar um dentre os métodos descritos no presente documento.[352] An additional embodiment comprises a computer that has installed on it the computer program to perform one of the methods described in this document.

[353] Uma modalidade adicional de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, de maneira eletrônica ou óptica) um programa de computador para realizar um dentre os métodos descritos no presente documento a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhantes. O aparelho ou sistema pode compreender, por exemplo, um servidor de arquivo para transferir o programa de computador ao receptor.[353] A further embodiment according to the invention comprises an apparatus or system configured to transfer (e.g., electronically or optically) a computer program for carrying out one of the methods described herein to a receiver. The receiver may, for example, be a computer, a mobile device, a memory device or the like. The apparatus or system may comprise, for example, a file server for transferring the computer program to the receiver.

[354] Em algumas modalidades, um dispositivo de lógica programável (por exemplo, um arranjo de portas programável em campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, um arranjo de porta programável em campo pode cooperar com um microprocessador a fim de realizar um dentre os métodos descritos no presente documento. De modo geral, os métodos são realizados, de preferência, por qualquer aparelho de hardware.[354] In some embodiments, a programmable logic device (e.g., a field-programmable gate array) may be used to realize some or all of the functionality of the methods described herein. In some embodiments, a field programmable gate array may cooperate with a microprocessor to perform one of the methods described herein. In general, the methods are preferably carried out by any hardware device.

[355] O aparelho descrito no presente documento pode ser implantado com o uso de um aparelho de hardware, ou com o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.[355] The apparatus described herein can be implanted with the use of a hardware apparatus, or with the use of a computer, or with the use of a combination of a hardware apparatus and a computer.

[356] Os métodos descritos no presente documento podem ser realizados com o uso de um aparelho de hardware, ou com o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.[356] The methods described herein can be carried out with the use of a hardware apparatus, or with the use of a computer, or with the use of a combination of a hardware apparatus and a computer.

[357] REFERÊNCIAS[357] REFERENCES

[358] [BCC] C. Faller e F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications”, IEEE Trans. on Speech and Audio Proc., volume 11, no 6, novembro de 2003.[358] [BCC] C. Faller and F. Baumgarte, “Binaural Cue Coding - Part II: Schemes and applications,” IEEE Trans. on Speech and Audio Proc., volume 11, no 6, November 2003.

[359] [ISS1] M. Parvaix e L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010.[359] [ISS1] M. Parvaix and L. Girin: “Informed Source Separation of underdetermined instantaneous Stereo Mixtures using Source Index Embedding”, IEEE ICASSP, 2010.

[360] [ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010.[360] [ISS2] M. Parvaix, L. Girin, J.-M. Brossier: “A watermarking-based method for informed source separation of audio signals with a single sensor”, IEEE Transactions on Audio, Speech and Language Processing, 2010.

[361] [ISS3] A. Liutkus, J. Pinel, R. Badeau, L. Girin, G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.[361] [ISS3] A. Liutkus, J. Pinel, R. Badeau, L. Girin, G. Richard: “Informed source separation through spectrogram coding and data embedding”, Signal Processing Journal, 2011.

[362] [ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.[362] [ISS4] A. Ozerov, A. Liutkus, R. Badeau, G. Richard: “Informed source separation: source coding meets source separation”, IEEE Workshop on Applications of Signal Processing to Audio and Acoustics, 2011.

[363] [ISS5] S. Zhang e L. Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.[363] [ISS5] S. Zhang and L. Girin: “An Informed Source Separation System for Speech Signals”, INTERSPEECH, 2011.

[364] [ISS6] L. Girin e J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011.[364] [ISS6] L. Girin and J. Pinel: “Informed Audio Source Separation from Compressed Linear Stereo Mixtures”, AES 42nd International Conference: Semantic Audio, 2011.

[365] [JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Paris, 2006.[365] [JSC] C. Faller, “Parametric Joint-Coding of Audio Sources”, 120th AES Convention, Paris, 2006.

[366] [SAOC] ISO/IEC, “MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC)”, ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.[366] [SAOC] ISO/IEC, “MPEG audio technologies - Part 2: Spatial Audio Object Coding (SAOC)”, ISO/IEC JTC1/SC29/WG11 (MPEG) International Standard 23003-2.

[367] [SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: “From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio”, 22nd Regional UK AES Conference, Cambridge, GB, abril de 2007.[367] [SAOC1] J. Herre, S. Disch, J. Hilpert, O. Hellmuth: “From SAC To SAOC - Recent Developments in Parametric Coding of Spatial Audio”, 22nd Regional UK AES Conference, Cambridge, GB, April 2007.

[368] [SAOC2] J. Engdegârd, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Holzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers e W. Oomen: “Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding”, 124th AES Convention, Amsterdã, 2008.[368] [SAOC2] J. Engdegârd, B. Resch, C. Falch, O. Hellmuth, J. Hilpert, A. Holzer, L. Terentiev, J. Breebaart, J. Koppens, E. Schuijers and W. Oomen: “Spatial Audio Object Coding (SAOC) - The Upcoming MPEG Standard on Parametric Object Based Audio Coding”, 124th AES Convention, Amsterdam, 2008.

[369] [SAOC3D] ISO/IEC, JTC1/SC29/WG11 N14747, Text of ISO/MPEG 23008-3/DIS 3D Audio, Sapporo, julho de 2014.[369] [SAOC3D] ISO/IEC, JTC1/SC29/WG11 N14747, Text of ISO/MPEG 23008-3/DIS 3D Audio, Sapporo, July 2014.

[370] [SAOC3D2] J. Herre, J. Hilpert, A. Kuntz, and J. Plogsties, “MPEG-H Audio - The new standard for universal spatial / 3D audio coding”, 137th AES Convention, Los Angeles, 2011.[370] [SAOC3D2] J. Herre, J. Hilpert, A. Kuntz, and J. Plogsties, “MPEG-H Audio - The new standard for universal spatial / 3D audio coding”, 137th AES Convention, Los Angeles, 2011.

Claims (22)

1. Aparelho (1) para processar um sinal de áudio codificado (100) que compreende uma pluralidade de sinais de mixagem de redução (101) associados a uma pluralidade de objetos de áudio de entrada (111) e parâmetros de objeto (E) caracterizado por compreender: um agrupador (2) configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) em uma pluralidade de grupos de sinais de mixagem de redução (102) associados a um conjunto de objetos de áudio de entrada (111) da dita pluralidade de objetos de áudio de entrada (111), um processador (3) configurado para realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (111) a fim de fornecer resultados em grupo (103, 104), e um combinador (4) configurado para combinar os ditos resultados em grupo (103, 104) ou resultados em grupo processados a fim de fornecer um sinal de áudio decodificado (110), em que o dito agrupador (2) é configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) de modo que cada objeto de áudio de entrada (111) dentre a dita pluralidade de objetos de áudio de entrada (111) pertença a apenas um conjunto de objetos de áudio de entrada (111).1. Apparatus (1) for processing a coded audio signal (100) comprising a plurality of reduction mixing signals (101) associated with a plurality of input audio objects (111) and characterized object parameters (E) comprising: a grouper (2) configured to group said plurality of reduction mixing signals (101) into a plurality of groups of reduction mixing signals (102) associated with a set of input audio objects (111) of said plurality of input audio objects (111), a processor (3) configured to perform at least one individual processing step on the object parameters (Ek) of each set of input audio objects (111) in order to providing group results (103, 104), and a combiner (4) configured to combine said group results (103, 104) or processed group results to provide a decoded audio signal (110), wherein the said grouper (2) is configured to group said plurality of down mixing signals (101) into said plurality of groups of down mixing signals (102) so that each input audio object (111) among said plurality of input audio objects (111) belong to only one set of input audio objects (111). 2. Aparelho (1), de acordo com a reivindicação 1, caracterizado por o dito agrupador (2) ser configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) de modo que cada objeto de áudio de entrada (111) de cada conjunto de objetos de áudio de entrada seja isento de uma relação sinalizada no sinal de áudio codificado (100) com outros objetos de áudio de entrada (111) ou tem uma relação sinalizada no sinal de áudio codificado (100) apenas com pelo menos um objeto de áudio de entrada (111) que pertence ao mesmo conjunto de objetos de áudio de entrada (111).2. Apparatus (1) according to claim 1, characterized in that said grouper (2) is configured to group said plurality of downmixing signals (101) into said plurality of groups of downmixing signals ( 102) such that each input audio object (111) of each set of input audio objects is free from a signal relationship in the encoded audio signal (100) with other input audio objects (111) or has a signaled relationship in the encoded audio signal (100) only with at least one input audio object (111) that belongs to the same set of input audio objects (111). 3. Aparelho (1), de acordo com a reivindicação 1 ou 2, caracterizado por o dito agrupador (2) ser configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) enquanto minimiza uma diversidade de sinais de mixagem de redução (101) dentro de cada grupo de sinais de mixagem de redução (102).3. Apparatus (1) according to claim 1 or 2, characterized in that said grouper (2) is configured to group said plurality of reduction mixing signals (101) into said plurality of groups of reduction mixing signals. reduction (102) while minimizing a diversity of reduction mix signals (101) within each group of reduction mix signals (102). 4. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por o dito agrupador (2) ser configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) de modo que apenas um único sinal de mixagem de redução (101) pertença a um grupo de sinais de mixagem de redução (102).4. Apparatus (1) according to any one of claims 1 to 3, characterized in that said grouper (2) is configured to group said plurality of downmix signals (101) into said plurality of groups of downmix signals. reduction mix (102) so that only a single reduction mix signal (101) belongs to a group of reduction mix signals (102). 5. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por o dito agrupador (2) ser configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) com base em informações dentro do dito sinal de áudio codificado (100).5. Apparatus (1) according to any one of claims 1 to 4, characterized in that said grouper (2) is configured to group said plurality of downmix signals (101) into said plurality of groups of downmix signals. downmixing (102) based on information within said encoded audio signal (100). 6. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 5, caracterizado por o dito agrupador (2) ser configurado para agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) aplicando-se pelo menos as seguintes etapas: detectar a possibilidade de um sinal de mixagem de redução (101) ser atribuído a um grupo existente de sinais de mixagem de redução (102); detectar a possibilidade de pelo menos um objeto de áudio de entrada (111) dentre a pluralidade de objetos de áudio de entrada (111) associados ao sinal de mixagem de redução (101) ser parte de um conjunto de objetos de áudio de entrada (111) associados a um grupo existente de sinais de mixagem de redução (102); atribuir o sinal de mixagem de redução (101) a um novo grupo de sinais de mixagem de redução (102) no caso de o sinal de mixagem de redução (101) ser isento de uma atribuição a um grupo existente de sinais de mixagem de redução (102) e no caso de todos os objetos de áudio de entrada (111) dentre a pluralidade de objetos de áudio de entrada associados ao sinal de mixagem de redução (101) serem isentos de uma associação a um grupo existente de sinais de mixagem de redução (102); e combinar o sinal de mixagem de redução (101) com um grupo existente de sinais de mixagem de redução (102) no caso de o sinal de mixagem de redução (101) ser atribuído ao grupo existente de sinais de mixagem de redução (102) ou no caso de pelo menos um objeto de áudio de entrada (111) dentre a pluralidade de objetos de áudio de entrada associados ao sinal de mixagem de redução (101) ser associado ao grupo existente de sinais de mixagem de redução (102).6. Apparatus (1) according to any one of claims 1 to 5, characterized in that said grouper (2) is configured to group said plurality of downmix signals (101) into said plurality of groups of downmix signals. reduction mixing (102) by applying at least the following steps: detecting the possibility of a reduction mixing signal (101) being assigned to an existing group of reduction mixing signals (102); detect the possibility that at least one input audio object (111) among the plurality of input audio objects (111) associated with the downmix signal (101) is part of a set of input audio objects (111 ) associated with an existing group of reduction mix signals (102); assign the reduction mix signal (101) to a new group of reduction mix signals (102) in case the reduction mix signal (101) is exempt from an assignment to an existing group of reduction mix signals (102) and in the event that all input audio objects (111) among the plurality of input audio objects associated with the down mixing signal (101) are exempt from an association with an existing group of down mixing signals (101) reduction (102); and combining the reduction mix signal (101) with an existing group of reduction mix signals (102) in case the reduction mix signal (101) is assigned to the existing group of reduction mix signals (102) or in the event that at least one input audio object (111) among the plurality of input audio objects associated with the down mixing signal (101) is associated with the existing group of down mixing signals (102). 7. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 6, caracterizado por o dito processador (3) ser configurado para realizar várias etapas de processamento individuais nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (111) a fim de fornecer matrizes individuais como resultados em grupo, e em que o dito combinador (4) é configurado para combinar as ditas matrizes individuais.7. Apparatus (1) according to any one of claims 1 to 6, characterized in that said processor (3) is configured to perform several individual processing steps on the object parameters (Ek) of each set of audio objects of input (111) in order to provide individual matrices as group results, and wherein said combiner (4) is configured to combine said individual matrices. 8. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por o dito processador (3) ser configurado para realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (111) a fim de fornecer matrizes individuais, em que o dito aparelho (1) compreende um pós-processador (5) configurado para processar em conjunto parâmetros de objeto a fim de fornecer pelo menos uma matriz geral, e em que o dito combinador (4) é configurado para combinar as ditas matrizes individuais e a dita pelo menos uma matriz geral.8. Apparatus (1) according to any one of claims 1 to 7, characterized in that said processor (3) is configured to perform at least one individual processing step on the object parameters (Ek) of each set of processing objects. input audio (111) in order to provide individual matrices, wherein said apparatus (1) comprises a post-processor (5) configured to jointly process object parameters in order to provide at least one general matrix, and wherein said combiner (4) is configured to combine said individual matrices and said at least one general matrix. 9. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 8, caracterizado por o dito processador (3) compreender uma calculadora (301) configurada para computar, individualmente, para cada grupo de sinais de mixagem de redução (102), matrizes com tamanhos que dependem de pelo menos um dentre uma variedade de objetos de áudio de entrada do conjunto de objetos de áudio de entrada associados ao respectivo grupo de sinais de mixagem de redução (102) e uma diversidade de sinais de mixagem de redução (101) que pertencem ao respectivo grupo de sinais de mixagem de redução (102).9. Apparatus (1), according to any one of claims 1 to 8, characterized in that said processor (3) comprises a calculator (301) configured to compute, individually, for each group of reduction mixing signals (102) , matrices with sizes that depend on at least one of a plurality of input audio objects from the set of input audio objects associated with the respective group of downmix signals (102) and a plurality of downmix signals ( 101) that belong to the respective group of reduction mix signals (102). 10. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 9, caracterizado por o processador (3) ser configurado para computar, para cada grupo de sinais de mixagem de redução, um limiar individual com base em um valor máximo de energia dentro do respectivo grupo de sinais de mixagem de redução (102).10. Apparatus (1), according to any one of claims 1 to 9, characterized in that the processor (3) is configured to compute, for each group of reduction mixing signals, an individual threshold based on a maximum value of energy within the respective group of reduction mix signals (102). 11. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 10, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de mixagem de redução individual (Dk) para cada grupo de sinais de mixagem de redução (102), em que o dito processador (3) é configurado para determinar uma matriz de covariância de grupo individual (Ek) para cada grupo de sinais de mixagem de redução (102), em que o dito processador (3) é configurado para determinar uma matriz de covariância de mixagem de redução de grupo individual (Δk) para cada grupo de sinais de mixagem de redução (102) com base na matriz de mixagem de redução individual (Dk) e na matriz de covariância de grupo individual (Ek), e em que o dito processador (3) é configurado para determinar uma matriz de grupo inversa regularizada individual (Jk) para cada grupo de sinais de mixagem de redução (102).11. Apparatus (1) according to any one of claims 1 to 10, characterized in that said processor (3) is configured to determine an individual reduction mixing matrix (Dk) for each group of reduction mixing signals ( 102), wherein said processor (3) is configured to determine an individual group covariance matrix (Ek) for each group of downmix signals (102), wherein said processor (3) is configured to determine an individual group reduction mixing covariance matrix (Δk) for each group of reduction mixing signals (102) based on the individual reduction mixing matrix (Dk) and the individual group covariance matrix (Ek), and wherein said processor (3) is configured to determine an individual regularized inverse group matrix (Jk) for each group of downmix signals (102). 12. Aparelho (1), de acordo com a reivindicação 11, caracterizado por o dito combinador (4) ser configurado para combinar as matrizes de grupo inversas regularizadas individuais (Jk) para obter uma matriz de grupo inversa regularizada geral (J).12. Apparatus (1) according to claim 11, characterized in that said combiner (4) is configured to combine individual regularized inverse group matrices (Jk) to obtain an overall regularized inverse group matrix (J). 13. Aparelho (1), de acordo com a reivindicação 11 ou 12, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de desmixagem paramétrica de grupo individual (Uk) para cada grupo de sinais de mixagem de redução (102) com base na matriz de mixagem de redução individual (Dk), na matriz de covariância de grupo individual (Ek) e na matriz de grupo inversa regularizada individual (Jk), e em que o dito combinador (4) é configurado para combinar a uma matriz de desmixagem paramétrica de grupo individual (Uk) para obter uma matriz de desmixagem paramétrica de grupo geral (U).13. Apparatus (1) according to claim 11 or 12, characterized in that said processor (3) is configured to determine an individual group parametric demix matrix (Uk) for each group of downmix signals (102 ) based on the individual reduction mixing matrix (Dk), the individual group covariance matrix (Ek) and the individual regularized inverse group matrix (Jk), and wherein said combiner (4) is configured to combine the an individual group parametric unmixing matrix (Uk) to obtain an overall group parametric unmixing matrix (U). 14. Aparelho (1), de acordo com a reivindicação 13, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de desmixagem paramétrica de grupo individual (Uk) para cada grupo de sinais de mixagem de redução (102) com base na matriz de mixagem de redução individual (Dk), na matriz de covariância de grupo individual (Ek) e na matriz de grupo inversa regularizada individual (Jk), e em que o dito combinador (4) é configurado para combinar a matriz de desmixagem paramétrica de grupo individual (Uk) para obter uma matriz de desmixagem paramétrica de grupo geral (U).14. Apparatus (1) according to claim 13, characterized in that said processor (3) is configured to determine an individual group parametric demix matrix (Uk) for each group of downmix signals (102) with based on the individual reduction mixing matrix (Dk), the individual group covariance matrix (Ek) and the individual regularized inverse group matrix (Jk), and wherein said combiner (4) is configured to combine the individual group parametric unmixing (Uk) to obtain an overall group parametric unmixing matrix (U). 15. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 14, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de renderização de grupo individual (Rk) para cada grupo de sinais de mixagem de redução (102).15. Apparatus (1) according to any one of claims 1 to 14, characterized in that said processor (3) is configured to determine an individual group rendering matrix (Rk) for each group of downmix signals ( 102). 16. Aparelho (1), de acordo com a reivindicação 15, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de mixagem de aumento individual (RkUk) para cada grupo de sinais de mixagem de redução (102) com base na matriz de renderização de grupo individual (Rk) e na matriz de desmixagem paramétrica de grupo individual (Uk), e em que o dito combinador (4) é configurado para combinar as matrizes de mixagem de aumento individuais (RkUk) para obter uma matriz de mixagem de aumento geral (RU).16. Apparatus (1) according to claim 15, characterized in that said processor (3) is configured to determine an individual upmixing matrix (RkUk) for each group of downmixing signals (102) based in the individual group render matrix (Rk) and the individual group parametric demix matrix (Uk), and wherein said combiner (4) is configured to combine the individual boost mixing matrices (RkUk) to obtain a matrix of general boost mixing (RU). 17. Aparelho (1), de acordo com a reivindicação 15 ou 16, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de covariância de grupo individual (Ck) para cada grupo de sinais de mixagem de redução (102) com base na matriz de renderização de grupo individual (Rk) e na matriz de covariância de grupo individual (Ek), e em que o dito combinador (4) é configurado para combinar as matrizes de covariância de grupo individuais (Ck) para obter uma matriz de covariância de grupo geral (C).17. Apparatus (1) according to claim 15 or 16, characterized in that said processor (3) is configured to determine an individual group covariance matrix (Ck) for each group of downmix signals (102) based on the individual group rendering matrix (Rk) and the individual group covariance matrix (Ek), and wherein said combiner (4) is configured to combine the individual group covariance matrices (Ck) to obtain a overall group covariance matrix (C). 18. Aparelho (1), de acordo com qualquer uma das reivindicações 15 a 17, caracterizado por o dito processador (3) ser configurado para determinar uma matriz de covariância de grupo individual do sinal estimado parametricamente (Eynão comprimido(dry))k com base na matriz de renderização de grupo individual (Rk), na matriz de desmixagem paramétrica de grupo individual (Uk), na matriz de mixagem de redução individual (Dk) e na matriz de covariância de grupo individual (Ek), e em que o dito combinador (4) é configurado para combinar as matrizes de covariância de grupo individuais do sinal estimado parametricamente (Eynão comprimido(dry))k para obter um sinal estimado parametricamente geral Eynão comprimido(dry) .18. Apparatus (1) according to any one of claims 15 to 17, characterized in that said processor (3) is configured to determine an individual group covariance matrix of the parametrically estimated signal (Eyuncompressed(dry))k with based on the individual group rendering matrix (Rk), the individual group parametric unmixing matrix (Uk), the individual reduction mixing matrix (Dk), and the individual group covariance matrix (Ek), and where the said combiner (4) is configured to combine the individual group covariance matrices of the parametrically estimated signal (Eyuncompressed(dry))k to obtain a general parametrically estimated signal Eyuncompressed(dry) . 19. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 18, caracterizado por o dito processador (3) ser configurado para determinar uma matriz inversa regularizada (J) com base em uma decomposição de valor singular de uma matriz de covariância de mixagem de redução (EDMX).19. Apparatus (1), according to any one of claims 1 to 18, characterized in that said processor (3) is configured to determine a regularized inverse matrix (J) based on a singular value decomposition of a covariance matrix reduction mixer (EDMX). 20. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 19, caracterizado por o dito processador (3) ser configurado para determinar, para uma determinação de uma matriz de desmixagem paramétrica (U), a submatriz (Δk), selecionando-se elementos (Δ (m, n)) correspondentes aos sinais de mixagem de redução (m, n) atribuídos ao respectivo grupo (k) de sinais de mixagem de redução (102).20. Apparatus (1), according to any one of claims 1 to 19, characterized in that said processor (3) is configured to determine, for a determination of a parametric demixing matrix (U), the submatrix (Δk), selecting elements (Δ (m, n)) corresponding to the reduction mixing signals (m, n) assigned to the respective group (k) of reduction mixing signals (102). 21. Aparelho (1), de acordo com qualquer uma das reivindicações 1 a 20, caracterizado por o dito combinador (4) ser configurado para determinar uma matriz pós-mixagem (P) com base nas matrizes determinadas individualmente para cada grupo de sinais de mixagem de redução (102), e em que o dito combinador (4) é configurado para aplicar a matriz de pós-mixagem (P) à pluralidade de sinais de mixagem de redução (101) a fim de obter o sinal de áudio decodificado (110).21. Apparatus (1) according to any one of claims 1 to 20, characterized in that said combiner (4) is configured to determine a post-mix matrix (P) based on matrices determined individually for each group of input signals. down mixing (102), and wherein said combiner (4) is configured to apply the post-mix matrix (P) to the plurality of down mixing signals (101) in order to obtain the decoded audio signal ( 110). 22. Método (1) para processar um sinal de áudio codificado (100) que compreende uma pluralidade de sinais de mixagem de redução (101) associados a uma pluralidade de objetos de áudio de entrada (111) e parâmetros de objeto (E), sendo que o dito método é caracterizado por compreender: agrupar sinais de mixagem de redução (101) em uma pluralidade de grupos de sinais de mixagem de redução (102) associados a um conjunto de objetos de áudio de entrada (111) dentre a dita pluralidade de objetos de áudio de entrada (111), realizar pelo menos uma etapa de processamento individual nos parâmetros de objeto (Ek) de cada conjunto de objetos de áudio de entrada (111) a fim de fornecer resultados em grupo (103, 104), e combinar os ditos resultados em grupo (103, 104) a fim de fornecer um sinal de áudio decodificado (110), em que agrupar a dita pluralidade de sinais de mixagem de redução (101) na dita pluralidade de grupos de sinais de mixagem de redução (102) de modo que cada objeto de áudio de entrada (111) dentre a dita pluralidade de objetos de áudio de entrada (111) pertença a apenas um conjunto de objetos de áudio de entrada (111).22. Method (1) for processing a coded audio signal (100) comprising a plurality of downmix signals (101) associated with a plurality of input audio objects (111) and object parameters (E), said method being characterized by comprising: grouping reduction mixing signals (101) into a plurality of groups of reduction mixing signals (102) associated with a set of input audio objects (111) among said plurality of input audio objects (111), perform at least one individual processing step on the object parameters (Ek) of each set of input audio objects (111) in order to provide group results (103, 104), and combining said group results (103, 104) to provide a decoded audio signal (110), wherein grouping said plurality of down mixing signals (101) into said plurality of groups of down mixing signals (101) reduction (102) so that each input audio object (111) among said plurality of input audio objects (111) belongs to only one set of input audio objects (111).
BR112017015930-9A 2015-02-02 2016-02-01 APPARATUS AND METHOD FOR PROCESSING A CODED AUDIO SIGNAL BR112017015930B1 (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15153486.4 2015-02-02
EP15153486 2015-02-02
PCT/EP2016/052037 WO2016124524A1 (en) 2015-02-02 2016-02-01 Apparatus and method for processing an encoded audio signal

Publications (2)

Publication Number Publication Date
BR112017015930A2 BR112017015930A2 (en) 2018-03-27
BR112017015930B1 true BR112017015930B1 (en) 2023-09-19

Family

ID=

Similar Documents

Publication Publication Date Title
US10136237B2 (en) Parametric stereo upmix apparatus, a parametric stereo decoder, a parametric stereo downmix apparatus, a parametric stereo encoder
EP2483887B1 (en) Mpeg-saoc audio signal decoder, method for providing an upmix signal representation using mpeg-saoc decoding and computer program using a time/frequency-dependent common inter-object-correlation parameter value
BRPI1005299B1 (en) apparatus and method to perform the upmmix on a downmix audio signal
TWI517141B (en) Encoder, decoder, residual signal generator, system for encoding, method for decoding, method for generating residual signals, and related computer-readable medium and computer program
BR112015002228B1 (en) DECODER AND METHOD FOR A PARAMETRIC CONCEPT OF SPATIAL AUDIO OBJECT ENCODING GENERALIZED FOR MULTI-CHANNEL DOWNMIX/UPMIX BOXES
KR20140123015A (en) Encoder and encoding method for multi-channel signal, and decoder and decoding method for multi-channel signal
US11004455B2 (en) Apparatus and method for processing an encoded audio signal
BR112017015930B1 (en) APPARATUS AND METHOD FOR PROCESSING A CODED AUDIO SIGNAL
TWI843389B (en) Audio encoder, downmix signal generating method, and non-transitory storage unit
US20230335142A1 (en) Processing parametrically coded audio
BR112016001141B1 (en) AUDIO ENCODER, AUDIO DECODER, AND METHODS USING JOINT-ENCODIFIED RESIDUAL SIGNALS