BR112012009127B1 - Mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção - Google Patents

Mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção Download PDF

Info

Publication number
BR112012009127B1
BR112012009127B1 BR112012009127-1A BR112012009127A BR112012009127B1 BR 112012009127 B1 BR112012009127 B1 BR 112012009127B1 BR 112012009127 A BR112012009127 A BR 112012009127A BR 112012009127 B1 BR112012009127 B1 BR 112012009127B1
Authority
BR
Brazil
Prior art keywords
distortion
representation
audio
parameters
information
Prior art date
Application number
BR112012009127-1A
Other languages
English (en)
Other versions
BR112012009127A2 (pt
Inventor
Heiko Purnhagen
Leon Terentiv
Cornelia FALCH
Oliver Hellmuth
Jonas Engdegard
Juergen Herre
Original Assignee
Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Dolby International Ab.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V., Dolby International Ab. filed Critical Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V.
Priority claimed from PCT/EP2010/065671 external-priority patent/WO2011048067A1/en
Publication of BR112012009127A2 publication Critical patent/BR112012009127A2/pt
Publication of BR112012009127B1 publication Critical patent/BR112012009127B1/pt

Links

Images

Landscapes

  • Stereophonic System (AREA)

Abstract

mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção um mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluídas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação, compreende um limitador de distorção configurado para ajustar os parâmetros upmix usando um esquema de controle de distorção para evitar ou limitar as distorções audíveis que são causadas por uma escolha inadequada dos parâmetros de prestação. o limitador de distorção é configurado para obter um parâmetro de controle de limitação de distorção, que é incluido na representação de corrente de bit do conteúdo de áudio, e para ajustar um esquema de controle de distorção em dependência do parâmetro de controle de limitação de distorção.

Description

Campo Técnico
As realizações de acordo com a invenção são relacionadas a um mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix e uma 10 informação paramétrica relacionada ao objeto, que são incluídas em uma representação de corrente de bit de um conteúdo de áudio, e uma informação de prestação.
Outra realização de acordo com a invenção é relacionada a um mecanismo para fornecer uma corrente de bit 15 representando um sinal de áudio multicanal.
Outra realização de acordo com a invenção é relacionada a um método para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluídas em 20 uma representação de corrente de bit do conteúdo de áudio, e uma informação de prestação.
Outra realização de acordo com a invenção é relacionada a um método para fornecer uma corrente de bit representando um sinal de áudio multicanal.
Outra realização de acordo com a invenção é relacionada a um programa de computador implantando um dos métodos. Outra realização de acordo com a invenção é relacionada a uma corrente de bit representando um sinal de áudio multicanal.
Histórico da Invenção
Na técnica de processamento de áudio, transmissão de áudio e armazenamento de áudio, existe um desejo crescente de manusear conteúdos multicanais com a finalidade de melhorar a impressão de audição. A utilização do conteúdo de áudio multicanal provoca melhorias significativas para o usuário. Por exemplo, uma impressão de audição tridimensional pode ser obtida, que provoca 10 uma satisfação melhorada do usuário em aplicações de entretenimento. Entretanto, os conteúdos de áudio multicanais também são úteis em ambientes profissionais, por exemplo, em aplicações de conferência telefônica, pois a inteligibilidade do locutor pode ser melhorada ao usar uma reprodução de áudio 15 multicanal.
Entretanto, também é desejável ter uma boa troca entre a qualidade do áudio e exigências de taxa de bit com a finalidade de evitar uma carga excessiva de recurso causada por aplicações multicanais.
Recentemente, as técnicas paramétricas para a transmissão eficiente de taxa de bit e/ou armazenamento de cenas de áudio contendo múltiplos objetos de áudio foram propostas, por exemplo, Binaural Cue Coding [Codificação de Cue Binaural] (Tipo I) (vide, por exemplo, referência 25 [BCC]), Joint Source Coding [Codificação de Fonte Conjunta] (vide, por exemplo, referência [JSC]), e MPEG Spatial Audio Object Coding [Codificação de Objeto de Áudio Espacial MPEG](SAOC)(vide, por exemplo, referências [SA0C1], [SAOC2] e referência não pré-publicada [SAOC]).
Essas técnicas têm o objetivo de perceptivamente reconstruir a cena de áudio de saida desejada, ao invés de uma combinação de forma de onda.
A Fig. 8 mostra uma visão geral de sistema de tal sistema (aqui: MPEG SAOC). 0 sistema MPEG SAOC 800 mostrado na Fig. 8 compreende um codificador SAOC 810 e um decodificador SAOC 820. O codificador SAOC 810 recebe uma pluralidade de sinais de objeto Xi a xN, que pode ser representada, por exemplo, como sinais 10 de dominio de tempo ou como sinais de domínio de frequência de tempo (por exemplo, na forma de um conjunto de coeficientes de transformação de uma transformação do tipo Fourier, ou na forma de sinais de sub-faixa QMF). O codificador SAOC 810 tipicamente também recebe os coeficientes downmix di a dN, que são associados 15 aos sinais de objeto xx a xN. Os conjuntos separados de coeficientes downmix podem estar disponíveis para cada canal do sinal downmix. O codificador SAOC 810 é tipicamente configurado para obter um canal do sinal downmix ao combinar os sinais de objeto Xi a xN em conformidade com os coeficientes associados 20 downmix dj a dN. Tipicamente, existem menos canais downmix do que sinais de objeto xx a xN. Com a finalidade de permitir (pelo menos * aproximadamente) uma separação (ou tratamento separado) dos sinais de objeto no lado do decodificador SAOC 820, o codificador SAOC 810 fornece ambos de um ou mais sinais downmix (designados como 25 canais downmix) 812 e uma informação lateral 814. A informação lateral 814 descreve as características dos sinais de objeto Xi a xN, com a finalidade de permitir um processamento específico de objeto do lado do decodificador.
O decodificador SAOC 820 é configurado para receber ambos de um ou mais sinais downmix 812 e a informação lateral 814. Da mesma forma, o decodificador SAOC 820 é tipicamente configurado para receber uma informação de interação 5 de usuário e/ou uma informação de controle de usuário 822, que descreve uma configuração de prestação desejada. Por exemplo, a informação de interação de usuário/informação de controle de usuário 822 pode descrever uma configuração de locutor e a colocação espacial desejada dos objetos que fornecem os sinais de 10 objeto Xi a xN.
O decodificador SAOC 820 é configurado para fornecer, por exemplo, uma pluralidade de sinais decodificados de canal upmix a yM. Os sinais de canal upmix podem, por exemplo, ser associados aos locutores individuais de um arranjo de 15 prestação de multi-locutor. O decodificador SAOC 820 pode, por exemplo, compreender um separador de objeto 820a, que é configurado para reconstruir, pelo menos aproximadamente, os sinais de objeto xx a xN com base em um ou mais sinais downmix 812 e a informação lateral 814, assim obtendo os sinais reconstruídos 20 de objeto 820b. Entretanto, os sinais reconstruídos de objeto 820b podem desviar de algum modo dos sinais originais de objeto xx a xN, por exemplo, pois a informação lateral 814 não é bem suficiente para uma reconstrução perfeita devido às restrições de taxa de bit. 0 decodificador SAOC 820 pode ainda compreender um misturador 25 820c, que pode ser configurado para receber os sinais reconstruidos de objeto 820b e a informação de interação de usuário/informação de controle de usuário 822, e para fornecer, com base nisso, os sinais de canal upmix yi a yM. 0 misturador 820c pode ser configurado para usar a informação de interação de usuário /informação de controle de usuário 822 para determinar a contribuição dos sinais individuais reconstruídos de objeto 820b aos sinais de canal upmix yi a yM. A informação de interação de 5 usuário/informação de controle de usuário 822 pode, por exemplo, compreender os parâmetros de prestação (também designados como coeficientes de prestação), que determinam a contribuição dos sinais individuais reconstruídos de objeto 822 aos sinais de canal upmix yi a yM.
Entretanto, deve ser observado que em muitas realizações, a separação de objeto, que é indicada pelo separador de objeto 820a na Fig. 8, e a mistura, que é indicada pelo misturador 820c na Fig. 8, são realizadas em única etapa. Para essa finalidade, os parâmetros gerais podem ser computados que 15 descrevem um mapeamento direto de um ou mais sinais downmix 812 aos sinais de canal upmix yx a yM. Esses parâmetros podem ser computados com base na informação lateral e informação de interação de usuário/informação de controle de usuário 822.
Com referência agora às Figs. 9a, 9b e 9c, 20 diferente mecanismo para obter uma representação de sinal upmix com base em uma representação de sinal downmix e informação lateral relacionada de objeto será descrito. A Fig. 9a mostra um diagrama esquemático em bloco de um sistema MPEG SAOC 900 compreendendo um decodificador SAOC 920. O decodificador SAOC 920 25 compreende, como blocos funcionais separados, um decodificador de objeto 922 e um misturador/prestador 926. O decodificador de objeto 922 fornece uma pluralidade de sinais reconstruídos de objeto 924 em dependência da representação de sinal downmix (por exemplo, na forma de um ou mais sinais downmix representados no dominio de tempo ou no dominio de frequência de tempo) e informação lateral relacionada de objeto (por exemplo, na forma de metadados de objeto). 0 misturador/prestador 926 recebe os sinais 5 reconstruídos de objeto 924 associados a uma pluralidade de objetos N e fornece, com base nisso, um ou mais sinais de canal upmix 928. No decodificador SAOC 920, a extração dos sinais de objeto 924 é realizada separadamente da mistura/prestaçâo que permite uma separação da funcionalidade de decodificação de objeto 10 da funcionalidade de mistura/prestação, porém provoca uma complexidade computacional relativamente alta.
Com referência agora à Fig. 9b, outro sistema MPEG SAOC 930 será brevemente discutido que compreende um decodificador SAOC 950. O decodificador SAOC 950 fornece uma 15 pluralidade de sinais de canal upmix 958 em dependência de uma representação de sinal downmix (por exemplo, na forma de um ou mais sinais downmix') e uma informação lateral relacionada de objeto (por exemplo, na forma de metadados de objeto). 0 decodificador SAOC 950 compreende um decodificador combinado de 20 .objeto e misturador/prestador, que é configurado para obter os sinais de canal upmix 958 em um processo conjunto de mistura sem uma separação de decodificação de objeto e mistura/prestação, caracterizados pelo fato de que os parâmetros para o referido processo conjunto de upmix são dependentes de ambas a informação 25 lateral relacionada de objeto e a informação de prestação. O processo conjunto de upmix também depende da informação downmix, que é considerada como parte da informação lateral relacionada de objeto.
Para resumir o acima, a provisão dos sinais de canal upmix 928, 958 pode ser realizada em um processo de uma etapa ou um processo de duas etapas.
Com referência agora à Fig. 9c, um sistema MPEG 5 SAOC 960 será descrito. O sistema SAOC 960 compreende um transcodificador SAOC para MPEG Surround 980, ao invés de um decodificador SAOC.
O transcodificador SAOC para MPEG Surround compreende uma transcodificador de informação lateral 982, que é 10 configurada para receber a informação lateral relacionada de objeto (por exemplo, na forma de metadados de objeto) e, opcionalmente, informação em um ou mais sinais downmix e a informação de prestação. A transcodificador de informação lateral também é configurada para fornecer uma informação lateral MPEG 15 Surround (por exemplo, na forma de uma corrente de bit MPEG Surround) com base em um dado recebido. De forma correspondente, o transcodificador de informação lateral 982 é configurado para transformar uma informação lateral (paramétrica) relacionada ao objeto, que é recebida a partir do codificador de objeto, em uma 20 informação lateral (paramétrica) relacionada ao canal, considerando a informação de prestação e, opcionalmente, a informação sobre o conteúdo de um ou mais sinais downmix.
Opcionalmente, o transcodificador SAOC para MPEG Surround 980 pode ser configurado para manipular um ou mais sinais 25 downmix, descritos, por exemplo, pela representação de sinal downmix, para obter uma representação manipulada de sinal downmix 988. Entretanto, o manipulador de sinal downmix 986 pode ser omitido, de modo que a representação de sinal downmix de saida 988 do transcodificador SAOC para MPEG Surround 980 é idêntica â representação de sinal downmix de entrada do transcodificador SAOC para MPEG Surround. O manipulador de sinal downmix 986 pode, por exemplo, ser usado se a informação lateral relacionada ao canal MPEG Surround 984 não permitisse fornecer uma impressão desejada de audição com base na representação de sinal downmix de entrada do transcodificador SAOC para MPEG Surround 980, que pode ser o caso em algumas constelações de prestação.
De forma correspondente, o transcodificador SAOC para MPEG Surround 980 fornece a representação de sinal downmix 988 e a corrente de bit MPEG Surround 98 4 de modo que uma pluralidade dos sinais de canal upmix, que representa os objetos de áudio em conformidade com a entrada de informação de prestação ao transcodificador SAOC para MPEG Surround 980, pode ser gerada usando um decodificador MPEG Surround que recebe a corrente de bit MPEG Surround 984 e a representação de sinal downmix 988.
Para resumir o acima, diferentes conceitos para decodificar sinais de áudio codificados por SAOC podem ser usados. Em alguns casos, um decodificador SAOC é usado, que fornece os sinais de canal upmix (por exemplo, sinais de canal upmix 928, 958) em dependência da representação de sinal downmix e a informação lateral paramétrica relacionada ao objeto. Os exemplos para esse conceito podem ser vistos nas Figs. 9a e 9b. Alternativamente, a informação de áudio codificada por SAOC pode ser transcodifiçada para obter uma representação de sinal downmix (por exemplo, uma representação de sinal downmix 988) e uma informação lateral relacionada ao canal (por exemplo, a corrente de bit relacionada ao canal MPEG Surround 984), que podem ser usadas por um decodificador MPEG Surround para fornecer os sinais desejados de canal upmix.
No sistema MPEG SAOC 800, uma visão geral do sistema da qual é fornecida na Fig. 8, o processamento geral é 5 conduzido de uma forma seletiva de frequência e pode ser descrito conforme segue dentro de cada faixa de frequência: • sinais de objeto de áudio de entrada N xx a xN são realizados por downmix como parte do processamento do codificador SAOC. Para um downmix mono, os coeficientes downmix 10 são denotados por d; a dN. Além disso, o codificador SAOC 810 extrai a informação lateral 814 descrevendo as características dos objetos de áudio de entrada. Para MPEG SAOC, as relações das potências de objeto com relação entre si são a forma mais básica de tal informação lateral. • O sinal downmix (ou sinais) 812 e informação lateral 814 são transmitidos e/ou armazenados. Para essa finalidade, o sinal de áudio downmix pode ser comprimido usando codificadores de áudio de percepção bem conhecidos, tais como, MPEG-1 Camada II ou III (também conhecido como ".mp3"), MPEG 20 Advanced Audio Coding [Codificação de Áudio Avançado MPEG] (AAC), ou qualquer outro codificador de áudio. • Na extremidade receptora, o decodificador SAOC 820 conceitualmente tenta restaurar o sinal de objeto original ("separação de objeto") usando a informação lateral 25 transmitida 814 (e, naturalmente, um ou mais sinais downmix 812). Esses sinais aproximados de objeto (também designados como sinais reconstruídos de objeto 820b) são então misturados em uma cena alvo representada pelos canais de saída de áudio M (que podem, por exemplo, ser representados pelos sinais de canal upmix a yM) usando uma matriz de prestação. Para uma saída mono, os coeficientes de matriz de prestação são fornecidos por rq a rN • Efetivamente, a separação dos sinais de objeto é raramente executada (ou ainda nunca executada), já que ambas a etapa de separação (indicada pelo separador de objeto 820a) e a etapa de mistura (indicada pelo misturador 820c) são combinadas em uma única etapa de transcodificação, que frequentemente resulta em uma enorme redução na complexidade 10 computacional.
Foi averiguado que tal esquema é tremendamente eficiente, tanto em termos de taxa de bit de transmissão (somente é necessário transmitir poucos canais downmix mais alguma informação lateral, ao invés de sinais de áudio de objeto N 15 (tipicamente discretos) mais informação opcional de prestação ou um sistema discreto) e complexidade computacional (a complexidade do processamento relaciona-se principalmente ao número de canais de saída, ao invés do número de objetos de áudio). As vantagens adicionais para o usuário na extremidade receptora incluem a 20 liberdade de escolher uma configuração de prestação de sua escolha (mono, estéreo, surround, reprodução de fone de ouvido virtualizada e etc.) e o recurso da interatividade de usuário: a matriz de prestação e, dessa forma, a cena de saída podem ser definidas e alteradas interativamente pelo usuário de acordo com a 25 vontade, preferência pessoal ou outros critérios. Por exemplo, é possível localizar os faladores de um grupo junto em uma área espacial para maximizar a discriminação dos outros faladores restantes. Essa interatividade é atingida ao fornecer uma interface de usuário de decodificador:
Para cada objeto de som transmitido, seu nivel relativo e (para prestação não mono) posição espacial da prestação podem ser ajustados. Isso pode ocorrer em tempo real conforme o 5 usuário altera a posição dos deslizantes associados de interface gráfica de usuário (GUI) (por exemplo: nivel de objeto = + 5dB, posição de objeto = -30deg).
Entretanto, foi averiguado que a escolha do lado do decodificador dos parâmetros para a provisão da representação 10 de sinal upmix (p.ex., os sinais de canal upmix jq a yM) provoca degradações audiveis em alguns casos.
Foi averiguado que devido à abordagem paramétrica downmix/separação/com base em mistura, a qualidade subjetiva da saida de áudio depende das configurações do parâmetro de 15 prestação. Foi averiguado que as alterações no nivel de objeto relativo aféta a qualidade do áudio final mais do que as alterações na posição de prestação espacial ("novo posicionamento"). As configurações extremas para os parâmetros de nivel relativo (p.ex., +20dB) podem levar a uma qualidade inaceitável de saida.
Enquanto isso é simplesmente um resultado de violar algumas das assunções perceptuais que sustentam este esquema, ainda é inaceitável que um produto comercial produza som ruim e artefatos dependendo das configurações da interface de 25 usuário.
O Pedido de Patente Norte-Americana 61/173.456 denominado "Métodos, Mecanismo e Programas de Computador Para Distorção Evitando Processamento de Sinal de Áudio" e Pedido de
Patente Internacional PCT/EP2010/055717 denominado "Mecanismo para fornecer Um ou Mais Parâmetros Ajustados para a Provisão de uma Representação de Sinal Upmix com Base em uma Representação de Sinal Downmix, Decodificador de Sinal de Áudio, Transcodificador 5 de Sinal de Áudio, Codificador de Sinal de Áudio, Corrente de Bit de Áudio, Método e Programa de' Computador usando uma Informação Paramétrica Relacionada ao Objeto" (doravante denominado como "exemplo para um controle de distorção") descreve um processo para mitigar a distorção da modificação de ganho de objeto em um 10 sistema SAOC. Os referidos documentos descrevem diferentes conceitos para controle de distorção e redução de distorção, cujos conceitos podem ser aplicados dentro ou em combinação com as realizações de acordo com a invenção. .
Considerando a discussão acima, é um objeto da 15 presente invenção criar um conceito que permite uma redução melhorada ou anulação de distorções ao fornecer uma representação de sinal upmix com base em uma representação de sinal downmix.
Sumário da Invenção
Uma realização de acordo com a invenção cria um 20 mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluidas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação. O mecanismo, compreende um limitador de 25 distorção configurado para ajustar os parâmetros upmix (p.ex., fatores de ganho ou entradas de uma matriz de prestação) usando um esquema de controle de distorção para evitar ou limitar as distorções audiveis que são introduzidas como uma consequência de uma escolha inadequada de um parâmetro de prestação (p.ex., entradas de uma matriz de prestação específica de usuário). 0 limitador de distorção é configurado para obter um parâmetro de controle de limitação de distorção, que é incluído na representação de corrente de bit do conteúdo de áudio, e para ajustar o esquema de controle de distorção em dependência do parâmetro de controle de limitação de distorção.
Esta realização de acordo com a invenção é com base na ideia chave de que as vantagens significativas podem ser atingidas ao ajustar o esquema de controle de distorção em dependência de um parâmetro de controle de limitação de distorção, que está incluído na representação de corrente de bit do conteúdo de áudio, pois isso permite um controle do esquema de controle de distorção, que é aplicado no lado de um decodificador de áudio (p.ex., um mecanismo para fornecer uma representação de sinal upmix), usando a informação de controle (p.ex., o parâmetro de controle de limitação de distorção), que é fornecida pelo codificador de áudio (p.ex., um mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal). De forma correspondente, um codificador de sinal de áudio tem uma chance de controlar o esquema de controle de distorção do lado do decodificador, que, por sua vez, fornece ao codificador a possibilidade de transmitir mais ou menos liberdade ao usuário do decodificador com relação a um ajuste dos parâmetros de prestação.
De forma correspondente, o codificador de sinal de áudio, que tipicamente compreende um melhor conhecimento dos objetos de sinal de áudio representados pela representação de sinal downmix, pode contribuir para adequadamente ajustar o esquema de controle de distorção usando seu conhecimento dos sinais de objeto de áudio. Isso permite os resultados melhorados ao fornecer a representação de sinal upmix. Da mesma forma, o codificador de sinal de áudio pode fornecer um parâmetro adequado de controle de 5 limitação de distorção em conformidade com as exigências do prestador de conteúdo fornecendo os sinais de objeto de áudio que são representados pela representação de sinal downmix, de modo que uma degradação excessiva da representação de sinal upmix por um cenário inadequado dos parâmetros de prestação pode ser impedida 10 do lado do codificador de sinal de áudio, por exemplo, em conformidade com as exigências do prestador de conteúdo.
Para resumir, um grande número de vantagens pode ser obtido pela abordagem inventiva para avaliar um parâmetro de controle de limitação de distorção, que é extraido no lado do 15 decodificador a partir da representação de corrente de bit do conteúdo de áudio, para ajustar, por exemplo, um ou mais parâmetros de um esquema de controle de distorção aplicado no lado do decodificador.
Em uma realização preferida, o mecanismo para 20 fornecer uma representação de sinal upmix é configurado para receber uma matriz desejada de prestação a partir de uma interface de entrada. Neste caso, o limitador de distorção é configurado para obter uma matriz modificada de prestação em dependência da matriz desejada de prestação e um ou mais parâmetros de controle 25 de limitação de distorção. O mecanismo para fornecer a representação de sinal upmix é configurado para fornecer a representação de sinal upmix em dependência da matriz modificada de prestação. De forma correspondente, o parâmetro de controle de limitação de distorção, que é extraido pelo decodificador de sinal de áudio (p.ex., o mecanismo para fornecer uma representação de sinal upmix) a partir da representação de corrente de bit do conteúdo de áudio, pode ser usado para fornecer uma matriz 5 modificada de prestação, que evita distorções audiveis excessivas dentro da representação de sinal upmix. Uma redução das distorções audiveis pode ser atingida mesmo se a entrada desejada de matriz de prestação via a interface de entrada (por exemplo, por um usuário) for inadequada (e causaria distorções audiveis significativas na representação de sinal upmix). Dessa forma, o parâmetro de controle de limitação de distorção pode ser avaliado pelo limitador de distorção para determinar como a matriz modificada de prestação é obtida em dependência da matriz desejada de prestação a partir da interface de entrada, assim fornecendo algum grau de controle a um codificador de sinal de áudio.
Em uma realização preferida, o limitador de distorção é configurado para obter uma ou mais valores de limite de matriz de prestação, que são incluidos na representação de corrente de bit do conteúdo de áudio, e que descrevem os valores 20 minimos e máximos dos elementos de matriz de prestação (também designados como entradas). Neste caso, o limitador de distorção é ainda configurado para limitar uma ou mais entradas da matriz modificada de prestação em conformidade com um ou mais valores de limite de matriz de prestação ao obter a matriz modificada de 25 prestação em dependência da matriz desejada de prestação. De forma correspondente, os parâmetros de controle de limitação de distorção, que compreendem os valores de limite de matriz de prestação, podem ser usados para evitar configurações extremas de prestação, que são identificadas como sendo indesejáveis por um codificador de sinal de áudio fornecendo a representação de corrente de bit do conteúdo de áudio. Dessa forma, as distorções audíveis, que seriam introduzidas como uma consequência de um 5 cenário inadequado dos parâmetros de 'prestação, podem ser evitadas, ou pelo menos limitadas. •
Em uma realização preferida, o limitador de distorção é configurado para obter a matriz modificada de prestação em dependência da matriz desejada de prestação, uma 10 matriz de prestação de referência e um ou mais parâmetros de controle de limitação de distorção. A utilização de uma matriz de prestação de referência provoca vantagens especificas, pois a matriz de prestação de referência pode especificar uma configuração de prestação que fornece uma qualidade suficientemente boa ou ainda ideal da representação de sinal upmix. De forma correspondente, as alterações permissiveis dos parâmetros de prestação com relação à referida matriz de prestação de referência podem ser definidas pelos parâmetros de controle de limitação de distorção, que permite uma especificação eficiente 20 das faixas em que os parâmetros modificados de prestação devem estar.
Em uma realização preferida, o limitador de distorção é configurado para limitar uma ou mais entradas da matriz modificada de prestação relativa à matriz de prestação de 25 referência (ou relativa às entradas da matriz de prestação de referência) em conformidade com um ou mais valores de limite de matriz de prestação, que são descritos pelos parâmetros de controle de limitação de distorção. De forma correspondente, a limitação da matriz de prestação pode sér realizada eficientemente f ’’ em conformidade com a matriz de prestação de referência.
Da mesma forma, um ou mais dos parâmetros de controle de limitação de distorção podem determinar como a matriz - 5 de prestação de referência é obtida. Por exemplo, um ou mais dos parâmetros de controle de limitação de distorção podem especificar i uma constante de tempo de filtro para derivar as entradas da matriz de prestação de referência. Entretanto, outra informação de I configuração, que descreve como a matriz de prestação de referência é obtida, também pode ser definida por um ou mais dos parâmetros de controle de limitação de distorção.
Em uma realização preferida, o limitador de distorção é configurado para aplicar parâmetros de controle de limitação de distorção individual de objeto com a finalidade de i 15 obter a matriz modificada de prestação em dependência da matriz de prestação desejada (p.ex., especificada pelo usuário). De forma correspondente, as diferenças dos sinais de objeto de áudio, que são bem conhecidas por um codificador de sinal de áudio fornecendo a representação de corrente de bit do conteúdo de áudio, podem ser 20 consideradas pelo esquema de controle de distorção ao explorar os parâmetros de controle de limitação de distorção individual de objeto, que são extraídos da representação de corrente de bit do conteúdo de áudio.
Em uma realização preferida, o mecanismo para 25 fornecer um sinal upmix é configurado para aplicar um ou mais fatores modificados de ganho às amostras de áudio da representação de sinal downmix, ou a uma informação lateral relacionada de objeto associada aos objetos de áudio descritos pelo sinal downmix, para fornecer a representação de sinal upmix em dependência dos fatores modificados de ganho. Neste caso, o limitador de distorção é configurado para obter um ou mais fatores modificados de ganho em dependência de um ou mais fatores 5 desejados de ganho e um ou mais parâmetros de controle de limitação de distorção. De forma correspondente, os parâmetros de controle de limitação de distorção, que são extraídos a partir da representação de corrente de bit do conteúdo de áudio, são usados para ajuste adequado dos fatores de ganho, que permite o controle 10 da escolha (adequada) dos fatores de ganho do lado de um codificador de sinal de áudio fornecendo a representação de corrente de bit do conteúdo de áudio.
Em uma realização preferida, o limitador de distorção é configurado para derivar um nivel de referência para 15 um parâmetro de ganho a ser limitado usando um filtro de uniformização tendo uma constante de tempo. Neste caso, o limitador de distorção é configurado para usar o nivel de referência para limitar determinado parâmetro. Da mesma forma, o limitador de distorção é configurado para obter um parâmetro de constante de tempo, que é incluído na representação de corrente de bit do conteúdo de áudio (p.ex., ao extrair o parâmetro de constante de tempo a partir da representação de corrente de bit do conteúdo de áudio) e para ajustar a constante de tempo de filtro de uniformização em dependência do parâmetro de constante de 25 tempo. Dessa forma, um codificador de sinal de áudio, que conhece as características temporais dos sinais de objeto de áudio melhor do que o decodificador de sinal de áudio (mecanismo para fornecer uma representação de sinal upmix), pode incluir um parâmetro b adequado de constante de tempo, que permite uma derivação significativa de um nivel de referência, na representação de corrente de bit do conteúdo de áudio para aplicação por um decodificador de sinal de áudio. Portanto, as características 5 especificas do sinal de áudio, que são conhecidas por um codificador de sinal de áudio, podem ser exploradas pelo esquema de controle de distorção.
Em uma realização preferida, o limitador de parâmetro é configurado para obter um parâmetro de ativação de 10 controle de distorção, que está incluido na representação de corrente de bit do conteúdo de áudio, e para ativar ou desativar o esquema de controle de distorção em dependência do parâmetro de ativação de controle de distorção. De forma correspondente, um codificador de sinal de áudio, que fornece a representação de 15 corrente de bit do conteúdo de áudio, pode exercer uma ativação do esquema de controle de distorção, ou pode desativar o esquema de controle de distorção. De forma correspondente, o codificador de sinal de áudio fornecendo a representação de corrente de bit do conteúdo de áudio pode seletivamente exercer um esquema adequado 20 de controle de distorção que é aplicado por um decodificador de sinal de áudio, que auxilia a evitar a insatisfação do usuário para os conteúdos de áudio que sâo críticos, de acordo com a avaliação do codificador de áudio ou prestador de conteúdo. O codificador de sinal de áudio pode fornecer uma limitação adequada do cenário dos parâmetros de prestação neste caso. Por outro lado, o decodificador de áudio pode seletivamente desativar o esquema de controle de distorção, para fornecer a flexibilidade máxima com relação ao cenário dos parâmetros de prestação a um usuário, para os conteúdos de áudio para os quais tal flexibilidade máxima provoca uma melhor satisfação de usuário do que a aplicação de um esquema de controle de distorção.
Em uma realização preferida, o limitador de parâmetro é configurado para obter um parâmetro de ativação de matriz de prestação pré-definido, que é incluido na representação de corrente de bit do conteúdo de áudio. Neste caso, o limitador de parâmetro é configurado para exercer, em resposta a um estado ativo do parâmetro de ativação de matriz de prestação pré- 10 definido, que uma informação de matriz de prestação pré-definida incluida na representação de corrente de bit do conteúdo de áudio é usada, ao invés de uma informação • de matriz de prestação especifica de usuário, para fornecer a representação de sinal upmix com base na representação de sinal downmix. De forma 15 correspondente, o decodificador de sinal de áudio pode realizar, em algumas situações, que a representação de sinal upmix é obtida usando uma matriz de prestação informação definida pelo codificador de sinal de áudio, ao invés de pelo usuário. De forma correspondente, o codificador de sinal de áudio tem a chance de 20 incluir a informação de matriz de prestação pré-definida na corrente de bit e ativar o parâmetro de ativação de matriz de prestação pré-definido (ou bandeira), indicando que a informação de matriz de prestação pré-definida deve ser usada pelo decodificador de sinal de áudio. De forma correspondente, o 25 decodificador de sinal de áudio pode garantir que um valor artístico do conteúdo de áudio, que pode ser fornecido por um cenário adequado da matriz de prestação em conformidade com a informação de matriz de prestação pré-definida, torna-se aparente para o usuário. De forma correspondente, uma insatisfação de usuário, que poderia ocorrer em tais casos em que somente um cenário adequado dos parâmetros de prestação fornece uma boa impressão de audição, pode ser evitada.
Em uma realização preferida, o limitador de parâmetro é configurado para obter um parâmetro de limitação de distorção psico-acústico, que é incluído na representação de corrente de bit do conteúdo de áudio. Neste caso, o limitador de distorção é configurado para ajustar um ou mais parâmetros upmix 10 em dependência de um modelo de distorção psico-acústico, de modo que uma medição (que pode ser, por exemplo, uma estimativa) das distorções causadas pela derivação da representação de sinal upmix a partir da representação de sinal downmix é limitada. Neste caso, o limitador de distorção é configurado para definir um ou mais 15 parâmetros usados para ajustar um ou mais parâmetros upmix em dependência do modelo de distorção psico-acústico (por exemplo, um parâmetro descrevendo como ajustar um ou mais parâmetros upmix em dependência de um valor de saida do modelo de distorção psico- acústico) , ou um ou mais parâmetros do modelo de distorção psico- 20 acústico, em dependência do parâmetro de limitação de distorção psico-acústico. De forma correspondente, a utilização de um modelo de distorção psico-acústico para uma limitação adequada dos parâmetros upmix (p.ex., parâmetros de prestação) pode ser controlada do lado de um codificador de áudio, que novamente 25 fornece ao codificador de áudio a possibilidade de contribuir com uma anulação de uma distorção significativa da representação de sinal upmix.
Em uma realização preferida distorção é configurado para obter um parâmetro atualizado de controle de limitação de distorção uma vez por estrutura de áudio, para obter um esquema de controle de distorção de variante de tempo. Esse conceito provoca a vantagem de que o esquema de controle de distorção pode ser ajustado dinamicamente sob o controle de um codificador de sinal de áudio, que fornece um ou mais parâmetros de controle de limitação de distorção dentro da representação de corrente de bit do conteúdo de áudio, de modo que um esquema estrito ou relaxado de controle de distorção pode ser selecionado pelo codificador de áudio. Dessa forma, o codificador de sinal de áudio pode fornecer ao usuário uma flexibilidade máxima possivel, ao ajustar o esquema de controle de distorção para ser relaxado ao fornecer os parâmetros adequados de controle de limitação de distorção dentro da representação de corrente de bit do conteúdo de áudio, para passagens menos criticas de um conteúdo de áudio, e com menos flexibilidade, ao ajustar o esquema de controle de distorção para ser estrito ao fornecer os parâmetros adequados de controle de limitação de distorção, para estruturas de áudio mais criticas. Dessa forma, uma boa troca entre a flexibilidade do usuário e impressão de audição pode ser atingida por um controle adequado, que pode ser efetuada a partir do lado do codificador de áudio pelo uso do decodificador de áudio aqui discutido.
Em uma realização preferida, o limitador de distorção é configurado para avaliar uma bandeira de atualização dinâmica dentro de uma porção de configuração da representação de corrente de bit do conteúdo de áudio. Neste caso, o limitador de distorção é configurado para avaliar a porção de configuração da representação de corrente de bit do conteúdo de áudio para obter o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e para avaliar as porções de estrutura da representação de corrente de bit do conteúdo de áudio 5 para repetidamente obter atualizações do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa. De forma correspondente, o decodificador de áudio pode ser comutado entre um modo estático, em que um ou mais parâmetros de controle de limitação de distorção são transferidos somente uma 10 vez por sequência das estruturas de áudio (aos quais a sequência de uma única porção comum de configuração é associada, por exemplo), e um modo dinâmico de operação, em que um ou mais parâmetros de controle de limitação de distorção são transmitidos mais frequentemente ou ainda uma vez por estrutura de áudio. Isso 15 permite uma adaptação da transmissão dos parâmetros de controle de limitação de distorção, para obter uma baixa taxa de bit dos parâmetros de controle de limitação de distorção se uma faixa temporal dos parâmetros de controle de limitação de distorção for desnecessária e para obter uma boa resolução temporal dos 20 parâmetros de controle de limitação de distorção se isso for desejável, por exemplo, devido às características dos sinais de objeto de áudio.
Em uma realização preferida, o limitador de distorção é configurado para seletivamente atualizar o parâmetro 25 de controle de limitação de distorção em dependência de uma bandeira indicando a presença de um parâmetro de controle de limitação de distorção em uma porção de estrutura do conteúdo de áudio, de modo que os intervalos de atualização (medidos, por exemplo, em termos das estruturas de áudio) para os parâmetros de ' controle de limitação de distorção são determinados dinamicamente I pela representação de corrente de bit do conteúdo de áudio. De I ' forma correspondente, em uma única peça da informação de áudio ' 5 compreendendo múltiplas estruturas de áudio, uma atualização dos parâmetros de controle de limitação de distorção pode ser realizada em instâncias irregulares ou tempo (por exemplo, com um número irregular de estruturas de áudio de forma intermediária), que pode ser bem adaptada para faixas temporalmente irregulares 10 dos sinais de objeto de áudio.
Uma realização de acordo com a invenção cria um mecanismo para fornecer uma representação de corrente de bit de um sinal de áudio multicanal. O mecanismo compreende um downmixer configurado para fornecer um sinal downmix com base em uma 15 pluralidade de sinais de objeto de áudio. Da mesma forma, o mecanismo compreende um prestador de informação lateral configurado para fornecer uma informação lateral paramétrica relacionada ao objeto descrevendo as características dos sinais de objeto de áudio e parâmetros downmix, e um ou mais parâmetros de 20 controle de limitação de distorção para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo para fornecer uma representação de sinal upmix. O mecanismo para fornecer uma corrente de bit também compreende um formatador de corrente de bit configurado para fornecer uma corrente de bit 25 compreendendo uma representação do sinal downmix, a informação lateral paramétrica relacionada ao objeto e um ou mais parâmetros de controle de limitação de distorção.
O referido mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal é bem adequado para provisão da representação de corrente de bit do conteúdo de áudio, que é usável pelo mecanismo acima discutido para fornecer uma representação de sinal upmix. 0 mecanismo para fornecer uma 5 corrente de bit permite a inclusão dos parâmetros de controle de limitação de distorção na corrente de bit, de modo que o esquema de controle de distorção do lado do decodificador pode ser ajustado em conformidade com os desejos definidos no lado do codificador.
Para detalhes adicionais e vantagens, a referência é feita à discussão acima do mecanismo para fornecer uma representação de sinal upmix.
Outra realização de acordo com a invenção cria um método para fornecer uma representação de sinal upmix com base em 15 uma representação de sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluidas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação.
Outra realização de acordo com a invenção cria um 20 método para fornecer uma corrente de bit representando um sinal de áudio multicanal.
Outra realização de acordo com a invenção cria um programa de computador para realizar um dos referidos métodos.
Os métodos e o programa de computador são com base nas mesmas ideias chave conforme o mecanismo acima discutido.
Outra realização de acordo com a invenção cria uma corrente de bit representando um sinal de áudio multicanal. A corrente de bit compreende uma representação do sinal downmix combinando os sinais de áudio de uma pluralidade de objetos de áudio e uma informação lateral paramétrica relacionada ao objeto descrevendo características dos objetos de áudio. A corrente de bit também compreende um ou mais parâmetros de controle de limitação de distorção para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo para fornecer uma representação de sinal upmix. A referida corrente de bit é tipicamente fornecida pelo mecanismo acima discutido para fornecer uma corrente de bit representando um sinal de áudio multicanal, e pode tipicamente ser avaliada pelo mecanismo acima discutido para fornecer uma representação de sinal upmix. A corrente de bit permite um ajuste eficiente do esquema de controle de distorção.
Breve Descrição das Figuras
As realizações de acordo com a presente invenção serão subsequentemente descritas com referência às figuras anexas, em que: Fig. 1 mostra um diagrama esquemático em bloco de um mecanismo para fornecer uma representação de sinal upmix, de acordo com uma realização da invenção;
Fig. 2 mostra um diagrama esquemático em bloco de um mecanismo para fornecer uma representação de sinal upmix, de acordo com outra realização da invenção;
Fig. 3 mostra um diagrama esquemático em bloco de um mecanismo para fornecer uma representação de sinal upmix, de acordo com outra realização da invenção; Fig. 4 mostra um diagrama esquemático em bloco de um controle de distorção SAOC com a sinalização inventiva de corrente de bit;
Fig. 5 mostra um diagrama esquemático em bloco de um mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, de acordo com uma realização da invenção;
Fig. 6 mostra uma representação esquemática de uma corrente de bit representando um sinal de áudio multicanal, de acordo com uma realização da invenção; Fig. 7 mostra um diagrama esquemático em bloco de um exemplo para controle de distorção SAOC;
Fig. 8 mostra um diagrama esquemático em bloco de um sistema MPEG SAOC de referência; Fig. 9a mostra um diagrama esquemático em bloco de um sistema SAOC de referência usando um decodificador e misturador separados;
Fig. 9b mostra um diagrama esquemático em bloco de um sistema SAOC de referência usando um decodificador e misturador integrados; e Fig. 9c mostra um diagrama esquemático em bloco de um sistema SAOC de referência usando um transcodificador 20 SAOC para MPEG.
Descrição Detalhada das Realizações 1. Mecanismo para fornecer uma representação de sinal upmix, de acordo com a Fig. 1
A Fig. 1 mostra um diagrama esquemático em bloco 25 de um mecanismo 100 para fornecer uma representação de sinal upmix 120 com base em uma representação de sinal downmix 110 e uma informação paramétrica relacionada ao objeto 112 (que pode ser considerada como uma informação lateral paramétrica). A representação de sinal downmix 110 e a informação paramétrica relacionada ao objeto 112 podem ser ambas incluídas em uma representação de corrente de bit do conteúdo de áudio. O mecanismo 100 pode ser configurado para fornecer a representação de sinal ' 5 upmix em dependência de uma informação de prestação 114, que pode ser a entrada, por exemplo, usando uma interface de usuário. O mecanismo 100 pode receber um ou mais parâmetros de controle de limitação de distorção 116, que são tipicamente também incluídos na representação de corrente de bit do conteúdo de áudio.
O mecanismo 100 compreende um processador de sinal 130, que é configurado para fornecer a representação de sinal upmix 120 em dependência da representação de sinal downmix 110 e a informação paramétrica relacionada ao objeto 112, considerando os parâmetros ajustados upmix 132. O mecanismo 100 15 compreende um limitador de distorção 140 configurado para obter os parâmetros ajustados upmix 132 usando um esquema de controle de distorção 142, para evitar ou limitar as distorções audíveis que são causadas por uma escolha inadequada dos parâmetros de prestação da informação de prestação 114. O limitador de distorção 20 140 é configurado para obter um ou mais parâmetros de controle de limitação de distorção 116, que são incluídos na representação de corrente de bit do conteúdo de áudio, e para ajustar o esquema de controle de distorção em dependência de um ou mais parâmetros de controle de limitação de distorção 116.
A seguir, a funcionalidade do mecanismo 100 será discutida em mais detalhes. 0 processador de sinal 130 fornece a representação de sinal upmix 120. Para essa finalidade, a representação de sinal downmix 110 e a informação paramétrica relacionada ao objeto 112 são consideradas. Da mesma forma, uma tentativa é feita na maioria dos casos (porém não necessariamente em todos os casos) para fornecer a representação de sinal upmix 120 em conformidade com a informação de prestação 114, que é 5 fornecida, por exemplo, por um usuário via uma interface de usuário. Entretanto, se a informação de prestação 114 fosse usada sem um esquema de controle de distorção, isso por vezes levaria às distorções audiveis da representação de sinal upmix 120, por exemplo, se as configurações extremas de prestação fossem 10 escolhidas por um usuário. Com a finalidade de evitar as distorções audiveis excessivas, os parâmetros ajustados upmix 132 (que podem ser parâmetros de prestação ou outros parâmetros upmix) são fornecidos pelo limitador de distorção 140 com base na informação de prestação 114 e usando o esquema de controle de 15 distorção 142.
O esquema de controle de distorção 142 é adaptado para derivar os parâmetros ajustados upmix 132 a partir da informação de prestação 114 usando uma regra ajustável de mapeamento, que pode, por exemplo, compreender um mapeamento linear, linear de forma de peça ou mapeamento não linear. O esquema de controle de distorção 142 pode ser ajustado em dependência de um ou mais parâmetros de ajuste de esquema de controle de distorção pelo limitador de distorção 140. Para essa finalidade, o limitador de distorção 140 pode considerar um ou mais parâmetros de controle de limitação de distorção 116, que são incluidos na representação de corrente de bit do conteúdo de
I áudio, e que são preferivelmente extraidos a partir da representação de corrente de bit do conteúdo de áudio usando um analisador de corrente de bit não mostrado na Fig. 1 (que pode, não obstante, ser parte do mecanismo 100 em algumas realizações) . O esquema de controle de distorção 142 (ou a regra de mapeamento definindo o esquema de controle de distorção) pode, em algumas 5 realizações, considerar a informação da representação de sinal downmix 110 e/ou da informação paramétrica relacionada ao objeto 112 para obter os parâmetros ajustados upmix 132 em dependência da informação de prestação 114. Os parâmetros de ajuste de esquema de controle de distorção, que são preferivelmente usados para ajustar 10 o esquema de controle de distorção, podem, por exemplo, compreender os parâmetros limitantes, parâmetros de combinação linear ou outros parâmetros funcionais definindo um mapeamento da informação de prestação 114 nos parâmetros ajustados upmix 132.
Para resumir, o limitador de distorção 140 fornece os parâmetros ajustados upmix 132 de modo que uma distorção audive.1 excessiva da representação de sinal upmix 120 é evitada, mesmo se a informação de prestação 114 for escolhida de uma forma adequada e, sem a aplicação do esquema de controle de distorção 142, resulte em uma distorção excessiva da representação 20 de sinal upmix 120. Dessa forma, o limitador de distorção usando e ajustando o esquema de controle de distorção 142 auxilia a melhorar a impressão de audição. Ao realizar o ajuste do esquema de controle de distorção 142 dependente de um ou mais parâmetros de controle de limitação de distorção 116, que são incluídos na representação de corrente de bit do conteúdo de áudio, um controle de uma redução de distorções pode ser efetuado a partir do lado de um codificador de sinal de áudio fornecendo a representação de corrente de bit do conteúdo de áudio.
2. Mecanismo para fornecer uma representação de sinal upmix, de acordo com a Fig. 2
A seguir, um mecanismo 200 para fornecer uma representação de • sinal upmix com base em uma representação de 5 sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluidas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação será descrito com referência à Fig. 2, que mostra um diagrama esquemático em bloco de tal mecanismo 200.
Deve ser observado aqui que a informação recebida pelo mecanismo 200 na Fig. 2 e a informação fornecida pelo mecanismo 200 é semelhante à informação recebida e fornecida pelo mecanismo 100, de modo que os numerais idênticos de referência são usados para identificar a informação idêntica. Da mesma forma, 15 alguns dos meios do mecanismo 200 são idênticos aos meios do mecanismo 100, de modo que os numerais idênticos de referência são usados por toda a descrição para tais meios idênticos ou equivalentes.
O mecanismo 200 é configurado para receber a 20 representação de sinal downmix 110, uma informação paramétrica relacionada ao objeto 112, uma informação de prestação 114, e um ou mais parâmetros de controle de limitação de distorção 116. Da mesma forma, o mecanismo 200 é configurado para fornecer uma representação de sinal upmix 120 usando, por exemplo, um 25 processador de sinal 130.
O mecanismo 200 compreende um limitador de distorção 240, que usa um esquema de controle de distorção 242. O esquema de controle de distorção 242 compreende um calculador/estimador de distorção 242a e um modificador de informação de prestação 242b. 0 calculador/estimador de distorção 242a é, por exemplo, configurado para receber pelo menos uma parte da representação de sinal downmix 110 e pelo menos uma parte da 5 informação paramétrica relacionada ao objeto 112, e a informação de prestação 114. O calculador/estimador de distorção 242a é configurado para calcular ou estimar uma medição de distorções, que seria introduzida na representação de sinal upmix 120 ao aplicar a informação de prestação 114 à representação de sinal 10 downmix 110, considerando a informação paramétrica relacionada ao objeto 112. O modificador de informação de prestação 242b é configurado para fornecer os parâmetros ajustados de prestação 132 com base na informação de prestação 114, considerando a informação calculada ou estimada de distorção fornecida pelo 15 calculador/estimador de distorção 242a, de modo que os parâmetros ajustados de prestação 132 resultam em uma distorção reduzida, quando comparado aos parâmetros originais de prestação 114, quando aplicados pelo processador de sinal 130 para obter a representação de sinal upmix 120.
Entretanto, o modificador de informação de prestação 242b pode considerar um parâmetro de ajuste de esquema de controle de distorção, que é fornecido pelo limitador de distorção 240 em dependência do parâmetro de controle de limitação de distorção 116, e que afeta a provisão dos parâmetros ajustados 25 de prestação 132.
Por exemplo, o parâmetro de ajuste de esquema de controle de distorção (que é obtido com base no parâmetro de controle de limitação de distorção 116, ou que é ainda idêntico ao parâmetro de controle de limitação de distorção 116) pode, por exemplo, definir como a medição de distorção é calculada ou estimada pelo calculador/estimador de distorção 242a. Por exemplo, o referido parâmetro de ajuste de esquema de controle de distorção 5 pode definir como diferentes distorções são ponderadas absolutamente, ou com relação entre si, para obter um valor calculado ou estimado de distorção. Alternativamente, ou além disso, o parâmetro de ajuste de esquema de controle de distorção pode determinar como a medição de distorção obtida pelo 10 calculador/estimador de distorção 242a afeta a provisão dos parâmetros ajustados de prestação 132 com base na informação de prestação 114.
Em algumas realizações, o calculador/estimador de distorção 242a e o modificador de informação de prestação 242b 15 também podem ser combinados, de modo que os parâmetros ajustados de prestação 132 são fornecidos de modo que os parâmetros ajustados de prestação 132 provocam determinado grau (limitado) de distorção da representação de sinal upmix 120, caracterizado pelo fato de que esse grau de distorção da representação de sinal upmix 20 120 pode ser afetado (ou ajustado) pelo parâmetro de ajuste de esquema de controle de distorção.
3. Mecanismo para fornecer uma representação de sinal upmix, de acordo com a Fig. 3
A seguir, um mecanismo 300 para fornecer uma 25 representação de sinal upmix 120 com base em uma representação de sinal downmix 110 e uma informação paramétrica relacionada ao objeto 112, que são incluidas na representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação 114, será descrito com referência à Fig. 3. Deve ser • observado aqui que os numerais idênticos de referência designam a informação idêntica ou equivalente, meios e funcionalidades na discussão das realizações do presente. -5 0 mecanismo 300 compreende um limitador de distorção 34 0, que é configurado para usar um esquema de controle de distorção 342, e para fornecer os parâmetros ajustados upmix 132 em dependência da informação de prestação 114 e também em dependência do parâmetro de controle de limitação de distorção 10 116.
O esquema de controle de distorção 342 compreende uma informação de prestação limitador 342a que é configurado para limitar uma faixa numérica de valores da informação de prestação 114 para obter os parâmetros ajustados de prestação 132. A 15 limitação dos valores da informação de prestação 114 pode ser realizada em dependência de um parâmetro de ajuste de esquema de controle de distorção, que é obtido pelo limitador de distorção 340 em dependência do parâmetro de controle de limitação de distorção 116, ou que é ainda idêntico ao parâmetro de controle de 20 limitação de distorção 116. O esquema de controle de distorção 342 pode, opcionalmente, compreender um calculador de valor de referência 342b que pode ser configurado para fornecer um valor de referência de limitação em dependência da informação paramétrica relacionada ao objeto 112 e, preferivelmente, porém não 25 necessariamente, também em dependência de um parâmetro de ajuste de esquema de controle de distorção que é derivado de, ou idêntico a, um parâmetro de controle de limitação de distorção 116. De forma correspondente, a informação de prestação limitador 342 pode opcionalmente considerar o valor de referência de limitação fornecido pelo calculador de valor de referência 342b ao limitar a faixa numérica dos valores da informação de prestação em um processo de obter os parâmetros ajustados de prestação 132.
De forma correspondente, o limitador de distorção 340 pode implantar uma limitação ajustável da faixa numérica dos valores da informação de prestação 114, de modo a derivar os parâmetros ajustados de prestação 132 dos valores da informação de prestação 114, que podem ser uma informação de prestação 10 especificada pelo usuário. A limitação ajustável pode ser ajustada em dependência de um ou mais parâmetros de controle de limitação de distorção 116, caracterizados pelo fato de que os parâmetros de controle de limitação de distorção 116 podem determinar um ou mais parâmetros diferentes da limitação ajustável (p.ex., um valor 15 minimo, um valor máximo, um desvio permissivel de um valor de referência, um modo de cálculo de valor de referência, etc.).
4. Controle de distorção SAOC com sinalização inventiva de corrente de bit, de acordo com a Fig. 4 4.1 Visão Geral de Arquitetura
A seguir, o conceito do controle de distorção SAOC com a sinalização inventiva de corrente de bit será discutido com referência à Fig. 4, que mostra um diagrama esquemático em bloco de um sistema de controle de distorção SAOC 400.
O sistema de controle de distorção SAOC 400 25 compreende um codificador SAOC 410 e um decodificador/transcodificador SAOC 420.
O codificador SAOC 410 é configurado para receber uma pluralidade de sinais de objeto de áudio 412a a 412N e para fornecer, com base nisso, um sinal downmix 414. 0 sinal downmix 414 pode, por exemplo, ser equivalente à representação de sinal downmix 110, e pode ser um sinal de 1 canal ou um sinal multicanal, tal como, por exemplo, um sinal de 2 canais.
O codificador SAOC 410 também é configurado para fornecer uma informação paramétrica relacionada ao objeto 416, que compreende, por exemplo, parâmetros SAOC. Os parâmetros SAOC podem, por exemplo, descrever as características dos sinais de objeto de áudio 412a a 412N. Por exemplo, os parâmetros SAOC podem 10 descrever as diferenças de nivel de objeto (OLDs) dos objetos de áudio representados pelos sinais de objeto de áudio 412a a 412N. Da mesma forma, os parâmetros SAOC podem descrever uma correção entre objeto IOC dos objetos de áudio representados pelos sinais de objeto de áudio 412a a 412N. Da mesma forma, os parâmetros SAOC 15 podem caracterizar o downmix, que é realizado para derivar o sinal downmix 414 ao combinar linearmente os sinais de objeto de áudio 412a a 412N. Por exemplo, os parâmetros SAOC podem descrever um ganho downmix DMG e diferenças de nível de canal downmix DCLD. Os parâmetros SAOC 416 podem, por exemplo, ser equivalentes à 20 informação paramétrica relacionada ao objeto 112.
O decodificador SAOC 410 também pode fornecer um ou mais parâmetros de limitador de distorção 418, que podem ser considerados como um ou mais parâmetros de controle de limitação de distorção, e que podem ser equivalentes aos parâmetros de 25 controle de limitação de distorção 116.
A representação de sinal downmix 414, os parâmetros SAOC 416 e os parâmetros de limitador de distorção 418 são transmitidos a partir do codificador SAOC 410 ao decodificador SAOC e/ou transcodificador SAOC 420. Tipicamente, a representação de sinal downmix 414 (preferivelmente de uma forma codificada), os parâmetros SAOC 416 (tipicamente de uma forma codificada) e os parâmetros de limitador 5 de distorção 418 (tipicamente n forma codificada) são todos incluídos em uma representação de corrente de bit do conteúdo de áudio. Em outras palavras, o codificador SAOC 410 fornece uma corrente de bit que inclui os parâmetros 414, 416, 418.
O decodificador SAOC ou transcodificador SAOC ou decodificador/transcodificador SAOC 420 recebe a representação de sinal downmix 414, os parâmetros SAOC 416, e um ou mais parâmetros de limitador de distorção 418. O decodificador/transcodificador SAOC 420 pode, por exemplo, realizar a funcionalidade do decodificador SAOC 820 de acordo com a Fig. 8, do decodificador SAOC 920 de acordo com a Fig. 9a, do decodificador e misturador integrados 950 de acordo com a Fig. 9b, ou do transcodificador SAOC para MPEG Surround 980 da Fig. 9c.
Entretanto, além dos referidos decodificadores ou transcodificadores SAOC, o decodificador/transcodificador SAOC 420 20 compreende um limitador de distorção 422, que é configurado para receber e avaliar um ou mais parâmetros de limitador de distorção 418. Além do mais, o decodificador/transcodificador SAOC 420 pode ser configurado para também receber uma informação de interação/controle 424 que representa, por exemplo, uma escolha do usuário dos parâmetros desejados de prestação. O decodificador/transcodificador SAOC 420 é consequentemente configurado para fornecer uma representação de sinal upmix, por exemplo, na forma de uma pluralidade de canais decodificados de sinal de áudio 428a a 428M.
O decodificador/transcodificador SAOC 420 é configurado para aplicar os fatores de ganho ou parâmetros de prestação para derivar a representação de sinal upmix 428a a 428M 5 a partir do sinal downmix 414. Por exemplo, o decodificador/transcodificador SAOC 420 pode ser configurado para multiplicar os componentes de sinal (p.ex., valores de dominio espectral) representando o sinal downmix 414 (que pode ser um sinal de 1 canal downmix ou um sinal de 2 canais downmix) com uma 10 pluralidade de valores correspondentes de ganho (p.ex., uma matriz dos valores de ganho) para derivar os sinais de canal de áudio 428a a 428M a partir da representação de sinal downmix. Por exemplo, uma combinação linear de dois ou mais canais da representação de sinal downmix 414 pode ser formada para obter uma 15 representação de um dos sinais de canal de áudio 428a a 428M.
Alternativamente, ou além disso, um conjunto de parâmetros de prestação pode ser aplicado para mapear uma representação de um ou mais sinais downmix 414 nos sinais de canal de áudio 428a a 428M. Neste caso, os parâmetros de prestação podem ser usados para 20 computar a regra de mapeamento para mapeamento da representação de um ou mais sinais downmix 414 nos sinais de canal de áudio 428a a 428M. Por exemplo, os parâmetros de prestação podem servir como fatores lineares ao determinar tal regra de mapeamento. Entretanto, uma diferente aplicação dos parâmetros de prestação 25 também pode ser possivel em algumas realizações.
4.2 Técnicas de Limitação de Distorção
A seguir, algumas técnicas para a limitação de distorção serão descritas, que podem ser aplicadas no decodificador/transcodificador SAOC 420 e também nos decodificadores ou transcodificadores SAOC 100, 200, 300.
A limitação de distorção pode ser atingida ao limitar a faixa de valor de alguns dos parâmetros no sistema de 5 decodificador/transcodificador SAOC. Aqui, os parâmetros referem- se aos coeficientes, fatores de ganho ou elementos de matriz no sistema que não diretamente representam as amostras de áudio, porém afetam as amostras de áudio de saída por um esquema matemático em SAOC. Pode ser de interesse especial a aplicação da limitação nos parâmetros de transcodificação (i.e., os elementos individuais na matriz de transcodificação). Isso é computacionalmente eficiente, pois a matriz de transcodificação não cresce com o número de objetos. A matriz de transcodificação 15 pode descrever um mapeamento de sinais de canal de áudio da representação de sinal downmix nos sinais de canal de áudio da representação de sinal upmix.
O limitador de distorção no decodificador/transcodificador SAOC, que é mostrado, por exemplo, 20 nas Figs. 2 e 7, realiza sua limitação da faixa de parâmetro com base em um ou mais constantes de limitação de ganho. Os parâmetros que são sujeitos â limitação podem ser fatores de ganho a serem aplicados à s amostras de áudio. Então, uma ou mais constantes de limitação de ganho podem ser expressos como uma faixa de nível de 25 ganho em decibéis.
Por exemplo, uma constante de limitação de ganho de q = 10 dB pode ser usada para limitar a faixa do parâmetro, p de acordo com:
Figure img0001
Aqui, p' é definido como um novo parâmetro limitado (para substituir p) . Ambos p, p' e q são aqui expressos como valores logarítmicos (decibel),
Deve ser observado aqui que o valor p' pode, por exemplo, representar os parâmetros ajustados upmix 132, e que os valores p podem ser obtidos em dependência da informação de prestação. A limitação da faixa dos valores p' pode, por exemplo, ser realizada pelo esquema de controle de distorção, e o limitador 10 de distorção 140 pode ajustar o parâmetro q (que pode ser considerado um parâmetro de ajuste de esquema de controle de distorção) em dependência do parâmetro de controle de limitação de distorção 116. A regra acima para obter p' pode ser considerada como um esquema ajustável de controle de distorção, que é ajustado 15 em dependência do parâmetro de ajuste de esquema de controle de distorção q.
Uma abordagem mais avançada é a de permitir a constante de limitação de ganho, q define o desvio permitido máximo de outro nível de referência para o parâmetro. Esse nível 20 de referência poderia, por exemplo, ser derivado de uma versão regular/filtrada/ponderada (regular/fíltrada/ponderada ao longo do eixo de tempo) da sequência de parâmetro (conforme atualizado, p.ex., uma ou diversas vezes cada estrutura SAOC). Então, a limitação pode ser definida de acordo com:
Figure img0002
Aqui, p'' é definido como o novo parâmetro limitado mais avançado (para substituir p), e r é definido como a versão regular/filtrada/ponderada (regular/filtrada/ponderada ao longo do eixo de tempo) da sequência de parâmetro de p. Ambos, p, 5 p'', r e q são aqui expressos como valores logarítmicos (decibel).
Por exemplo, o valor p' ' pode representar um ou mais parâmetros ajustados 132 (por exemplo, parâmetros ajustados de transcodificação ou parâmetros ajustados de prestação). 0 valor p pode ser obtido, por exemplo, em dependência da informação de 10 prestação 114 e opcionalmente, outra informação, tal como, por exemplo, a informação a partir da representação de sinal downmix 110 ou a informação a partir da informação paramétrica relacionada ao objeto 112.
A limitação dos valores de p, para obter p"', 15 pode ser realizada pelo esquema de controle de distorção, e o parâmetro q pode ser ajustado pelo limitador de distorção 140 em dependência do parâmetro de controle de limitação de distorção 116. Adicionalmente, uma constante de tempo de uniformização/filtragem/ponderação, que é usada para obter r por 20 uniformização dos valores de p, também pode ser ajustada pelo limitador de distorção 140 em dependência de um ou mais dos parâmetros de controle de limitação de distorção.
Outro método de limitação somente opera na matriz de prestação. A matriz de prestação é uma interface de entrada (ou 25 quantidade de entrada) ao decodificador/transcodificador SAOC.
Consequentemente, esse método não exige qualquer modificação dentro do sistema de decodificador/transcodificador SAOC. Um simples método de limitação limita a faixa (define os valores mínimos e máximos) dos elementos de matriz de prestação.
Um método alternativo de limitação limita as modificações dos elementos de matriz de prestação relativos a uma referência de matriz de prestação. A referência de matriz de prestação pode ser, por exemplo, a matriz de prestação que resulta em um downmix inalterado como uma saida. Por exemplo, um parâmetro de limitação, q = 10 dB impede os elementos de matriz de prestação de desviar de determinado valor de referência (ou dos valores individuais de referência) mais do que ±10 dB (i.e., não inferior a um fator 10" (-10/20) , não mais do que um fator 10" (10/20)).
A faixa para os parâmetros (elementos de matriz) na matriz de prestação pode facilmente ser diferente para os objetos individuais, já que são bem isolados na matriz de prestação. Por exemplo, as seguintes faixas limitadas poderiam ser permitidas: - objeto de bateria: ±3 dB - objeto de baixo: ±10 dB - Objeto Mellotron: ±6 dB Objeto de guitarra 1: ±3dB • Objeto de guitarra 2: ±3dB - Objeto de vocal: ±0 dB - Objeto de flauta: ±12 dB
Em outras palavras, uma faixa de ajuste para parâmetros individuais de prestação pode ser ajustada (definida) individualmente, i.e., de uma forma individual de objeto. As faixas de variação individuais de objeto podem ser obtidas a partir de uma pluralidade de parâmetros de controle de limitação de distorção 116 que são incluídos na representação de corrente de bit do conteúdo de áudio e que são extraídas a partir da referida representação de corrente de bit do conteúdo de áudio por um analisador de corrente de bit. De forma correspondente, o - 5 codificador de áudio pode eficientemente encaminhar ao decodificador de áudio (p.ex., o mecanismo 100, 200, 300, 420) uma informação sobre as faixas de ajuste individuais de objeto. A provisão do lado do codificador das faixas de ajuste individuais de objeto provoca vantagens específicas devido ao fato de que os 10 tipos de objeto são conhecidos com boa exatidão no lado do codificador, de modo que o codificador é mais bem adequado para fornecer a informação confiável sobre as faixas permitidas de aj uste.
A seguir, a abordagem inventiva de limitação 15 flexível será discutida em detalhes adicionais.
Para superar as limitações dos conceitos convencionais, a presente invenção propõe o uso de orientação de dados do esquema de controle de distorção para desempenhar de forma ideal em cada situação. Esses dados (i.e., dados para 20 ajustar o esquema de controle de distorção, por exemplo, os parâmetros de controle de limitação de distorção) podem ser definidos no lado do codificador SAOC e são transmitidos na corrente de bit SAOC para estarem posteriormente disponíveis para o esquema de controle de distorção no 25 decodificador/transcodificador SAOC. Isso é ilustrado na Fig. 4 (e também pode ser visto nas Figs. 1, 2 e 3)
Os dados transmitidos ("parâmetros rotulados de limitador de distorção" na Fig. 4 e designados como parâmetros de controle de limitação de distorção 116 nas Figs, 1, 2 e 3) podem incluir informação sobre:
Valores limitantes de parâmetro: o p.ex., a constante de limitação de ganho, q foi explicada nos exemplos acima; o p.ex., uma faixa limitante ou faixas limitantes (p.ex., valores minimos e máximos) dos elementos de matriz de prestação; o p.ex., uma faixa limitante ou faixas limitantes dos elementos de matriz de prestação relativos a uma referência de matriz de prestação (p.ex., a matriz de prestação que resulta em um downmix inalterado como saida); o p.ex., uma constante de tempo para um filtro de uniformização que é usada para derivar o nivel de referência do parâmetro (a ser limitado) a partir de uma versão regular/filtrada/ponderada do parâmetro; Casos especiais de limitação: o nenhuma modificação permitida de nenhum modo (funcionalidade de prestação de SAOC desativada temporária); o somente pré-ajustes de matriz de prestação (lidos a partir da corrente de bit) permitidos; o sem limitações (limitador de prestação de SAOC desativado temporário); o quaisquer parâmetros limitantes de controle de distorção a partir do modelo psico-acústico de medição de distorção discutido em algum controle de distorção.
Para resumir o acima, uma constante de limitação de ganho q, que é usada para limitar uma faixa numérica de um ou mais fatores de ganho ou um ou mais elementos de matriz de prestação pode ser extraida a partir da corrente de bit SAOC.
Alternativamente, ou além disso, um ou mais parâmetros limitando uma faixa de um elemento de matriz de prestação, ou limitando as faixas dos elementos de matriz de prestação (p.ex., de uma forma individual de objeto) podem ser extraidos a partir da corrente de bit SAOC.
Alternativamente, ou além disso, um ou mais parâmetros limitando uma faixa dé um elemento de matriz de prestação relativa a uma referência de matriz de prestação ou faixas limitantes dos elementos de matriz de prestação relativos a uma referência de matriz de prestação podem ser extraidos a partir da corrente de bit SAOC.
Alternativamente, ou além disso, uma constante de tempo para um filtro de uniformização que é usada para derivar o nivel de referência do parâmetro a ser limitado pode ser extraida a partir da corrente de bit SAOC.
Em alguns casos, a corrente de bit pode compreender um parâmetro ou bandeira indicando que a funcionalidade de prestação SAOC deve ser desativada.
Alternativamente, ou além disso, a corrente de bit SAOC pode compreender um parâmetro ou bandeira indicando que uma matriz de prestação pré-ajustada, que é descrita pela corrente de bit SAOC, ou um de uma pluralidade de matrizes pré-ajustadas de prestação descritas pela corrente de bit, deve ser usada para prestação da representação de sinal upmix, ao invés de uma entrada de matriz de prestação fornecida pelo usuário via uma interface de usuário. De forma correspondente, a liberdade do usuário de definir uma matriz de prestação definida por usuário pode ser * temporariamente desativada pelo9 decodificador/transcodificador de áudio, se o decodificador/transcodificador de áudio identificar essa condição com base em um parâmetro de corrente de bit ou uma , 5 bandeira de corrente de bit.
Alternativamente, ou adicionalmente, a corrente de bit SAOC pode compreender uma bandeira ou parâmetro indicando que o limitador de distorção SAOC deve ser temporariamente desativado, de modo que não existam limites de distorção.
Alternativamente, ou além disso, a corrente de bit SAOC pode compreender um parâmetro para ajustar a limitação de distorção com base em um modelo psico-acústico de medição de distorção. Dessa forma, o limitador de distorção pode ajustar um esquema de controle de distorção, que é com base em um modelo de distorção psico-acústico, em dependência de um parâmetro extraido a partir da corrente de bit SAOC. Por exemplo, o limitador de distorção pode ajustar quaisquer dos esquemas de limitação de distorção descritos em PTC/EP 2010/055717 (e também em US 61/173.456) em dependência de um parâmetro de controle de limitação de distorção extraido a partir da corrente de bit SAOC.
4.3 Vantagens da Abordagem de Limitação Flexivel
A sinalização inventiva dos dados de esquema de controle de distorção SAOC, que foi descrito em detalhes acima, pode potencialmente resolver todas as limitações das abordagens 25 convencionais de controle de distorção.
Deve ser observado que existem limitações de abordagens convencionais de controle de distorção devido à falta de flexibilidade, que podem ser superadas nas realizações de acordo com a invenção. Algumas dessas limitações, que podem ser superadas usando as realizações da invenção, são:
Os parâmetros de controle de distorção no controle convencional de distorção não se adaptam para serem 5 ideais para cada situação.
Foi averiguado que a escolha dos parâmetros de controle de distorção que são ideais (a partir de uma qualidade do áudio/qualidade do ponto de vista do serviço) é frequentemente dependente de, por exemplo: o tipo de conteúdo: fala, música (rock/clássica), pista de áudio de filme, etc. o propriedades de sinal de baixo nivel: transitórios, estrutura harmônica para som, declive espectral, estrutura fina dinâmica (envelope de energia temporal 15 rápido/lento), etc. o propriedades SAOC: número de objetos controláveis presentes no downmix, grau de separação de objeto/sobreposição em tempo/frequência/canal downmix, etc. o propriedades do sistema: tipo de codec downmix (mp3, AAC, PCM, etc. ) e taxa de bit (indicando qualidade geral do áudio e distorção no downmix), presença de partes codificadas paramétricas no downmix (p.ex., SBR, conforme incluido em HE-AAC, vide referências [SBR1],[SBR2], ou estéreo paramétrico, conforme descrito na referência [PS]), configuração de canal (mono, estéreo, multicanal), largura de banda de áudio, taxa de amostragem, etc.
Os parâmetros de controle de distorção são imprecisos, pois os objetos originais de áudio não estão normalmente disponíveis no lado do decodificador SAOC.
Foi averiguado que a extração dos parâmetros de controle de distorção pode beneficiar-se da análise dos objetos de áudio originais (discretos) já que são limpos/não distorcidos e 5 não parametricamente decompostos a partir do downmix. Esses objetos originais não estão normalmente disponíveis no lado do decodificador SAOC.
Um codificador de áudio convencional não tem possibilidade de garantir uma qualidade de prestação do lado do 10 decodificador.
Foi averiguado que, para algumas aplicações SAOC, é desejável definir um nível mínimo de qualidade a partir do lado do codificador. Foi averiguado que é então desejado que esse nível mínimo de qualidade seja atingido independente da interação do 15 usuário (escolha da matriz de prestação e configuração de reprodução) no lado do decodificador. Enquanto algum controle de distorção tem o objetivo, em um nível constante de qualidade definido no lado do decodificador SAOC, pode ser desejável ter diferentes níveis de qualidade para diferentes serviços (p.ex., 20 teleconferência, download de música de alta qualidade, aplicações de radiodifusão) devido a, por exemplo, integridade do artista, reputação/perfil do prestador de serviço, expectativa das habilidades do usuário (nível de funcionalidade de interface de usuário versus facilidade de usar).
A sinalização inventiva dos dados de esquema de controle de distorção SAOC (p.ex., a partir de um codificador de áudio a um decodificador de áudio via uma corrente de bit) pode potencialmente resolver todas as limitações acima discutidas. Por exemplo, o decodificador SAOC pode usar diferentes configurações de limitação de distorção (diferentes configurações limitantes de qualidade/funcionalidade que são descritas, por exemplo, pelo parâmetro de controle de limitação de distorção 116 ou os * 5 parâmetros de limitador de distorção 418) para, p.ex., aplicações de teleconferência, aplicações de controle de diálogo (em livros de áudio ou radiodifusão) , aplicativos de nova mistura de música ("música 2.0").
A presente invenção fornece o desempenho 10 melhorado adicional e funcionalidades ao utilizar a sinalização na corrente de bit para orientar o processo de controle de distorção.
5 . Exemplo de Referência
A seguir, um exemplo de referência para controle de distorção SAOC será descrito com referência à Fig. 7, que não traz todas as vantagens inventivas. 0 sistema 700 de acordo com a Fig. 7 compreende um codificador SAOC 710 e um decodificador/transcodificador SAOC 720. O codificador SAOC 710 recebe uma pluralidade de sinais de objeto de áudio 712a a 712N e fornece, com base nisso, um sinal downmix 714, e parâmetros SAOC 718. 0 decodificador/transcodificador SAOC 720 recebe o sinal downmix 714 (que será um sinal de 1 canal ou um sinal multicanal) e os parâmetros SAOC 718 a partir do codificador SAOC 710. O decodificador/transcodificador SAOC 720 fornece, com base nisso, uma pluralidade de canais de sinal de áudio 728a a 728M. Para essa finalidade, o decodificador/transcodificador SAOC 720 pode usar um limitador de distorção 722 e pode considerar uma informação de interação ou informação de controle 724 que é recebida, p.ex., a partir de uma interface de usuário.
Entretanto, o sistema 700 de acordo com a Fig. 7 tipicamente provoca distorções audiveis em alguns casos.
6 . Mecanismo para Fornecer uma Corrente de Bit Representando um Sinal Multicanal de Áudio, de Acordo com a Fig. 5
A seguir, um mecanismo para fornecer uma representação de corrente de bit de um sinal de áudio multicanal será descrito com referência à Fig. 5, que mostra um diagrama esquemático em bloco de tal mecanismo 500.
O mecanismo 500 é configurado para receber uma 10 pluralidade dos sinais de objeto de áudio 510a a 510N. Da mesma forma, o mecanismo 500 é configurado para fornecer uma corrente de bit 520 representando o sinal de áudio multicanal.
O mecanismo 500 compreende um downmixer 530, que é configurado para fornecer um sinal downmix 532 com base na 15 pluralidade dos sinais de objeto de áudio 510a a 510N. O mecanismo 500 também compreende um prestador de informação lateral 540, que é configurado para fornecer uma informação lateral paramétrica relacionada ao objeto 542 descrevendo as características dos sinais de objeto de áudio 510a a 510N e parâmetros downmix 20 aplicados pelo downmixer 530. O prestador de informação lateral é configurado para também fornecer um ou mais parâmetros de controle de limitação de distorção 544 para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo para fornecer uma representação de sinal upmix. O mecanismo 500 também 25 compreende um formatador de corrente de bit 550, que é configurado para fornecer a corrente de bit 520 compreendendo uma representação do sinal downmix 532, a informação lateral paramétrica relacionada ao objeto 542 e um ou mais parâmetros de controle de limitação de distorção 544.
De forma correspondente, o mecanismo 500 fornece uma corrente de bit 520 que compreende a informação necessária para ajustar o esquema de controle de distorção 142, 242, 342, no mecanismo 100, 200, 300, e o limitador de distorção 422 no mecanismo 420.
O prestador de informação lateral 540 pode ser configurado para fornecer o parâmetro de controle de limitação de distorção 544 em dependência das propriedades de objeto de áudio dos sinais de objeto de áudio 510a a 510N. Por exemplo, o prestador de informação lateral pode fornecer o parâmetro de controle de limitação de distorção 544 em dependência de uma informação do tipo de conteúdo obtida com base nos sinais de objeto de áudio 510a a 510N, ou fornecida usando uma informação lateral (p.ex., entrada via uma interface de usuário).
Alternativamente, ou além disso, o prestador de informação lateral 540 pode fornecer os parâmetros de controle de limitação de distorção em dependência de propriedades de baixo nivel, por exemplo, informação sobre transitórios, informação sobre uma estrutura harmônica para som, informação sobre um declive espectral, informação sobre uma estrutura fina dinâmica, etc., de um ou mais dos sinais de objeto de áudio 510a a 510N.
Alternativamente, ou além disso, o prestador de informação lateral 540 pode fornecer os parâmetros de controle de limitação de distorção em dependência das propriedades SAOC, tal como, um número de objetos controláveis presentes no sinal downmix 532, ou em dependência da presença das partes codificadas paramétricas no downmix, ou em dependência de uma configuração de canal, ou em dependência de largura de banda de áudio, ou em dependência de uma taxa de amostragem.
O prestador de informação lateral 540 pode beneficiar-se de uma análise dos objetos de áudio originais ("discretos") (ou sinais de objeto de áudio 510a a 510N) com a finalidade de fornecer os parâmetros de controle de limitação de distorção 544. O prestador de informação lateral 540 pode, por exemplo, ajustar os parâmetros de controle de limitação de distorção para variavelmente definir um nivel minimo de qualidade da prestação de um sinal de áudio representado pela corrente de bit 520.
Para resumir, o mecanismo 500 para fornecer uma representação de corrente de bit de um sinal de áudio multicanal pode fornecer a corrente de bit 52 0 de modo que a corrente de bit 520 compreende um ou mais parâmetros de controle de limitação de distorção 544 e, consequentemente, permite um ajuste da qualidade de prestação. Para essa finalidade, as características dos sinais de objeto de áudio 510a a 510N podem ser consideradas, e a informação lateral adicional ou entrada de usuário a partir da interface de usuário também pode ser considerada para o cenário dos parâmetros de controle de limitação de distorção 544.
7 .Corrente de bit
A seguir, uma corrente de bit 600 representando um sinal de áudio multicanal será descrito.
A corrente de bit 600 compreende uma representação 610 de um sinal downmix (p.ex., do sinal downmix 532, que pode ser equivalente à representação de sinal downmix 110, 414) . A corrente de bit 600 também compreende uma informação lateral paramétrica relacionada ao objeto 620, que pode ser uma informação lateral SAOC. A informação lateral de parâmetro relacionada de objeto 620 pode, por exemplo, compreender uma informação de diferença de nivel de objeto 622, uma informação de 5 correlação entre objeto 624, uma informação de ganho downmix 626 e uma informação de diferença de nivel de canal downmix 628, cuja informação lateral é bera conhecida a partir do campo de codificação de objeto de áudio espacial (SAOC). A corrente de bit 600 também compreende um ou mais parâmetros de controle de 10 limitação de distorção 630, conforme acima descrita.
Deve ser observado que os dados inventivos de esquema de controle de distorção (i.e., os parâmetros de controle de limitação de distorção 630, 116, 418) podem ser transmitidos no cabeçalho da corrente de bit SAOC (p.ex., em uma porção de 15 configuração especifica de SAOC da corrente de bit SAOC, que é nominada "SAOCSpecificConfig()") para um overhead minimo de taxa de dados. Entretanto, os dados inventivos de esquema de controle de distorção também podem ser transmitidos nos dados de carga útil (p.ex., nos dados de estrutura SAOC, que são tipicamente 20 denominados "SAOCFrame()")para ativar uma sinalização variante de tempo (p.ex., controle adaptável de sinal).
Tipicamente, porém não necessariamente, um bom local para colocar os dados de esquema de controle de distorção pode ser usando o mecanismo de extensão na corrente de bit SAOC: 25 em algumas realizações, os dados de esquema de controle de distorção (ou pelo menos uma parte dos dados de esquema de controle de distorção) podem ser colocados nas seções de sintaxe denominados "SAOCExtensionConfig()" e "SAOCExtensionFrame()" para o cabeçalho e o caso de carga útil, respectivamente.
Em outras palavras, em algumas realizações, os dados de esquema de controle de distorção podem ser incluídos no cabeçalho SAOC, que é tipicamente incluído na corrente de bit uma vez por peça de áudio. Alternativamente, ou além disso, os dados de esquema de controle de distorção podem ser incluídos nos dados de estrutura da corrente de bit SAOC. De forma correspondente, os dados de esquema de controle de distorção podem ser transmitidos uma vez por estrutura de áudio. Uma bandeira no cabeçalho SAOC, que compreende a configuração SAOC, pode indicar quais das duas soluções (somente dados de esquema de controle de distorção no cabeçalho ou dados de esquema de controle de distorção dentro dos dados de estrutura de áudio) são aplicadas.
Da mesma forma, em algumas realizações, os dados de esquema de controle de distorção somente podem ser incluídos em algumas das estruturas de áudio, caracterizados pelo fato de que podem ser sinalizados usando um parâmetro ou bandeira do qual as estruturas de áudio compreendem os dados de esquema de controle de distorção. De forma correspondente, os dados de esquema de controle de distorção SAOC podem ser transferidos em intervalos irregulares de tempo dentro de uma única peça de áudio (da qual uma única porção de configuração SAOC é associada).
8 . Alternativas de Implantação
Embora alguns aspectos foram descritos no contexto de um mecanismo, é claro que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa de método ou um recurso de uma etapa de método. De forma análoga, os aspectos descritos no contexto de uma etapa de método também representam uma descrição de um bloco, item ou recurso correspondente de um mecanismo correspondente. Algumas ou todas as etapas de método podem ser executadas por (ou usando) um mecanismo de hardware, 5 como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas realizações, algumas ou mais das etapas de método mais importantes podem ser executadas por tal mecanismo.
O sinal codificado inventivo de áudio pode ser armazenado em uma midia de armazenamento digital ou pode ser transmitido em uma midia de transmissão, tais como, uma midia de transmissão sem fio ou uma midia de transmissão com fio, tal como, a Internet.
Dependendo de determinadas exigências de implantação, as realizações da invenção podem ser implantadas em hardware ou em software. A implantação pode ser realizada usando uma midia de armazenamento digital, por exemplo, um disco flexivel, um DVD, um Blue-Ray, um CD, um ROM, um PROM, um EPROM, um EEPROM ou uma memória FLASH, tendo sinais de controle eletronicamente legiveis lá armazenados, que cooperam (ou são capazes de cooperar) com um sistema de computador programável de modo que o respectivo método é realizado. Portanto, a midia de armazenamento digital pode ser legível por computador.
Algumas realizações de acordo com a invenção compreendem um portador de dados tendo sinais de controle eletronicamente legiveis, que são capazes de cooperar com um sistema de computador programável, de modo que um dos métodos aqui descritos é realizado. r
De modo geral, as realizações da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto de t 5 programa de computador opera em um computador. O código de programa pode, por exemplo, ser armazenado em um portador legivel por máquina.
Outras realizações compreendem o programa de computador para realizar um dos métodos aqui descritos, 10 armazenados em um portador legivel por máquina.
Em outras palavras, uma realização do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos aqui descritos, quando o programa de computador opera em um computador.
Uma realização adicional dos métodos inventivos é, portanto, um portador de dados (ou uma midia de armazenamento digital, ou uma midia legivel por computador) compreendendo, lá registrado, o programa de computador para realizar um dos métodos aqui descritos. O portador de dados, a midia de armazenamento 20 digital ou a midia gravada são tipicamente tangíveis e/ou não transitórios.
Uma realização adicional do método inventivo é, portanto, uma corrente de dados ou uma sequência de sinais representando o programa de computador para realizar um dos 25 métodos aqui descritos. A corrente de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido via uma conexão de comunicação de dados, por exemplo, via a Internet.
Uma realização adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos aqui descritos.
Uma realização adicional compreende um computador tendo lá instalado o programa de computador para realizar um dos métodos aqui descritos.
Em algumas realizações, um dispositivo lógico programável (por exemplo, um arranjo de porta programável em campo) pode ser usado para realizar algumas ou todas as 10 funcionalidades dos métodos aqui descritos. Em algumas realizações, um arranjo de porta programável em campo pode cooperar com um microprocessador com a finalidade de realizar um dos métodos aqui descritos. De modo geral, os métodos são preferivelmente realizados por qualquer mecanismo de hardware.
As realizações acima descritas são meramente ilustrativas para os princípios da presente invenção. Fica entendido que as modificações e variações das disposições e os detalhes aqui descritos serão aparentes por outros com habilidade na técnica. É a intenção, portanto, de ser somente limitado pelo 20 escopo das reivindicações iminentes de patente e não pelos detalhes específicos apresentados por meio de descrição e explicação das realizações no presente.
9. Conclusão
Para resumir o acima, as realizações de acordo com a invenção criam uma sinalização de controle de distorção na codificação de objeto de áudio espacial SAOC MPEG.
As realizações de acordo com a presente invenção fornecem o desempenho melhorado adicional e funcionalidades ao utilizar uma sinalização na corrente de bit para orientar o processo de distorção.
As realizações preferidas de acordo com a invenção compreendem, métodos, mecanismo ou programas de computador 5 para codificar ou decodificar um sinal de áudio conforme acima discutido. As realizações adicionais de acordo com a invenção compreendem um sinal codificado gerado conforme acima discutido, ou conforme usado por um decodificador ou método de decodificação conforme acima discutido.

Claims (17)

1. Um mecanismo (100; 200; 300; 400) para fornecer uma representação de sinal upmix (120; 428a-428M) com base em uma representação de sinal downmix (110, 414) e uma informação paramétrica relacionada ao objeto (112; 416), que são incluídas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação (114; 424), o mecanismo compreendendo: um limitador de distorção (140; 240; 340; 422) configurado para ajustar os parâmetros upmix usando um esquema de controle de distorção (142) para evitar ou limitar as distorções audíveis que são causadas por uma escolha inadequada de parâmetros de prestação (114; 424), caracterizado por o limitador de distorção ser configurado para obter um parâmetro de controle de limitação de distorção (116; 418; q) que é incluído na representação de corrente de bit do conteúdo de áudio, e para ajustar o esquema de controle de distorção em dependência do parâmetro de controle de limitação de distorção; sendo que o limitador de distorção é configurado para avaliar uma bandeira de atualização dinâmica dentro de uma porção de configuração da representação de corrente de bit do conteúdo de áudio, e sendo que o limitador de distorção é configurado para avaliar a porção de configuração da representação de corrente de bit do conteúdo de áudio, para obter o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e para avaliar uma porção de estrutura da representação de corrente de bit do conteúdo de áudio, para repetidamente obter as atualizações do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa.
2. O mecanismo (100; 200; 300; 400) de acordo com a reivindicação 1, caracterizado por o mecanismo para fornecer uma representação de sinal upmix é configurado para receber uma informação de matriz desejada de prestação (114; 424) a partir de uma interface de entrada; sendo que o limitador de distorção (140; 240; 340; 422) é configurado para obter uma informação de matriz modificada de prestação (132; p’; p’’) em dependência da informação de matriz desejada de prestação e um ou mais parâmetros de controle de limitação de distorção (116; 418; q); e sendo que o mecanismo para fornecer a representação de sinal upmix é configurado para fornecer a representação de sinal upmix (120; 428a-428M) em dependência da informação de matriz modificada de prestação.
3. O mecanismo (100; 200; 300; 400) de acordo com a reivindicação 2, caracterizado por o limitador de distorção ser configurado para obter um ou mais valores de limite de matriz de prestação (r, q), que são incluídos na representação de corrente de bit do conteúdo de áudio e que descrevem os valores mínimos e máximos de elementos de matriz de prestação, e para limitar uma ou mais entradas da informação de matriz modificada de prestação (132; p’; p’’) em conformidade com um ou mais valores de limite de matriz de prestação (r, q) ao obter a informação de matriz modificada de prestação em dependência da informação de matriz desejada de prestação.
4. O mecanismo (100; 200; 300; 400) de acordo com a reivindicação 2 ou reivindicação 3, caracterizado por o limitador de distorção ser configurado para obter a informação de matriz modificada de prestação (132; p’; p’’) em dependência da informação de matriz desejada de prestação (114; 424), uma informação de matriz de prestação de referência (r) e um ou mais parâmetros de controle de limitação de distorção (q).
5. O mecanismo (100; 200; 300; 400) de acordo com a reivindicação 4, caracterizado por o limitador de distorção ser configurado para limitar uma ou mais entradas (p’, p’’) da matriz modificada de prestação (132) relativa à informação de matriz de prestação de referência (r) em conformidade com um ou mais valores de limite de matriz de prestação (q).
6. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 2 a 5, caracterizado por o limitador de distorção ser configurado para aplicar os parâmetros individuais de controle de limitação por distorção de objeto (q), com a finalidade de obter a informação de matriz modificada de prestação em dependência da informação de matriz desejada de prestação.
7. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 6, caracterizado por o mecanismo para fornecer uma representação de sinal upmix ser configurado para aplicar um ou mais fatores modificados de ganho (p’, p’’) às amostras de áudio da representação de sinal downmix (110, 414), ou a uma informação lateral relacionada de objeto associada aos objetos de áudio descritos pelo sinal downmix, para fornecer a representação de sinal upmix (120; 428a-428M) em dependência dos fatores de ganho, e sendo que o limitador de distorção é configurado para obter um ou mais fatores modificados de ganho (p’, p’’) em dependência de um ou mais fatores desejados de ganho (p) e um ou mais parâmetros de controle de limitação de distorção (116; 418; q).
8. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 7, caracterizado por o limitador de distorção ser configurado para derivar um nível de referência (r) para um fator de ganho a ser limitado usando um filtro de uniformização tendo uma constante de tempo, sendo que o limitador de distorção é configurado para usar o nível de referência (r) para limitar determinado fator, e sendo que o limitador de distorção é configurado para obter um parâmetro de constante de tempo, que é incluído na representação de corrente de bit do conteúdo de áudio, e para ajustar a constante de tempo de filtro de uniformização em dependência do parâmetro de constante de tempo.
9. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 8, caracterizado por o limitador de distorção ser configurado para obter um parâmetro de ativação de controle de distorção, que é incluído na representação de corrente de bit do conteúdo de áudio, e para ativar ou desativar o esquema de controle de distorção em dependência do parâmetro de ativação de controle de distorção.
10. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 9, caracterizado por o limitador de distorção ser configurado para obter um parâmetro de ativação de matriz de prestação pré-definido, que é incluído na representação de corrente de bit do conteúdo de áudio, e sendo que o limitador de distorção é configurado para exercer, em resposta a um estado ativo do parâmetro de ativação de matriz de prestação pré-definido, que uma informação de matriz de prestação pré-definida incluída na representação de corrente de bit do conteúdo de áudio, ao invés de uma informação de matriz de prestação específica de usuário, é usado para fornecer a representação de sinal upmix com base na representação de sinal downmix.
11. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 10, caracterizado por o limitador de distorção é configurado para obter um parâmetro de limitação de distorção psico-acústico, que é incluído na representação de corrente de bit do conteúdo de áudio, sendo que o limitador de distorção é configurado para ajustar um ou mais parâmetros upmix em dependência de um modelo de distorção psico-acústico, de modo que uma medição de distorções causadas pela derivação da representação de sinal upmix a partir da representação de sinal downmix é limitada, e sendo que o limitador de distorção é configurado para definir um ou mais parâmetros usados para ajustar um ou mais parâmetros upmix em dependência do modelo de distorção psico- acústico, ou um ou mais parâmetros do modelo de distorção psico- acústico, em dependência do parâmetro de limitação de distorção psico-acústico.
12. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 11, caracterizado por o limitador de distorção ser configurado para obter um parâmetro atualizado de controle de limitação de distorção uma vez por estrutura de áudio, para obter um esquema de controle de distorção de variante de tempo.
13. O mecanismo (100; 200; 300; 400) de acordo com uma das reivindicações 1 a 12, caracterizado por o limitador de distorção ser configurado para seletivamente atualizar o parâmetro de controle de limitação de distorção em dependência de uma bandeira indicando a presença de um parâmetro de controle de limitação de distorção em uma porção de estrutura da representação de corrente de bit do conteúdo de áudio, de modo que os intervalos de atualização para o parâmetro de controle de limitação de distorção são determinados dinamicamente pela representação de corrente de bit do conteúdo de áudio.
14. Um mecanismo (500) para fornecer uma corrente de bit (520) representando um sinal de áudio multicanal, o mecanismo compreendendo: um downmixer (530) configurado para fornecer um sinal downmix (532) com base em uma pluralidade de sinais de objeto de áudio (510a-510N); um prestador de informação lateral (540) configurado para fornecer uma informação lateral paramétrica relacionada ao objeto (542) descrevendo as características dos sinais de objeto de áudio (510a-510N) e parâmetros downmix, e um ou mais parâmetros de controle de limitação de distorção (544) para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo (100; 200; 300; 400) para fornecer uma representação de sinal upmix; e um formatador de corrente de bit (550) configurado para fornecer uma corrente de bit (520) compreendendo uma representação do sinal downmix (532), a informação lateral paramétrica relacionada ao objeto (542) e um ou mais parâmetros de controle de limitação de distorção (544); caracterizado por o mecanismo ser configurado para fornecer a corrente de bit de modo que uma porção de configuração da corrente de bit compreende uma bandeira de atualização dinâmica, e de modo que a porção de configuração da corrente de bit compreende o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e de modo que uma porção de estrutura da corrente de bit compreende as atualizações repetidas do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa.
15. Um método para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação paramétrica relacionada ao objeto, que são incluídas em uma representação de corrente de bit de um conteúdo de áudio, e em dependência de uma informação de prestação, o método compreendendo: ajustar os parâmetros upmix usando um esquema de controle de distorção, para evitar ou limitar as distorções audíveis que são causadas por uma escolha inadequada de parâmetros de prestação, caracterizado por um parâmetro de controle de limitação de distorção, que é incluído na representação de corrente de bit do conteúdo de áudio, é obtido, sendo que o esquema de controle de distorção é ajustado em dependência do parâmetro de controle de limitação de distorção, sendo que uma bandeira de atualização dinâmica dentro de uma porção de configuração da representação de corrente de bit do conteúdo de áudio é avaliada, e sendo que a porção de configuração da representação de corrente de bit do conteúdo de áudio é avaliada, para obter o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e sendo que uma porção de estrutura da representação de corrente de bit do conteúdo de áudio é avaliada, para repetidamente obter as atualizações do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa.
16. Um método para fornecer uma corrente de bit representando um sinal de áudio multicanal, o método compreendendo: derivar um sinal downmix com base em uma pluralidade de sinais de objeto de áudio; fornecer uma informação lateral paramétrica relacionada ao objeto descrevendo características dos sinais de objeto de áudio e parâmetros downmix; fornecer um ou mais parâmetros de controle de limitação de distorção para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo para fornecer uma representação de sinal upmix; e fornecer uma corrente de bit compreendendo uma representação do sinal downmix, a informação lateral paramétrica relacionada ao objeto e um ou mais parâmetros de controle de limitação de distorção, caracterizado por a corrente de bit ser fornecida de modo que uma porção de configuração da corrente de bit compreende uma bandeira de atualização dinâmica, e de modo que a porção de configuração da corrente de bit compreende o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e de modo que uma porção de estrutura da corrente de bit compreende as atualizações repetidas do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa.
17. Uma corrente de bit representando um sinal de áudio multicanal, a corrente de bit caracterizado por compreender: uma representação de um sinal downmix combinando os sinais de áudio de uma pluralidade de objetos de áudio; uma informação lateral paramétrica relacionada ao objeto descrevendo as características dos objetos de áudio; e um ou mais parâmetros de controle de limitação de distorção para controlar a aplicação de um esquema de controle de distorção no lado de um mecanismo para fornecer uma representação de sinal upmix; sendo uma porção de configuração da corrente de bit compreende uma bandeira de atualização dinâmica, e sendo a porção de configuração da corrente de bit compreende o parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for inativa, e sendo que a porção de estrutura da corrente de bit compreende as atualizações repetidas do parâmetro de controle de limitação de distorção, se a bandeira de atualização dinâmica for ativa.
BR112012009127-1A 2009-10-20 2010-10-19 Mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção BR112012009127B1 (pt)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US25323709P 2009-10-20 2009-10-20
US61/253,237 2009-10-20
US36926010P 2010-07-30 2010-07-30
EP10171418.6 2010-07-30
US61/369,260 2010-07-30
EP10171418 2010-07-30
PCT/EP2010/065671 WO2011048067A1 (en) 2009-10-20 2010-10-19 Apparatus for providing an upmix signal representation on the basis of a downmix signal representation, apparatus for providing a bitstream representing a multichannel audio signal, methods, computer program and bitstream using a distortion control signaling

Publications (2)

Publication Number Publication Date
BR112012009127A2 BR112012009127A2 (pt) 2020-08-18
BR112012009127B1 true BR112012009127B1 (pt) 2021-06-22

Family

ID=72242021

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112012009127-1A BR112012009127B1 (pt) 2009-10-20 2010-10-19 Mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção

Country Status (1)

Country Link
BR (1) BR112012009127B1 (pt)

Also Published As

Publication number Publication date
BR112012009127A2 (pt) 2020-08-18

Similar Documents

Publication Publication Date Title
KR101418661B1 (ko) 다운믹스 시그널 표현에 기초한 업믹스 시그널 표현을 제공하기 위한 장치, 멀티채널 오디오 시그널을 표현하는 비트스트림을 제공하기 위한 장치, 왜곡 제어 시그널링을 이용하는 방법들, 컴퓨터 프로그램 및 비트 스트림
US10861468B2 (en) Apparatus and method for encoding or decoding a multi-channel signal using a broadband alignment parameter and a plurality of narrowband alignment parameters
KR101849612B1 (ko) 새로운 미디어 장치 상에 내장된 라우드니스 메타데이터를 갖거나 또는 갖지 않고 미디어의 정규화된 오디오 재생을 위한 방법 및 장치
ES2777600T3 (es) Control de rango dinámico basado en metadatos extendidos de audio codificado
CA2781310C (en) Apparatus for providing an upmix signal representation on the basis of the downmix signal representation, apparatus for providing a bitstream representing a multi-channel audio signal, methods, computer programs and bitstream representing a multi-channel audio signal using a linear combination parameter
BR122021008670B1 (pt) Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio
BR112012007138B1 (pt) Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
BR122020017207B1 (pt) Método, sistema de processamento de mídia, aparelho e meio de armazenamento legível por computador não transitório
BR112013005958B1 (pt) método para misturar dois sinais de entrada de áudio em um único sinal de áudio misturado, dispositivo para misturar sinais, meio de armazenamento legível por processador e dispositivo para misturar sinais de entrada de áudio em um único sinal de áudio misturado
WO2019170955A1 (en) Audio coding
BR112021010956A2 (pt) Aparelho e método para gerar uma descrição de campo de som
BR112012009127B1 (pt) Mecanismo para fornecer uma representação de sinal upmix com base em uma representação de sinal downmix, mecanismo para fornecer uma corrente de bit representando um sinal de áudio multicanal, métodos, programa de computador e corrente de bit usando uma sinalização de controle de distorção
EP3762923B1 (en) Audio coding
BR112012008921B1 (pt) Mecanismo e método para fornecer um ou mais parâmetros ajustados para a provisão de uma representação de sinal upmix com base em uma representação de sinal downmix e uma informação lateral paramétrica associada com a representação de sinal downmix, usando um valor médio

Legal Events

Date Code Title Description
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B06A Notification to applicant to reply to the report for non-patentability or inadequacy of the application [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 19/10/2010, OBSERVADAS AS CONDICOES LEGAIS. PATENTE CONCEDIDA CONFORME ADI 5.529/DF, , QUE DETERMINA A ALTERACAO DO PRAZO DE CONCESSAO.