PT3025519T - Método, unidade de processamento de sinal, e programa de computador para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída - Google Patents

Método, unidade de processamento de sinal, e programa de computador para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída Download PDF

Info

Publication number
PT3025519T
PT3025519T PT147388623T PT14738862T PT3025519T PT 3025519 T PT3025519 T PT 3025519T PT 147388623 T PT147388623 T PT 147388623T PT 14738862 T PT14738862 T PT 14738862T PT 3025519 T PT3025519 T PT 3025519T
Authority
PT
Portugal
Prior art keywords
channel
output
input
channels
rule
Prior art date
Application number
PT147388623T
Other languages
English (en)
Inventor
Herre Jürgen
Küch Fabian
Kratschmer Michael
Kuntz Achim
Faller Christoph
Original Assignee
Fraunhofer Ges Forschung
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer Ges Forschung filed Critical Fraunhofer Ges Forschung
Publication of PT3025519T publication Critical patent/PT3025519T/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/305Electronic adaptation of stereophonic audio signals to reverberation of the listening space
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/308Electronic adaptation dependent on speaker or headphone connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Algebra (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Time-Division Multiplex Systems (AREA)

Description

DESCRIÇÃO
MÉTODO, UNIDADE DE PROCESSAMENTO DE SINAL, E PROGRAMA DE COMPUTADOR PARA MAPEAMENTO DE UMA PLURALIDADE DE CANAIS DE ENTRADA DE UMA CONFIGURAÇÃO DE CANAIS DE ENTRADA PARA CANAIS DE SAÍDA DE UMA CONFIGURAÇÃO DE CANAIS DE SAÍDA A presente invenção refere-se a métodos e unidades de processamento de sinal para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saida de uma configuração de canais de saida e, em particular, métodos e aparelhos adequados para uma conversão de submistura do formato entre diferentes configurações do canal do altifalante.
As ferramentas de codificação áudio espacial são bem conhecidas e estão padronizadas, por exemplo, no padrão MPEG-surround. A codificação de áudio espacial tem inicio a partir de uma pluralidade de entradas originais, por exemplo, cinco ou sete canais de entrada, que estão identificados pela sua localização numa configuração de reprodução, por exemplo, como um canal esquerdo, um canal central, um canal direito, um canal envolvente esquerdo, um canal envolvente direito e um canal de melhoria da frequência baixa (LFE). Um codificador de áudio espacial poderá derivar um ou mais canais de submistura a partir dos canais originais e, adicionalmente, poderá derivar dados paramétricos relativos a sinais espaciais, tais como diferenças de nivel intercanal nos valores de coerência do canal, diferenças de etapa intercanal, diferenças de tempo intercanal, etc. 0 um ou mais canais de submistura são transmitidos em conjunto com a informação lateral paramétrica indicando os sinais espaciais para um descodificador de áudio espacial para descodificação dos canais de submistura e dos dados paramétricos associados de modo a obter finalmente canais de saida que são uma versão aproximada dos canais de entrada originais. A localização dos canais na configuração de saida poderá ser fixada, por exemplo, num formato 5.1, um formato 7.1, etc. Adicionalmente, as ferramentas de codificação áudio espaciais são bem conhecidas e estão padronizadas, por exemplo, na norma MPEG SAOC (SAOC = codificação do objeto áudio espacial). Em contraste com a codificação de áudio espacial que se inicia nos canais originais, a codificação do objeto áudio espacial inicia-se a partir de objetos áudio que não são automaticamente atribuídos a uma determinada configuração de reprodução da representação. Em vez disso, a localização dos objetos de áudio na cena de reprodução é flexível e poderá ser definida por um utilizador, por exemplo, inserindo uma determinada informação de representação num descodificador da codificação do objeto de áudio espacial. Em alternativa ou adicionalmente, a informação de representação poderá ser transmitida como informação lateral adicional ou metadados; a representação da informação poderá incluir informação sobre em que posição da configuração de reprodução um determinado objeto áudio deverá ser colocado (por exemplo ao longo do tempo) . De modo a obter uma determinada compressão dos dados, vários objetos áudio são codificados utilizando o codificador SAOC, que calcula, a partir de objetos de entrada, um ou mais canais de transporte submisturando os objetos de acordo com uma determinada informação de submistura. Para além disto, o codificador SAOC calcula a informação lateral paramétrica que representa sinais inter-objetos, tais como diferenças do nivel do objeto (OLD), valores de coerência do objeto, etc. Tal como em SAC (SAC = Codificação Áudio Espacial), os dados paramétricos do inter-objeto são calculados para frações individuais de tempo/frequência. Para uma determinada estrutura (por exemplo, amostras 1024 ou 2048) do sinal áudio, são consideradas uma pluralidade de bandas de frequência (por exemplo, 24, 32 ou 64 bandas), de modo a que os dados paramétricos sejam fornecidos para cada estrutura e banda de frequência. Por exemplo, quando uma peça de áudio possui 20 estruturas e quando cada estrutura está subdividida em 32 bandas de frequência, o número de frações de tempo/frequência é de 640. Um formato de reprodução pretendido, isto é uma configuração de um canal de saida (configuração do altifalante de saida) poderá diferir de uma configuração de canais de entrada, sendo que o número de canais de saida é geralmente diferente do número de canais de entrada. Assim, poderá ser necessária uma conversão do formato para mapear os canais de entrada da configuração do canal de entrada para os canais de saida da configuração do canal de saida. Métodos para o mapeamento de configurações de canal são descritos em US 2012/093323 Al, WO 2013/006338 A2, US 8 050 434 Bl, WO 2009/046460 A2 e US 2012/288124 Al. É o objeto subjacente à presente invenção fornecer uma abordagem aprovada para o mapeamento dos canais de entrada de uma configuração de canais de entrada para os canais de saída de uma configuração de canais de saída de uma forma flexível.
Este objeto é obtido através de um método da reivindicação 1, programa de computador da reivindicação 19, uma unidade de processamento de sinal da reivindicação 20 e um descodificador de áudio da reivindicação 22.
As formas de realização da invenção fornecem um método para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída, sendo que o método compreende: o fornecimento de um conjunto de regras associadas a cada canal de entrada de uma pluralidade de canais de entrada, sendo que as regras num conjunto definem diferentes mapeamentos entre o canal de entrada associado e um conjunto de canais de saída; para cada canal de entrada da pluralidade de canais de entrada, a obtenção de uma regra associada ao canal de entrada, determinando se o conjunto de canais de saída definidos na regra obtida está presente na configuração do canal de saída e a seleção da regra obtida se o conjunto de canais de saída definido na regra obtida está presente na configuração do canal de saída; e o mapeamento dos canais de entrada para os canais de saída de acordo com a regra selecionada, em que as regras no conjunto de regras são priorizadas, em que regras com prioridade superior são selecionadas com preferência superior em relação a regras com prioridade inferior, e compreendendo pelo menos uma de: em que um mapeamento de definição de regras do canal de entrada para um ou mais canais de saida com um desvio de direção inferior do canal de entrada num plano horizontal do ouvinte é mais prioritária do que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saida com um desvio de direção superior do canal de entrada no plano horizontal do ouvinte, em que uma regra que define o mapeamento de um canal de entrada para um ou mais canais de saida com um mesmo ângulo de elevação que o canal de entrada é mais prioritária do que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saida com um ângulo de elevação diferente do ângulo de elevação do canal de entrada, em que, no conjunto de regras, a regra mais prioritária define o mapeamento direto entre o canal de entrada e um canal de saida, que tenha a mesma direção e em que uma regra de um conjunto de regras associada a um canal de entrada com um ângulo de elevação de 90 ° define o mapeamento do canal de entrada para todos os canais de saida disponíveis com um primeiro ângulo de elevação inferior ao ângulo de elevação do canal de entrada e outra regra menos prioritária desse conjunto de regras define o mapeamento do canal de entrada para todos os canais de saida disponíveis com um segundo ângulo de elevação menor do que o primeiro ângulo de elevação.
As formas de realização da invenção fornecem um programa de computador para efetuar tal método quando é executado num computador ou num processador. As formas de realização da invenção fornecem uma unidade de processamento de sinal que inclui um processador configurado ou programado para efetuar esse método. As formas de realização da invenção fornecem um descodificador de áudio que compreende tal unidade de processamento de sinal.
As formas de realização da invenção baseiam-se numa nova abordagem, na qual um conjunto de regras descrevendo potenciais mapeamentos do canal de entrada-saida está associado a cada canal de entrada de uma pluralidade de canais de entrada e na qual é selecionada uma regra de um conjunto de regras para determinada configuração de canais de entrada-saida. Deste modo, as regras não são associadas a uma configuração de um canal de entrada ou a uma configuração especifica do canal de entrada. Assim, para determinada configuração do canal de entrada e uma configuração especifica do canal de saida, para cada um dos vários canais de entrada presentes na referida configuração de um canal de entrada, é acedido o conjunto de regras associado para determinar que regras se adaptam à referida configuração de um canal de saida. As regras poderão definir um ou mais coeficientes a serem aplicados diretamente aos canais de entrada ou poderão definir um processo a ser aplicado para obter os coeficientes a serem aplicados aos canais de entrada. Com base nos coeficientes, poderá ser gerada uma matriz do coeficiente, como por exemplo a matriz de submistura (DMX) , que poderá ser aplicada aos canais de entrada da referida configuração de um canal de entrada para mapear os mesmos canais de saida da referida configuração de um canal de saida. Como o conjunto de regras está associado aos canais de entrada em vez de a uma configuração de um canal de entrada ou a uma configuração especifica do canal de entrada-saida, a abordagem inventiva pode ser utilizada para diferentes configurações do canal de entrada e diferentes configurações do canal de saida de um modo flexível.
Nas formas de realização da invenção, os canais representam canais áudio, sendo que cada canal de entrada e cada canal de saída possui uma direção na qual está localizado um altifalante associado em relação a uma posição central do ouvinte.
As formas de realização da presente invenção serão descritas com referência aos desenhos anexos, nos quais: A Fig. 1 ilustra uma descrição de um codificador de áudio 3D de um sistema áudio 3D; A Fig. 2 ilustra uma descrição de um codificador de áudio 3D de um sistema áudio 3D; A Fig. 3 ilustra um exemplo para a implementação de um conversor do formato que poderá ser implementado no descodificador de áudio 30 da Fig. 2; A Fig. 4 ilustra um esquema da vista superior de uma configuração do altifalante; A Fig. 5 ilustra um esquema da vista traseira de outra configuração do altifalante; A Fig. 6a ilustra um diagrama de blocos de uma unidade de processamento de sinal para mapeamento dos canais de entrada de uma configuração de canais de entrada para os canais de saida de uma configuração de canais de saida; A Fig. 6b ilustra uma unidade de processamento de sinal de acordo com uma forma de realização da invenção; A Fig. 7 ilustra um método para mapeamento dos canais de entrada de uma configuração de canais de entrada para os canais de saida de uma configuração de canais de saida; e A Fig. 8 ilustra mais em pormenor um exemplo da etapa de mapeamento.
Antes de descrever em pormenor as formas de realização da abordagem inventiva, é fornecida uma descrição de um sistema de codificação áudio 3D no qual é possível implementar a abordagem inventiva.
As Figs. 1 e 2 ilustram os blocos algorítmicos de um sistema áudio 3D de acordo com as formas de realização. Mais especificamente, a Fig. 1 ilustra uma descrição de um codificador de áudio 3D 100. O codificador de áudio 100 recebe num circuito de pré-renderizador/misturador 102, que poderá ser opcionalmente fornecido, sinais de entrada, mais especificamente, uma pluralidade de canais de entrada que fornecem ao codificador de áudio 100 uma pluralidade de sinais do canal 104, uma pluralidade de sinais do objeto 106 e correspondentes metadados do objeto 108. Os sinais do objeto 106 processados pelo pré-renderizador/misturador 102 (ver sinais 110) poderão ser fornecidos a um codificador SAOC 112 (SAOC = Codificação do Objeto Áudio Espacial) . O codificador SAOC 112 gera os canais de transporte SAOC 114 fornecidos à entrada de um codificador USAC 116 (USAC = Codificação Unificada de Voz e Áudio). Adicionalmente, o sinal SAOC-SI 118 (SAOC-SI = informação lateral SAOC) é também fornecido às entradas do codificador USAC 116. O codificador USAC 116 recebe ainda os sinais do objeto 120 diretamente do pré-renderizador/misturador, bem como os sinais do canal e os sinais do objeto pré- renderizado 122. A informação dos metadados do objeto 108 é aplicada a um codificador OAM 124 (OAM = metadados do objeto) fornecendo a informação comprimida dos metadados do objeto 126 ao codificador USAC. O codificador USAC 116, com base nos sinais de entrada mencionados acima, gera um sinal de saída comprimido MP4, conforme ilustrado em 128. A Fig. 2 ilustra uma descrição de um descodificador de áudio 3D do sistema áudio 3D. O sinal codificado 128 (MP4) gerado pelo codificador de áudio 100 da Fig. 1, é recebido no descodificador de áudio 200, mas especificamente, num descodificador USAC 202. O descodificador USAC 202 descodifica o sinal recebido 128 em sinais do canal 204, sinais do objeto pré-renderizado 206, sinais do objeto 208 e sinais do canal de transporte SAOC 210. Adicionalmente, a informação comprimida de metadados do objeto 212 e o sinal SAOC-SI 214 são emitidos pelo descodificador USAC. Os sinais do objeto 208 são fornecidos a um renderizador do objeto 216 emitindo os sinais do objeto renderizado 218. Os sinais do canal de transporte SAOC 210 são fornecidos ao descodificador SAOC 220 emitindo os sinais do objeto renderizado 222. A informação comprimida de metadados do objeto 212 é fornecida ao descodificador OAM 224, emitindo os respetivos sinais de controlo ao renderizador do objeto 216 e ao descodificador SAOC 220 para gerar os sinais do objeto renderizado 218 e os sinais do objeto renderizado 222. O descodificador inclui ainda um misturador 226 que recebe, conforme ilustrado na Fig. 2, os sinais de entrada 204, 206, 218 e 222 para emissão dos sinais do canal 228. Os sinais do canal podem ser diretamente emitidos para um altifalante, por exemplo, um altifalante de 32 canais, conforme indicado em 230. Alternativamente, os sinais 228 poderão ser fornecidos a um circuito de conversão do formato 232 que recebe como uma entrada de controlo um sinal de disposição da reprodução indicando o modo como os sinais do canal 228 devem ser convertidos. Na forma de realização ilustrada na Fig. 2, considera-se que a conversão deve ser efetuada de modo a que os sinais possam ser fornecidos a um sistema de altifalante 5.1 conforme indicado em 234. Os sinais do canal 228 são também fornecidos a um renderizador binauricular 236 que gera dois sinais de saida, por exemplo, para um auscultador, conforme indicado em 238.
O sistema de codificação/descodificação ilustrado nas Figs. 1 e 2 poderá basear-se no código MPEG-D USAC para codificação dos sinais do canal ou do objeto (ver sinais 104 e 106). Para aumentar a eficiência para a codificação de uma grande quantidade de objetos, poderá ser utilizada a tecnologia MPEG SAOC. Três tipos de renderizadores poderão efetuar as tarefas de renderização dos objetos para canais, renderização dos canais para auscultadores ou renderização dos canais para uma configuração diferente de altifalantes (ver Fig. 2, sinais de referência 230, 234 e 238) . Quando os sinais do objeto são explicitamente transmitidos ou parametricamente codificados utilizando SAOC, a correspondente informação de metadados do objeto 108 é comprimida (ver sinal 126) e multiplicada num fluxo de bits de áudio 3D 128.
As Figs. 1 e 2 ilustram os blocos algorítmicos para o sistema áudio 3D completo que será descrito em mais pormenor abaixo. O pré-renderizador/ misturador 102 poderá ser opcionalmente fornecido para converter uma cena de entrada do canal mais objeto numa cena de canal antes da codificação. De forma funcional, é idêntico ao renderizador/misturador do objeto que será descrito mais em pormenor abaixo. A pré-renderização de objetos poderá ser desejada para garantir uma entropia do sinal determinístico na entrada do codificador que é basicamente independente do número de sinais do objeto ativos em simultâneo. Com a pré-renderização de objetos, não é necessária qualquer transmissão de metadados do objeto. Os sinais descontínuos do objeto são renderizados para a disposição do canal que o codificador está configurado para utilizar. Os pesos dos objetos para cada canal são obtidos a partir dos metadados associados do obj eto (OAM) . O codificador USAC 116 é o código nuclear para os sinais do canal do altifalante, sinais descontínuos do objeto, sinais de submistura do objeto e sinais pré-renderizados. Baseia-se na tecnologia MPEG-DUSAC. Gere a codificação dos sinais anteriores criando a informação de mapeamento do canal e objeto baseados na informação geométrica e semântica da atribuição do canal de entrada e do objeto. Esta informação de mapeamento descreve como os canais de entrada e objetos são mapeados para os elementos do canal USAC, como elementos par do canal (CPEs) , elementos de canal único (SCEs, efeitos de baixa frequência (LFEs) e elementos quádruplos do canal (QCEs) e CPEs, SCEs e LFEs, e a informação correspondente é transmitida ao descodificador. Todas as cargas úteis como dados SAOC 114, 118 ou metadados 126 do objeto são considerados no controlo da taxa dos codificadores. A codificação dos objetos é possível de diferentes formas, dependendo dos requisitos da taxa/distorção e dos requisitos de interatividade para o renderizador. De acordo com as formas de realização, são possíveis as seguintes variações de codificação do objeto:
Objetos pré-renderizados: Os sinais do objeto são pré-renderizados e misturados para sinais do canal 22.2 antes da codificação. A cadeia de codificação subsequente mostra os sinais do canal 22.2.
Formas de onda do objeto descontínuo: Os objetos são fornecidos como formas de onda monofónicas ao codificador. 0 codificador utiliza elementos de canal único (SCEs) para transmitir os objetos em adição aos sinais do canal. Os objetos descodificados são renderizados e misturados no lado do recetor. A informação comprimida dos metadados do objeto é transmitida ao recetor/renderizador.
Formas de onda do objeto paramétrico: as propriedades dos objetos e a sua relação uns com os outros são descritas através de parâmetros SAOC. A submistura dos sinais do objeto é codificada com USAC. A informação paramétrica é transmitida conjuntamente. 0 número de canais de submistura é escolhido dependendo do número de objetos e da taxa global de dados. A informação comprimida dos metadados do objeto é transmitida ao renderizador SAOC. 0 codificador SAOC 112 e o descodif icador SAOC 220 para os sinais do objeto poderão basear-se na tecnologia MPEG SAOC. O sistema é capaz de recriar, modificar e renderizar vários objetos áudio num número menor de canais transmitidos e dados paramétricos adicionais, tais como OLDs, IOCs (Coerência Inter Objeto), DMGs (Ganhos de Submistura). Os dados paramétricos adicionais exibem uma taxa de dados significativamente mais baixa do gue a necessária para transmitir todos os objetos individualmente, tornando a codificação muito eficiente. O codificador SAOC 112 considera como entrada os sinais do objeto/canal como formas de onda monofónicas e emite a informação paramétrica (gue está incluída no fluxo de dados Áudio 3D 128) e os canais de transporte SAOC (gue são codificados utilizando elementos de canal único e gue são transmitidos). O descodificador SAOC 220 reconstrói os sinais do objeto/canal a partir dos canais de transporte SAOC descodificados 210 e da informação paramétrica 214 e gera a cena áudio de saída baseada na disposição de reprodução, na informação descomprimida de metadados do objeto e opcionalmente, com base na informação de interação do utilizador. 0 código de metadados do objeto (ver codificador OAM 124 e descodif icador OAM 224) é fornecido de modo a que, para cada objeto, os metadados associados que especificam a posição geométrica e volume dos objetos no espaço 3D seja eficientemente codificado pela quantização das propriedades do objeto no tempo e espaço. Os metadados comprimidos do objeto OAM 126 são transmitidos ao recetor 200 como informação lateral. O renderizador do objeto 216 utiliza os metadados comprimidos do objeto para gerar formas de onda do objeto de acordo com o referido formato de reprodução. Cada objeto é renderizado para um determinado canal de saída 218 de acordo com os seus metadados. A saída deste bloco resulta da soma dos resultados parciais. Se o conteúdo de ambos os canais, bem como os objetos descontínuos/paramétricos forem descodificados, as formas de onda baseadas no canal e as formas de onda do objeto renderizado são misturadas pelo misturador 226 antes da emissão das formas de onda resultantes 228, ou antes de as transmitir a um módulo de pós-processamento como o renderizador binauricular 236 ou o módulo do renderizador do altifalante 232. O módulo do renderizador binauricular 236 produz uma submistura binauricular do material áudio de múltiplo canal, de modo a que cada canal de entrada seja representado por uma fonte de som virtual. O processamento é efetuado a nível da estrutura no domínio QMF (Banco de Filtro de Quadratura de Espelho) e a capacidade binauricular baseia-se em respostas medidas do impulso do espaço binauricular. 0 renderizador do altifalante 232 converte entre a configuração do canal transmitido 228 e o formato de reprodução pretendido. Poderá ser também designado por "conversor do formato". 0 conversor do formato efetua conversões de realização para números inferiores dos canais de saida, ou seja, cria submisturas. É ilustrada na Fig. 3 uma possível implementação de um conversor do formato 232. Nas formas de realização da invenção, a unidade de processamento de sinal é um conversor do formato. 0 conversor do formato 232, também referido como renderizador do altifalante, converte entre a configuração do canal do transmissor e o formato de reprodução pretendido mapeando os canais do transmissor (entrada) da configuração do canal do transmissor (entrada) para os canais (saída) do formato de reprodução pretendido (configuração de um canal de saída). 0 conversor do formato 232 efetua geralmente conversões de realização para um número inferior de canais de saída, ou seja, efetua um processo de submistura (DMX) 240. O submisturador 240, que opera preferencialmente no domínio QMF, recebe os sinais de saída 228 do misturador e emite os sinais do altifalante 234. Poderá ser fornecido um configurador 242, também referido como um controlador, que recebe, como uma entrada de controlo, um sinal 246 indicativo da disposição de saída do misturador (configuração de um canal de entrada), isto é, a disposição para a qual os dados representados pelo sinal de saída do misturador 228 é determinada e o sinal 248 indicativo da disposição da reprodução pretendida (configuração de um canal de saida). Com base nesta informação, o controlador 242, de preferência automaticamente, gera matrizes de submistura para a combinação referida de formatos de entrada e saida e aplica estas matrizes ao submisturador 240. O conversor do formato 232 permite configurações padrão do altifalante para além de configurações aleatórias com posições não padronizadas do altifalante.
As formas de realização da presente invenção referem-se à implementação do renderizador do altifalante 232, isto é, métodos e unidades de processamento de sinal para implementação da funcionalidade do renderizador do altifalante 232. É feita agora referência às Figs. 4 e 5. A Fig. 4 ilustra uma configuração do altifalante que representa um formato 5.1 que inclui seis altifalantes que representam um canal LC esquerdo, um canal CC central, um canal RC direito, um canal LSC envolvente esquerdo, um canal LRC envolvente direito e um canal LFC de melhoria de frequência baixa. A Fig. 5 ilustra outra configuração do altifalante que inclui altifalantes que representam o canal LC esquerdo, um canal CC central, um canal RC direito e um canal ECC central elevado.
Em seguida, não é considerado o canal de melhoria de frequência baixa, já que a posição exata do altifalante (altifalante de graves) associado ao canal de melhoria de frequência baixa não é importante.
Os canais estão organizados em direções especificas em relação a uma Posição P central do ouvinte. A direção de cada canal é definida pelo ângulo azimute α e pelo ângulo de elevação β, ver Fig. 5. 0 ângulo azimute representa o ângulo do canal num plano horizontal do ouvinte 300 e poderá representar a direção do respetivo canal em relação à direção central dianteira 302. Conforme pode ser observado na Fig. 4, a direção central dianteira 302 poderá ser definida como a suposta direção de visualização de um ouvinte localizado na posição P central do ouvinte. Uma direção central traseira 304 inclui um ângulo azimute de 180° em relação à direção central dianteira 300. Todos os ângulos azimute no lado esquerdo da direção central dianteira entre a direção central dianteira e a direção central traseira estão no lado esquerdo da direção central dianteira e todos os ângulos azimute no lado direito da direção central dianteira entre a direção central dianteira e a direção central esquerda estão no lado direito da direção central dianteira. Os altifalantes localizados na frente de uma linha virtual 306, a qual é ortogonal à direção central dianteira 302 e que passa na posição central do ouvinte, são 25 altifalantes dianteiros e os altifalantes localizados atrás da linha virtual 306 são altifalantes traseiros. No formato 5.1, o ângulo azimute α do canal LC está 30° para a esquerda, a do CC está 0o, ο a do RC está 30° para a direita, a do LSC está 110° para a esquerda e a do RSC está 110° para a direita. O ângulo de elevação β de um canal define o ângulo entre o plano horizontal do ouvinte 300 e a direção de uma linha de ligação virtual entre a posição central do ouvinte e o altifalante associado ao canal. Na configuração ilustrada na Fig. 4, todos os altifalantes estão dispostos no plano horizontal do ouvinte 300 e, desse modo, todos os ângulos de elevação estão em zero. Na Fig. 5, o ângulo de elevação β do canal ECC poderá ser 30°. Um altifalante localizado exatamente acima da posição central do ouvinte terá um ângulo de elevação de 90°. Os altifalantes dispostos abaixo do plano horizontal do ouvinte 300 possuem um ângulo de elevação negativo. A posição de um determinado canal no espaço, isto é, a posição do altifalante associado ao determinado canal, fornece o ângulo azimute, o ângulo de elevação e a distância do altifalante a partir da posição central do ouvinte.
As aplicações de submistura renderizam um conjunto de canais de entrada num conjunto de canais de saída em que o número de canais de entrada é, em geral, superior ao número de canais de saída. Um ou mais canais de entrada poderão ser misturados em conjunto com o mesmo canal de saída. Ao mesmo tempo, um ou mais canais de entrada poderão ser renderizados em mais do que um canal de saída. Este mapeamento a partir dos canais de entrada para o canal de saída é determinado por um conjunto de coeficientes de submistura (ou em alternativa, formulado como uma matriz de submistura). A escolha dos coeficientes de submistura afeta significativamente a qualidade obtida do som de saída de submistura. Escolhas erradas poderão originar uma mistura desequilibrada ou uma má reprodução espacial do cenário do som de entrada.
Para obter bons coeficientes de submistura, um especialista (por exemplo engenheiro de som) poderá afinar manualmente os coeficientes, tendo em consideração a sua experiência e conhecimentos. Contudo, existem várias razões contra a afinação manual em algumas aplicações: 0 número de configurações do canal (configurações do canal) no mercado está a aumentar, requerendo um novo esforço de afinação para cada nova configuração. Devido ao crescente número de configurações, a otimização individual manual das matrizes DMX para cada combinação possível de configurações do canal de entrada e saída, torna-se impraticável. Irão emergir novas configurações na produção, que requerem novas matrizes DMX a partir de/para as configurações existentes ou outras novas configurações. As novas configurações poderão emergir após uma aplicação de submistura ter sido ativada de modo a que não seja mais possível a afinação manual. Em cenários típicos da aplicação (por exemplo escutar o altifalante na sala de estar), as configurações padrão relativas ao altifalante (por exemplo envolvência 5.1 de acordo com ITU-R BS 775) são exceções à regra. As matrizes DMX para essas configurações não padronizadas do altifalante não podem ser otimizadas manualmente, já que são desconhecidas durante o projeto do sistema.
Os sistemas existentes ou previamente propostos para determinar as matrizes DMX incluem a utilização de matrizes de submistura ajustadas manualmente em muitas aplicações de submistura. Os coeficientes de submistura destas matrizes não são obtidos de forma automática, mas são otimizados por um engenheiro de som para fornecer a melhor qualidade de submistura. 0 engenheiro de som pode ter em consideração as diferentes propriedades dos diferentes canais de entrada durante o design dos coeficientes BMX (por exemplo diferente: manuseamento do canal central, dos canais envolventes, etc.)· Contudo, conforme acima descrito, a obtenção manual dos coeficientes de submistura para cada possível combinação da configuração de um canal de entrada-saída é bastante impraticável e mesmo impossível se forem adicionadas novas configurações de entrada e/ou saída numa etapa posterior após o processo de design.
Uma possibilidade direta de obter automaticamente coeficientes de submistura para uma determinada combinação de configurações de entrada e saída, é tratar cada canal de entrada como uma fonte virtual de som cuja posição no espaço é dada pela posição no espaço associada a esse canal (isto é, a posição do altifalante associada a determinado canal de entrada). É possível reproduzir cada fonte virtual através de um algoritmo de balanço genérico como o balanço de lei tangente em 2D ou o balanço da amplitude baseado no vetor em 3D, ver V. Pulkki: "Virtual Sound Source Positioning Using Vector Base Amplitude Panning" (Posicionamento da Fonte de Som Virtual Utilizando o Balanço da Amplitude Baseada no Vetor), Jornal da Sociedade de Engenharia Áudio, vol. 45, pp. 456-466, 1997. Os ganhos do balanço da lei do balanço aplicada determinam assim os ganhos que são aplicados quando se efetua o mapeamento dos canais de entrada para os canais de saída, ou seja, os ganhos do balanço são os coeficientes de submistura pretendidos. Enquanto os algoritmos de balanço genéricos permitem obter automaticamente as matrizes DMX, a qualidade do som de submistura obtida é geralmente mais baixa devido a diversas razões: - 0 balanço é aplicado a todas as posições do canal de entrada que não esteja presente na configuração de saida. Isto cria a situação na qual os sinais de entrada são distribuídos com frequência de forma coerente por vários canais de saída. Isto não é desejável, já que deteriora a reprodução dos sons envolventes como o eco. Também para os componentes de som descontínuo no sinal de entrada, a reprodução como fontes fantasma causa alterações não pretendidas na largura e coloração da fonte. 0 balanço genérico não tem em consideração as diferentes propriedades dos diferentes canais, por exemplo, não permite otimizar os coeficientes de submistura para o canal central de forma diferente dos outros canais. A otimização de forma diferente da submistura para os diferentes canais de acordo com a semântica do canal, permitirá geralmente uma maior qualidade do sinal de saída. 0 balanço genérico não tem em consideração o conhecimento psico-acústico que será necessário para os diferentes algoritmos de balanço para os canais dianteiros, canais laterais, etc. Para além disto, o balanço genérico resulta em ganhos de balanço para a renderização de altifalantes amplamente afastados que não resulta na correta reprodução do cenário de som espacial na configuração de saída. 0 balanço genérico incluindo o balanço nos altifalantes verticalmente espaçados não gera bons resultados, já que não tem em consideração os efeitos psico-acústicos (os sinais de perceção vertical espacial diferem dos sinais horizontais). - 0 balanço genérico não tem em consideração que os ouvintes direcionam geralmente as suas cabeças para uma direção preferencial ('frente', ecrã), para obter resultados excelentes. Outra proposta para a obtenção matemática (isto é, automática) dos coeficientes DMX para determinada combinação de configurações do canal de entrada e saida foi efetuada em A. Ando: "Conversion of Multichannel Sound Signal Maintaining
Physical Properties of Sound in Reproduced Sound Field" (Conversão do Sinai do Som Multicanal Mantendo as Propriedades Fisicas do Som no Campo de Som Reproduzido), IEEE Transações sobre o Processamento Áudio, Voz e Linguagem, Vol. 19, N° 6, Agosto 2011. Esta obtenção baseia-se também numa fórmula matemática que não tem em consideração a semântica da configuração de um canal de entrada e saida. Assim, partilha os mesmos problemas que a abordagem de lei tangente ou balanço VBAP.
As formas de realização da invenção para uma nova abordagem para a conversão do formato entre diferentes configurações do altifalante, podem ser efetuadas como um processo de submistura que mapeia vários canais de entrada para vários canais de saida onde o número de canais de saida é geralmente menor do que o número de canais de entrada, e onde as posições do canal de saida poderão diferir das posições do canal de entrada. As formas de realização da invenção estão direcionadas para novas abordagens para melhorar o desempenho dessas implementações de submistura.
Embora as formas de realização da invenção sejam descritas em conjunto com a codificação áudio, deve notar-se que as novas abordagens relativas à submistura poderão ser também aplicadas a aplicações de submistura em geral, ou seja, a aplicações que, por exemplo, não envolvam a codificação áudio.
As formas de realização da invenção referem-se a um método e a uma unidade de processamento de sinal (sistema) para gerar automaticamente coeficientes DMX ou matrizes DMX que podem ser aplicados numa aplicação de submistura, por exemplo, para o processo de submistura descrito anteriormente em referência às Figs. 1 a 3. Os coeficientes DMX são obtidos dependendo das configurações do canal de entrada e saída. Uma configuração de um canal de entrada e uma configuração de um canal de saída podem ser consideradas como dados de entrada e os coeficientes DMX otimizados (ou uma matriz DMX otimizada) poderão ser obtidos a partir dos dados de entrada. Na descrição seguinte, o termo coeficientes de submistura refere-se aos coeficientes estáticos de submistura, isto é, coeficientes de submistura que não dependem das formas de onda do sinal áudio de entrada. Numa aplicação de submistura, poderão ser aplicados coeficientes adicionais (por exemplo ganhos dinâmicos, variação de tempo), por exemplo, para preservar a força dos sinais de entrada (designada por técnica ativa de submistura). As formas de realização do sistema apresentado para a geração automática de matrizes DMX permite sinais de saída DMX de elevada qualidade para determinadas configurações do canal de entrada e saída.
Nas formas de realização da invenção, o mapeamento de um ou mais canais de entrada para um ou mais canais de saída inclui a obtenção de pelo menos um coeficiente a ser aplicado ao canal de entrada para cada canal de saída para o qual o canal de entrada é mapeado. Pelo menos um dos coeficientes poderá incluir um coeficiente de ganho, isto é, um valor de ganho, a ser aplicado ao sinal de entrada associado ao canal de entrada e/ou um coeficiente de atraso, isto é, um valor de atraso a ser aplicado ao sinal de entrada associado ao canal de entrada. Nas formas de realização da invenção, o mapeamento poderá incluir a obtenção de coeficientes seletivos da frequência, isto é, diferentes coeficientes para diferentes bandas de frequência dos canais de entrada. Nas formas de realização da invenção, o mapeamento dos canais de entrada para os canais de saída inclui a geração de uma ou mais matrizes do coeficiente a partir dos coeficientes. Cada matriz define um coeficiente a ser aplicado a cada canal de entrada da configuração de um canal de entrada para cada canal de saída da configuração de um canal de saída. Para os canais de saída, para os quais o canal de entrada não está mapeado, o respetivo coeficiente na matriz do coeficiente será zero. Nas formas de realização da invenção, poderão ser geradas as matrizes de cada coeficiente para os coeficientes de ganho e coeficientes de atraso. Nas formas de realização da invenção, poderá ser gerada uma matriz do coeficiente para cada banda de frequência no caso de os coeficientes serem seletivos da frequência. Nas formas de realização da invenção, o mapeamento poderá ainda incluir a aplicação dos coeficientes obtidos aos sinais de entrada associados aos canais de entrada. A Fig. 6 ilustra um sistema para a geração automática de uma matriz DMX. 0 sistema inclui conjuntos de regras que descrevem os potenciais mapeamentos do canal de entrada-saída, bloco 400 e um seletor 402 que seleciona as regras mais adequadas para uma determinada combinação de uma configuração de canais de entrada 404 e uma combinação da configuração de um canal de saida 406 com base nos conjuntos de regras 400. O sistema poderá incluir uma interface adequada para receber a informação sobre a configuração de um canal de entrada 404 e configuração de um canal de saida 406. A configuração de um canal de entrada define os canais presentes numa configuração de entrada, sendo que cada canal de entrada tem a si associado uma direção ou posição. A configuração de um canal de saida define os canais presentes na configuração de saida, sendo que cada canal de saida tem a si associado uma direção ou posição. O seletor 402 fornece as regras selecionadas 408 a um avaliador 410. O avaliador 410 recebe as regras selecionadas 408 e avalia as regras selecionadas 408 para obter os coeficientes DMX 412 com base nas regras selecionadas 408. Poderá ser gerada uma matriz DMX 414 a partir dos coeficientes de submistura obtidos. O avaliador 410 pode ser configurado para obter a matriz de submistura a partir dos coeficientes de submistura. O avaliador 410 poderá receber a informação sobre a configuração de um canal de entrada e configuração de um canal de saída, tal como a informação sobre a geometria da configuração de saída (por exemplo posições do canal) e informação sobre a geometria da configuração de entrada (por exemplo posições do canal) e ter em consideração a informação quando obter os coeficientes DMX. Conforme ilustrado na Fig. 6b, o sistema poderá ser implementado numa unidade de processamento de sinal 420 que inclui um processador 422 programado ou configurado para agir como o seletor 402 e o avaliador 410 e uma memória 424 configurada para guardar pelo menos parte dos conjuntos 400 de regras de mapeamento. Outra parte das regras de mapeamento poderá ser verificada pelo processador sem aceder às regras guardadas na memória 424. Em ambos os casos, as regras são fornecidas ao processador de modo a efetuar os métodos descritos. A unidade de processamento de sinal poderá incluir uma interface de entrada 426 para receção dos sinais de entrada 228 associados aos canais de entrada e uma interface de saída 428 para emissão dos sinais de saída 234 associados aos canais de saída.
De notar que as regras aplicam-se geralmente aos canais de entrada, e não às configurações do canal de entrada, de modo a que cada regra possa ser utilizada para uma pluralidade de configurações do canal de entrada que partilhem o mesmo canal de entrada para o qual essa regra foi desenvolvida.
Os conjuntos de regras incluem um conjunto de regras que descrevem as possibilidades para mapear cada canal de entrada para um ou vários canais de saída. Para alguns canais de entrada, o conjunto de regras poderá incluir apenas um único canal, mas geralmente, o conjunto de regras irá incluir uma pluralidade (multiplicidade) de regras para a maioria ou todos os canais de entrada. 0 conjunto de regras poderá ser preenchido por um projetista do sistema que possua conhecimentos e experiência sobre submistura quando preencher o conjunto de regras. Por exemplo, o projetista poderá possuir conhecimentos sobre psico-acústica ou as suas intenções artísticas.
Poderão existir potencialmente várias regras de mapeamento diferentes para cada canal de entrada. As diferentes regras de mapeamento, por exemplo, definem as diferentes possibilidades para renderizar um canal de entrada em consideração sobre os canais de saída dependendo da lista de canais de saída disponíveis no caso particular da utilização. Por outras palavras, para cada canal de entrada, poderá existir uma pluralidade de regras, por exemplo, cada uma definindo o mapeamento a partir do canal de entrada para um conjunto diferente de altifalantes de saída, onde o conjunto dos altifalantes de saída poderá possuir também apenas um único altifalante ou poder até estar vazio. A razão provável mais comum para ter múltiplas regras para um canal de entrada no conjunto de regras de mapeamento é que os diferentes canais de saída disponíveis (determinado por possíveis diferentes configurações do canal de saída) requerem diferentes mapeamentos a partir de um canal de entrada para os canais de saída disponíveis. Por exemplo, uma regra poderá definir o mapeamento a partir de um canal de entrada específico para um altifalante de saída específico que está disponível numa configuração de um canal de saída mas não em outra configuração de um canal de saída.
De modo similar, conforme ilustrado na Fig. 7, numa forma de realização do método, para um canal de entrada, é acedida uma regra no conjunto associado de regras, etapa 500. É determinado se o conjunto dos canais de saída definidos nas regras acedidas está disponível na configuração de um canal de saída, etapa 502. Se o conjunto dos canais de saída estiver disponível na configuração de um canal de saída, a regra acedida é selecionada, etapa 504. Se o conjunto de canais de saída não estiver disponível na configuração de um canal de saída, o método recua para a etapa 500 e é acedida a regra seguinte. As etapas 500 e 502 são efetuadas de forma interativa até ser encontrada a regra que define um conjunto de canais de saída que combine com a configuração de um canal de saída. Nas formas de realização da invenção, o processo interativo poderá parar quando for encontrada uma regra que defina um conjunto vazio de canais de saída de modo a que o canal de entrada correspondente não seja mapeado (ou, por outras palavras, seja mapeado com um coeficiente de zero).
As etapas 500, 502 e 504 são efetuadas para cada canal de entrada da pluralidade dos canais de entrada da configuração de um canal de entrada conforme indicado pelo bloco 506 na Fig. 7. A pluralidade de canais de entrada poderá incluir todos os canais de entrada da configuração de um canal de entrada ou poderá incluir um subconjunto dos canais de entrada da configuração de um canal de entrada de pelo menos dois. De seguida, os canais de entrada são mapeados para os canais de saida de acordo com as regras selecionadas.
Conforme ilustrado na Fig. 8, o mapeamento dos canais de entrada para os canais de saida poderá incluir a avaliação das regras selecionadas para obter os coeficientes a serem aplicados aos sinais áudio de entrada associados aos canais de entrada, bloco 520. Os coeficientes poderão ser aplicados aos sinais de entrada para gerar sinais áudio de saida associados aos canais de saida, seta 522 e bloco 524. Em alternativa, a matriz DMX poderá ser gerada a partir dos coeficientes, bloco 526 e a matriz BMX poderá ser aplicada aos sinais de entrada, bloco 524. Em seguida, os sinais áudio de saida podem ser emitidos para os altifalantes associados aos canais de saida, bloco 528.
Assim, a seleção das regras para determinada configuração de entrada/saida inclui a obtenção da matriz DMX para determinada configuração de entrada e saida selecionando as entradas corretas a partir do conjunto de regras que descrevem como mapear cada canal de entrada nos canais de saida que estão disponíveis na referida configuração de um canal de saída. Em particular, o sistema seleciona apenas as regras de mapeamento válidas para a referida configuração de saída, isto é, que descrevem os mapeamentos para os canais do altifalante que estão disponíveis na referida configuração de um canal de saída para o caso de utilização em particular. As regras que descrevem os mapeamentos para os canais de saída que não existem na configuração de saída sob consideração, são rejeitadas como inválidas e não poderão ser selecionadas como regras adequadas para a referida configuração de saida. É descrito a seguir um exemplo para regras múltiplas para um canal de entrada para o mapeamento de um canal central elevado (isto é, um canal no ângulo azimute de 0 graus e um ângulo de elevação superior a 0 graus) para diferentes altifalantes de saida. Uma primeira regra para o canal central elevado poderá definir um mapeamento direto para o canal central no plano horizontal (isto é, para um canal no ângulo azimute de 0 graus e ângulo de elevação de 0 graus) . Uma segunda regra para o canal central elevado poderá definir um mapeamento do sinal de entrada para os canais dianteiros esquerdo e direito (por exemplo os dois canais de um sistema de reprodução estereofónica ou o canal esquerdo e direito de um sistema de reprodução envolvente 5.1) como uma fonte fantasma. Por exemplo, a segunda regra poderá mapear o canal de entrada para os canais dianteiros esquerdo e direito com ganhos iguais de modo a que o sinal reproduzido seja considerado como uma fonte fantasma na posição central.
Se um canal de entrada (posição do altifalante) da configuração de um canal de entrada estiver também presente na configuração de um canal de saida, o canal de entrada pode ser diretamente mapeado para o mesmo canal de saida. Isto poderá refletir-se no conjunto de regras de mapeamento adicionando uma regra direta de mapeamento uma a uma como a primeira regra. A primeira regra poderá ser manuseada antes da seleção das regras de mapeamento. 0 manuseamento fora da determinação das regras de mapeamento evita a necessidade de especificar uma regra de mapeamento uma a uma para cada canal de entrada (por exemplo mapeamento da entrada dianteira esquerda a 30 graus azimute para a saída dianteira esquerda a 30 graus azimute) numa memória ou base de dados de armazenamento das restantes regras de mapeamento. Este mapeamento direto um a um pode ser manuseado, por exemplo, de modo a que se for possível um mapeamento direto um a um (isto é, existe o respetivo canal de saída) , o canal de entrada em particular é diretamente mapeado para o mesmo canal de saída sem iniciar uma procura no restante conjunto das regras de mapeamento para este canal de entrada em particular.
Nas formas de realização da invenção, as regras são priorizadas. Durante a seleção das regras, o sistema prefere regras mais priorizadas em relação a regras menos priorizadas. Isto pode ser implementado através de uma interação numa lista prioritária de regras para cada canal de entrada. Para cada canal de entrada, o sistema poderá fazer um ciclo através da lista de potenciais regras para o canal de entrada sob consideração até ser encontrada uma regra de mapeamento válida adequada, parando assim e selecionando a regra de mapeamento adequada mais priorizada. Outras possibilidades para implementar a priorização pode ser a atribuição de termos de custo a cada regra refletindo o impacto de qualidade da aplicação das regras de mapeamento (custo mais elevado para qualidade inferior) . O sistema poderá efetuar então uma busca do algoritmo que minimize os termos de custo selecionando as melhores regras. A utilização de termos de custo permite também minimizar globalmente os termos de custo se as seleções da regra para diferentes canais de entrada possam interagir umas com as outras. Uma minimização global do termo de custo garante que é obtida a mais elevada qualidade de salda. A priorização das regras pode ser definida por um arquiteto do sistema, por exemplo, preenchendo a lista de potenciais regras de mapeamento numa ordem prioritária ou atribuindo os termos de custo às regras individuais. A priorização poderá refletir a qualidade de som obtida dos sinais de saida: regras de priorização mais elevadas devem fornecer uma qualidade de som melhor, por exemplo, melhor imagem espacial, melhor envolvimento do que as regras menos priorizadas. Potencialmente podem ser considerados outros aspetos na priorização das regras, por exemplo, aspetos de complexidade. Como regras diferentes resultam em matrizes DMX diferentes, poderão no limite causar diferentes complexidades computacionais ou requisitos de memória no processo DMX que aplica a matriz DMX gerada.
As regras de mapeamento selecionadas (tais como pelo seletor 402) determinam os ganhos DMX, incorporando potencialmente a informação geométrica. Ou seja, uma regra para determinar o valor do ganho DMX poderá fornecer valores de ganho DMX que dependam da posição associada aos canais do altifalante.
As regras de mapeamento podem definir diretamente um ou vários ganhos DMX, isto é, coeficientes do ganho, como valores numéricos. As regras poderão, por exemplo, em alternativa definir indiretamente os ganhos especificando que deve ser aplicada uma lei especifica de balanço, por exemplo, balanço da lei tangente ou VBAP. Neste caso, os ganhos DMX dependem dos dados geométricos, tais como a posição ou direção relativa ao ouvinte, do canal de entrada, bem como a posição ou direção relativa ao ouvinte do canal de saida ou canais de saida. As regras poderão definir os ganhos DMX dependentes da frequência. A dependência da frequência poderá ser refletida por diferentes valores de ganho para diferentes frequências ou bandas de frequência ou como parâmetros do equalizador paramétrico, por exemplo, parâmetros para filtros de inclinação ou secções de segunda ordem, que descrevem a resposta de um filtro que deve ser aplicado ao sinal aquando do mapeamento de um canal de entrada para um ou vários canais de saida.
Nas formas de realização da invenção, as regras são implementadas para definir direta ou indiretamente os coeficientes de submistura como ganhos de submistura a serem aplicados nos canais de entrada. Contudo, os coeficientes de submistura não estão limitados aos ganhos de submistura, mas poderão incluir também outros parâmetros que são aplicados aquando do mapeamento dos canais de entrada para os canais de saida. As regras de mapeamento poderão ser implementadas para definir direta ou indiretamente os valores de atraso que podem ser aplicados para obter os canais de entrada através da técnica do balanço de atraso em vez de uma técnica do balanço de amplitude. Para além disto, o balanço de atraso e de amplitude poderá ser combinado. Neste caso, as regras de mapeamento irão permitir determinar os valores de ganho e de atraso como coeficientes de submistura.
Nas formas de realização da invenção, para cada canal de entrada a regra selecionada é avaliada e os ganhos obtidos (e/ou outros coeficientes) para mapeamento para os canais de saída são transferidos para a matriz DMX. A matriz DMX pode ser inicializada com zeros no início de modo a que a matriz DMX seja, potencialmente de forma escassa, preenchida com valores não zero quando avaliar as regras selecionadas para cada canal de entrada.
As regras dos conjuntos de regras poderão ser configuradas para implementar diferentes conceitos no mapeamento dos canais de entrada para os canais de saída. As regras ou classes de regras particulares e os conceitos de mapeamento genérico que podem estar subjacentes às regras são a seguir descritas.
Geralmente, as regras permitem incorporar conhecimentos e experiência na geração automática dos coeficientes de submistura para obter coeficientes de submistura de melhor qualidade do que os que seriam obtidos a partir de geradores de coeficiente de submistura matemático genérico, como as soluções baseadas em VBAP. Os conhecimentos dos peritos poderão resultar de conhecimentos sobre a psico-acústica que reflete a perceção humana do som com mais precisão do que as formulações matemáticas genéricas, como as leis de balanço genérico. A incorporação de conhecimentos de peritos poderá igualmente refletir a experiência em projetar soluções de submistura ou poderá refletir intenções de submistura artística.
As regras poderão ser implementadas para reduzir o balanço excessivo: uma grande quantidade de reprodução do balanço dos canais de entrada é frequentemente indesejável. As regras de mapeamento poderão ser desenvolvidas de modo a aceitarem os erros de reprodução direcionais, isto é, uma fonte de som poderá ser obtida numa posição errada para reduzir a quantidade de balanço por sua vez. Por exemplo, uma regra poderá mapear um canal de entrada para um canal de saida numa posição ligeiramente errada em vez de direcionar o canal de entrada para a posição correta em dois ou mais canais de saida.
As regras poderão ser implementadas tendo em consideração a semântica do canal sob consideração. Os canais com diferentes significados, tais como canais com conteúdo especifico, poderão ter associados a si regras ajustadas de forma diferente. Um exemplo são as regras para mapeamento do canal central para os canais de saida: 0 conteúdo de som do canal central difere com frequência significativamente do conteúdo de outros canais. Por exemplo, nos filmes o canal central é predominantemente utilizado para reproduzir diálogos (isto é, como 'canal de diálogos'), sendo que as regras relativas ao canal central poderão ser implementadas com a intenção de perceber o discurso que é emitido a partir de uma fonte de som próxima com uma dispersão pequena da fonte espacial e cor natural do som. Uma regra de mapeamento central poderá assim permitir um maior desvio da posição do som reproduzido do que as regras para outros canais para evitar a necessidade de balanço (isto é, obtenção da fonte fantasma). Isto garante a reprodução dos diálogos do filme como fontes descontinuas com pouca dispersão e uma cor mais natural do som do que as fontes fantasma.
Outras regras semânticas poderão interpretar os canais dianteiros esquerdo e direito como partes de pares do canal estéreo. Essas regras poderão ter como objetivo a reprodução da imagem do som estereofónico da forma como está centrada: Se os canais dianteiros esguerdo e direito forem mapeados para uma configuração de saída assimétrica, assimetria esquerda-direita, as regras poderão aplicar termos de correção (por exemplo ganhos de correção) que garantam uma reprodução equilibrada, isto é, centrada, da imagem do som estereofónico.
Outro exemplo que utiliza a semântica do canal são as regras para os canais envolventes que são utilizados com frequência para gerar campos de som ambiente (por exemplo eco da sala) que não suscitam a perceção de fontes de som com posição distinta da fonte. A posição exata da reprodução deste conteúdo do som não é assim normalmente importante. Uma regra de mapeamento que tem em consideração a semântica dos canais envolventes poderá ser assim definida apenas com poucos requisitos de precisão espacial.
As regras poderão ser implementadas para refletir a intenção de preservar uma diversidade inerente à configuração de um canal de entrada. Essas regras poderão, por exemplo, reproduzir qualquer canal de entrada como uma fonte fantasma mesmo que exista disponível um canal de saída descontínuo na posição dessa fonte fantasma. Esta introdução deliberada do balanço onde seria possível uma solução sem balanço, poderá ser vantajosa se o canal de saída descontínuo e se a fonte fantasma forem alimentados com canais de entrada que são (por exemplo espacialmente) diferentes na configuração de um canal de entrada: 0 canal de saída descontínuo e a fonte fantasma são percebidos de forma diferente, preservando assim a diversidade dos canais de entrada sob consideração.
Um exemplo para uma regra de preservação da diversidade é o mapeamento a partir de um canal central elevado para um canal dianteiro esquerdo e direito como fonte fantasma na posição central no plano horizontal, mesmo que esteja fisicamente disponível um altifalante central no plano horizontal na configuração de saída. 0 mapeamento deste exemplo poderá ser aplicado para preservar a diversidade do canal de entrada se ao mesmo tempo outro canal de entrada for mapeado para o canal central no plano horizontal. Sem a regra de preservação da diversidade, ambos os canais de entrada, canal central elevado, bem como o outro canal de entrada, seriam reproduzidos através do mesmo percurso do sinal, isto é, através do altifalante central físico no plano horizontal, perdendo-se assim a diversidade do canal de entrada.
Adicionalmente, para utilizar uma fonte fantasma como acima descrito, poderá ser obtida a preservação ou a emulação das características de diversidade especial inerentes à configuração de um canal de entrada através das regras de implementação das seguintes estratégias. 1. As regras poderão definir um filtro de equalização aplicado a um sinal de entrada associado a um canal de entrada numa posição elevada (ângulo de elevação superior) se mapearem o canal de entrada para um canal de saída numa posição inferior (ângulo de elevação inferior). 0 filtro de equalização poderá compensar as alterações de timbre dos diferentes canais acústicos e poderá ser obtido com base em conhecimentos e experiência empíricos e/ou dados BRIR ou similares. 2. As regras poderão definir um filtro de distorção/eco aplicado a um sinal de entrada associado a um canal de entrada numa posição elevada se mapear o canal de entrada para um canal de saída numa posição inferior. 0 filtro poderá ser obtido a partir de medições BRIR ou de conhecimentos empíricos sobre a acústica da sala ou similar. A regra poderá definir se o sinal filtrado é reproduzido através de múltiplos altifalantes, sendo que para cada altifalante poderá ser aplicado um filtro diferente. 0 filtro poderá também modelar apenas as reflexões iniciais.
Nas formas de realização da invenção, o seletor poderá ter em consideração a forma como outros canais de entrada são mapeados para um ou mais canais de saída quando selecionar uma regra para um canal de entrada. Por exemplo, o seletor poderá selecionar uma primeira regra para mapear o canal de entrada para um primeiro canal de saída se nenhum outro canal de entrada for mapeado para esse canal de saída. No caso de outro canal de entrada ser mapeado para esse canal de saída, o seletor poderá selecionar outra regra para mapear o canal de entrada para um ou mais dos outros canais de saída com a intenção de preservar uma diversidade inerente à configuração de um canal de entrada. Por exemplo, o seletor poderá aplicar as regras implementadas para preservar a diversidade espacial inerente à configuração de um canal de entrada no caso de outro canal de entrada ser também mapeado para o mesmo canal (ou canais) de saída e poderá aplicar outra regra.
As regras poderão ser implementadas como regras de preservação do timbre. Por outras palavras, as regras poderão ser implementadas tendo em consideração o facto de que os diferentes altifalantes da configuração de saida são percebidos com uma diferente coloração pelo ouvinte. Uma razão é a coloração inserida pelos efeitos acústicos da cabeça, ouvidos e tronco do ouvinte. A coloração depende do ângulo de incidência do som que chega aos ouvidos do ouvinte, ou seja, a coloração do som difere para as diferentes posições do altifalante. Essas regras podem ter em consideração a diferente coloração do som para a posição do canal de entrada e a posição do canal de saida para o qual o canal de entrada foi mapeado e obter a informação de equalização que compense as diferenças não desejadas na coloração, isto é, para as alterações não desejadas no timbre. Para este fim, as regras poderão incluir uma regra de equalização com uma regra de mapeamento que determine o mapeamento de um canal de entrada para a configuração de um canal de saida, já que as caracteristicas de equalização dependem normalmente dos canais de entrada e saida em particular sob consideração. Falando de forma diferente, uma regra de equalização poderá estar associada a algumas regras de mapeamento, sendo que ambas as regras em conjunto podem ser interpretadas como uma regra.
As regras de equalização poderão resultar na informação de equalização que poderá, por exemplo, ser refletida pelos coeficientes de submistura dependentes da frequência ou que poderá, por exemplo, ser refletida pelos dados paramétricos para os filtros de equalização que são aplicados aos sinais para obter o efeito desejado de preservação do timbre. Um exemplo para uma regra de preservação do timbre é uma regra que descreve o mapeamento a partir de um canal central elevado para o canal central no plano horizontal. A regra de preservação do timbre irá definir um filtro de equalização que é aplicado no processo de submistura para compensar a coloração diferente do sinal que é percebido pelo ouvinte quando se reproduz um sinal num altifalante instalado na posição do canal central elevado em contraste com a coloração percebida para uma reprodução do sinal no altifalante na posição do canal central no plano horizontal.
As formas de realização da invenção permitem um recuo na regra de mapeamento genérico. Poderá ser utilizada uma regra de mapeamento genérico, por exemplo, um balanço VBAP genérico das posições de configuração de entrada, aplicável se não for encontrada nenhuma outra regra mais avançada para uma determinada configuração de um canal de entrada e do canal de saida. Esta regra de mapeamento genérico garante que é sempre encontrado um mapeamento válido de entrada/saida para todas as possíveis configurações e que para cada canal de entrada pelo menos uma qualidade de renderização de base é obtida. De notar que, no geral, poderão ser mapeados outros canais de entrada utilizando regras mais refinadas do que a regra de recuo de modo a que a qualidade geral dos coeficientes de submistura gerados serão geralmente mais elevados do que (e pelo menos tão elevado quanto) a qualidade dos coeficientes gerados por uma solução matemática genérica como VBAP. Nas formas de realização da invenção, a regra de mapeamento genérico poderá definir o mapeamento do canal de entrada para um ou ambos os canais de saída de uma configuração do canal estéreo com urn canal de saída esquerdo e urn canal de saída direito.
Nas formas de realização da invenção, o procedimento descrito, isto é, a determinação das regras de mapeamento a partir de um conjunto de potenciais regras de mapeamento e aplicação das regras selecionadas construindo uma matriz DMX a partir das mesmas que podem ser aplicadas num processo DMX, poderá ser alterado de modo a que as regras de mapeamento selecionadas possam ser aplicadas diretamente num processo DMX sem a formulação intermédia de uma matriz DMX. Por exemplo, os ganhos de mapeamento (isto é, ganhos DMX) determinados pelas regras selecionadas poderão ser diretamente aplicados num processo DMX sem a formulação intermédia de uma matriz DMX. 0 modo pelo qual os coeficientes ou a matriz de submistura são aplicados aos sinais de entrada associados aos canais de entrada está claro para os especialistas versados na arte. 0 sinal de entrada é processado aplicando o(s) coeficiente (ou coeficientes) obtidos e o sinal processado é emitido para o altifalante associado ao canal (ou canais) de saída para o qual o canal de entrada está mapeado. Se dois ou mais canais de entrada forem mapeados para o mesmo canal de saída, os respetivos sinais são adicionados e emitidos para o altifalante associado ao canal de saída.
Numa forma de realização vantajosa o sistema poderá ser implementado como segue. Uma lista ordenada de regras de mapeamento é fornecida. A ordem reflete a priorização da regra de mapeamento. Cada regra de mapeamento determina o mapeamento a partir de um canal de entrada para um ou mais canais de saida, isto é, cada regra de mapeamento determina em qual altifalante de saida é renderizado um canal de entrada. As regras de mapeamento definem explicitamente os ganhos de submistura numericamente. Em alternativa, indicam que uma lei de balanço deve ser avaliada para os canais de entrada e saida considerados, isto é, a lei de balanço deve ser avaliada de acordo com as posições espaciais (por exemplo ângulos azimute) dos canais de entrada e saida considerados. As regras de mapeamento poderão especificar adicionalmente que um filtro de equalização deve ser aplicado ao canal de entrada considerado quando efetuar o processo de submistura. 0 filtro de equalização poderá ser especificado por um índice de parâmetros do filtro que determina qual o filtro a aplicar a partir de numa lista de filtros. 0 sistema poderá gerar um conjunto de coeficientes de submistura para determinada configuração de um canal de entrada e saída como se segue. Para cada canal de entrada da configuração de um canal de entrada: a) percorrer a lista de regras de mapeamento respeitando a ordem da lista, b) para cada regra que descreve um mapeamento a partir do canal de entrada considerado, determinar se a regra é aplicável (válida), isto é, determinar se a regra de mapeamento do canal (ou canais) de saída considerado para obtenção está disponível na configuração de um canal de saída sob consideração, c) a primeira regra válida que é encontrada para o canal de entrada considerado determina o mapeamento a partir do canal de entrada para o canal (ou canais) de saída, d) após ter sido encontrada uma regra válida, a iteração termina para o canal de entrada considerado, e) avaliar a regra selecionada para determinar os coeficientes de submistura para o canal de entrada associado. A avaliação da regra poderá envolver o cálculo dos ganhos de balanço e/ou poderá envolver a determinação de uma especificação do filtro. A abordagem inventiva para obtenção dos coeficientes de submistura é vantajosa já que fornece a possibilidade de incorporar o conhecimento de peritos no design de submistura (como princípios psico-acústicos, manuseamento semântico dos diferentes canais, etc.). Em comparação com as abordagens meramente matemáticas (como a aplicação genérica do VBAP), permite sinais de saída de submistura de qualidade superior quando são aplicados os coeficientes de submistura obtidos numa aplicação de submistura. Em comparação com os coeficientes de submistura afinados manualmente, o sistema permite obter automaticamente coeficientes para maiores quantidades de combinações de configuração de entrada/saída sem a necessidade de um especialista em afinações, reduzindo, desse modo, os custos. Permite também obter coeficientes de submistura em aplicações onde a implementação de submistura já foi ativada, permitindo assim aplicações de submistura de elevada qualidade onde as configurações de entrada/saída poderão alterar após o processo de design, ou seja, quando não é possível a afinação dos coeficientes por parte de um especialista.
Em seguida, é descrita em pormenor uma forma de realização específica não limitativa da invenção. A forma de realização é descrita em relação a um conversor de formato que poderá implementar a conversão do formato 232 ilustrada na Fig. 2. 0 conversor de formato a seguir descrito inclui várias caracteristicas especificas, sendo que deve estar claro que algumas das caracteristicas são opcionais e, desse modo, podem ser omitidas. Em seguida, é descrita a forma como o conversor é iniciado na implementação da invenção. A seguinte especificação refere-se às Tabelas 1 a 6, que podem ser encontradas no final da especificação. As etiquetas utilizadas nas tabelas para os respetivos canais devem ser interpretadas como segue: Os caracteres "CH" indicam "Canal". 0 caractere "M" indica "plano horizontal do ouvinte", isto é, um ângulo de elevação de 0o. Este é o plano no qual os altifalantes são colocados numa configuração normal 2D como estéreo ou 5.1. O caractere "L" indica um plano inferior, isto é, um ângulo de elevação <0°. O caractere "U" indica um plano superior, isto é, um ângulo de elevação > 0o, tal como 30° como um altifalante superior numa configuração 3D. O caractere "T" indica o canal superior, isto é, um ângulo de elevação de 90°, também conhecido como o canal "voz de Deus". Localizada após uma das etiquetas M/L/U/T, está uma etiqueta para o lado esquerdo (L) ou direito (R) seguida do ângulo azimute. Por exemplo, CH_M_L030 e CH_M_R030 representam o canal esquerdo e direito de uma configuração estéreo convencional. O ângulo azimute e o ângulo de elevação para cada canal estão indicados na Tabela 1, exceto os canais LFE e o último canal vazio.
Uma configuração de um canal de entrada e uma configuração de um canal de saida poderá incluir qualquer combinação dos canais indicados na Tabela 1.
Estão ilustrados na Tabela 2 exemplos de formatos de entrada/saida, isto é, configurações do canal de entrada e configurações do canal de saida. Os formatos de entrada/saida indicados na Tabela 2 são formatos padrão e as suas designações serão reconhecidas pelos especialistas versados na arte. A Tabela 3 mostra uma matriz de regras na qual uma ou mais regras estão associadas a cada canal de entrada (canal de origem) . Conforme se pode observar na Tabela 3, cada regra define um ou mais canais de saida (canais de destino), para o qual o canal de entrada vai ser mapeado. Adicionalmente, cada regra define o valor de ganho G na terceira coluna. Cada regra define ainda um indice EQ que indica se deve ser ou não aplicado um filtro de equalização e, se sim, qual o filtro de equalização específico (índice EQ 1 a 4) a ser aplicado. 0 mapeamento do canal de entrada para um canal de saída é efetuado com o ganho G indicado na coluna 3 da Tabela 3. 0 mapeamento do canal de entrada para dois canais de saída (indicado na segunda coluna) é efetuado aplicando o balanço entre os dois canais de saída, sendo que os ganhos de balanço gl, e g2 resultantes da aplicação da lei de balanço são adicionalmente multiplicados pelo ganho dado pela respetiva regra (coluna três na Tabela 3) . As regras especiais aplicam-se ao canal superior. De acordo com uma primeira regra, o canal superior é mapeado para todos os canais de saída do plano superior, indicado por ALL_U, e de acordo com uma segunda regra (menos prioritária), o canal superior é mapeado para todos os canais de saida do plano ouvinte, indicado por ALL_M. A Tabela 3 não inclui a primeira regra associada a cada canal, isto é, um mapeamento direto para um canal com a mesma direção. Esta primeira regra poderá ser verificada pelo sistema/algoritmo antes de serem acedidas as regras indicadas na Tabela 3. Assim, para os canais de entrada, para os quais existe um mapeamento direto, não é necessário o algoritmo para aceder à Tabela 3 para encontrar uma regra combinada, mas aplica a regra de mapeamento direto na obtenção de um coeficiente de um para mapear diretamente o canal de entrada para o canal de saida. Nesses casos, a seguinte descrição é válida para os canais para os quais a primeira regra não foi preenchida, isto é, para os quais não existe um mapeamento direto. Em formas de realização alternativas, a regra de mapeamento direto poderá ser incluída na tabela de regras e não é verificada antes de aceder à tabela de regras. A Tabela 4 mostra as frequências centrais normalizadas das bandas do banco de filtro 77 utilizadas nos filtros pré-definidos do equalizador, conforme será abaixo explicado com mais pormenores. A Tabela 5 mostra os parâmetros do equalizador utilizados nos filtros pré-definidos do equalizador. A Tabela 6 mostra em cada linha os canais que devem ser considerados como estando acima/abaixo um do outro. 0 conversor do formato é iniciado antes do processamento dos sinais de entrada, tais como amostras áudio fornecidas por um descodificador central, tal como o descodificador central do descodificador 200 ilustrado na Fig. 2. Durante uma etapa de inicialização, as regras associadas aos canais de entrada são avaliadas e os coeficientes a serem aplicados aos canais de entrada (isto é, os sinais de entrada associados aos canais de entrada) são obtidos.
Na etapa de inicialização, o conversor de formato poderá gerar automaticamente parâmetros de submistura otimizados (como uma matriz de submistura) para a referida combinação dos formatos de entrada e saída. Poderá aplicar um algoritmo que seleciona para cada altifalante de entrada a regra de mapeamento mais adequada a partir de uma lista de regras que foram desenvolvidas para incorporar considerações psico-acústicas. Cada regra descreve o mapeamento de um canal de entrada para um ou vários canais do altifalante de saída. Os canais de entrada são mapeados para um único canal de saída ou balançados para dois canais de saída, ou (no caso do canal de 'Voz de Deus') distribuídos num vasto número de canais de saída. O mapeamento ideal para cada canal de entrada poderá ser selecionado dependendo da lista de altifalantes de saída que estão disponíveis no formato de saída pretendido. Cada mapeamento define os ganhos de submistura para o canal de entrada sob consideração, bem como potencialmente um equalizador que é aplicado ao canal de entrada sob consideração. As configurações de saída com posições não padronizados do altifalante podem ser assinaladas no sistema fornecendo os desvios de azimute e de elevação a partir de uma configuração regular do altifalante. Para além disto, as variações de distância das posições pretendidas do altifalante de referência devem ser tidas em consideração. A submistura real dos sinais áudio pode ser efetuada numa representação de sub-banda híbrida QMF dos sinais.
Os sinais áudio que são emitidos para o conversor de formato poderão ser referidos como sinais de entrada. Os sinais áudio que são o resultado do processo de conversão do formato poderão ser referidos como sinais de saída. Os sinais de entrada áudio do conversor de formato poderão ser sinais de saída áudio do descodificador central. Os vetores e matrizes são indicados através de símbolos a negrito. Os elementos do vetor ou elementos da matriz são indicados como variáveis em itálico complementadas por índices que indicam a linha/coluna do elemento vetor/matriz no vetor/matriz. A inicialização do conversor de formato poderá ser efetuado antes de ocorrer o processamento das amostras áudio emitido pelo descodificador central. A inicialização poderá considerar como parâmetros de entrada a taxa de amostragem dos dados áudio para processar, um parâmetro a assinalar a configuração do canal dos dados áudio para processar com o conversor de formato, um parâmetro a assinalar a configuração do canal do formato de saída pretendido e opcionalmente, parâmetros a assinalar um desvio das posições do altifalante de saída a partir de uma configuração padrão do altifalante (funcionalidade aleatória de configuração). A inicialização poderá fazer recuar o número de canais da configuração do altifalante de entrada, o número de canais da configuração do altifalante de saída, uma matriz de submistura e a equalização dos parâmetros do filtro aplicados no processamento de sinal áudio do conversor de formato e ajustar [trim] os valores de ganho e atraso para compensar a variação das distâncias do altifalante.
Em pormenor, a inicialização poderá ter em consideração os seguintes parâmetros de entrada:
Parâmetros de Entrada
0 formato de entrada e o formato de saida correspondem à configuração de um canal de entrada e à configuração de um canal de saida. raziíA e rei6íA representam os parâmetros que assinalam um desvio das posições do altifalante (ângulo azimute e ângulo de elevação) a partir de uma configuração padrão do altifalante subjacente âs regras, sendo que A é um indice do canal. Os ângulos dos canais de acordo com a configuração padrão são ilustrados na Tabela 1.
Nas formas de realização da invenção, nas quais é obtida apenas uma matriz do coeficiente de ganho, o único parâmetro de entrada poderá ser format in e format out. Os outros parâmetros de entrada são opcionais dependendo das características implementadas, sendo que f, poderá ser utilizado na inicialização de um ou mais filtros de equalização no caso de coeficientes seletivos da frequência, razi,A e reie,A poderão ser utilizados para tomar em consideração os desvios das posições do altifalante, e trimA e Nmaxdeiay poderão ser utilizados para tomar em consideração uma distância do respetivo altifalante a partir de uma posição central do ouvinte.
Nas formas de realização do conversor, as seguintes condições poderão ser verificadas e se as condições não forem cumpridas, a inicialização do conversor é considerada como tendo falhado e é emitido um erro. Os valores absolutos de raziíA e rei6íA não devem exceder os 35 e 55 graus, respetivamente. 0 ângulo mínimo entre qualquer par de altifalantes (sem canais LFE) não deve ser inferior a 15 graus. Os valores de raziíA devem ser tais que a ordenação por ângulos azimute dos altifalantes horizontais não altere. De modo similar, a ordenação dos altifalantes de agudos e graves não deve alterar. Os valores de rei6íA devem ser tais que a ordenação por ângulos de elevação dos altifalantes que estejam (aproximadamente) acima/abaixo um do outro não altere. Para verificar isto, poderá ser aplicado o seguinte procedimento: • Para cada linha da tabela 6, que inclui dois ou três canais do formato de saída, efetuar: o Ordenar os canais por elevação sem escolha aleatória, o Ordenar os canais por elevação considerando a escolha aleatória. o Se as duas ordenações diferirem, emitir um erro de iniciaiização. 0 termo "escolha aleatória" significa que os desvios entre os canais de cenário real e os canais padrão são tidos em consideração, isto é, que os desvios razic, e relec, são aplicados à configuração padrão do canal de saída.
As distâncias do altifalante em trimAdevem estar entre 0,4 e 200 metros. A relação entre a distância maior e menor do altifalante não deve exceder 4. O maior atraso do ajuste calculado não deve exceder NmaxCjeiay·
Se as condições anteriores forem cumpridas, a inicialização do conversor é bem-sucedida.
Nas formas de realização, a inicialização do conversor de formato emite os seguintes parâmetros de saída:
A seguinte descrição utiliza parâmetros intermédios conforme definido de seguida por razões de clarificação: De notar que uma implementação do algoritmo poderá omitir a introdução dos parâmetros intermédios.
Os parâmetros intermédios descrevem os parâmetros de submistura numa forma orientada para o mapeamento, ou seja, como conjuntos de parâmetros Si, D±, Gi, Ei por mapeamento i.
De salientar que nas formas de realização da invenção, o conversor não irá emitir todos os parâmetros de saida anteriores dependentes das caracteristicas a serem implementadas.
Para as configurações aleatórias de altifalante, isto é, configurações de saida que contenham altifalantes em posições (direções do canal) que se desviem do formato de saida pretendido, os desvios de posição são assinalados especificando os ângulos de desvio da posição do altifalante como parâmetros de entrada razi,A e reie,A· 0 pré-processamento é efetuado aplicando razi,A e reie,A/ aos ângulos da configuração padrão. Para ser mais especifico, os ângulos azimute e de elevação do canal na Tabela 1 são alterados adicionando razi,A e reie,A aos canais correspondentes.
Nin, indica o número de canais da configuração de um canal de entrada (altifalante). Este número pode ser obtido a partir da Tabela 2 para o referido parâmetro de entrada format_in. Nout indica o número de canais da configuração de um canal de saída (altifalante) . Este número pode ser obtido a partir da Tabela 2 para o referido parâmetro de entrada format out.
Os vetores do parâmetro S, D, G, E definem o mapeamento dos canais de entrada para os canais de saída. Para cada mapeamento i a partir de um canal de entrada para um canal de saída com ganho de submistura não zero, definem o ganho de submistura para além de um índice do equalizador que indica qual a curva do equalizador que deve ser aplicada ao canal de entrada sob consideração no mapeamento i.
Considerando um caso, no qual o formato de entrada Format_5_l é convertido para o Format_2_0, a seguinte matriz de submistura seria obtida (considerando um coeficiente de 1 para mapeamento direto, Tabela 2 e Tabela 5, e com INl=CH_M_L030, IN2=CH_M_R030, IN3=CH_M_0 0 0, IN4=CH_M_Ll10, IN5=CH_M_Rl10, OUTl =CH_M_L030, e OUT2=CH_M_R030):
0 vetor esquerdo indica os canais de saída, a matriz representa a matriz de submistura e o vetor direito indica os canais de entrada.
Assim, a matriz de submistura inclui seis entradas diferentes de zero e, desse modo, i é executado de 1 a 6 (ordem arbitrária desde que seja utilizada a mesma ordem em cada vetor. Se contarmos as entradas da matriz de submistura da esquerda para a direita e de cima para baixo começando na primeira linha, os vetores S, B, G e E neste exemplo seriam: S = (BNl, IN3, IN4, IN2, IN3, IN5) D = (0UT1, 0UT1, OUTl,0UT2, 0UT2, 0UT2)
E = (0, 0, 0, 0, 0, 0)
De modo similar, a entrada i em cada vetor refere-se ao mapeamento i entre o canal de entrada e um canal de saída de modo a que os vetores forneçam para cada canal um conjunto de dados incluindo o canal de entrada envolvido, o canal de saída envolvido, o valor de ganho a ser aplicado e qual o equalizador a ser aplicado.
De modo a compensar as diferentes distâncias dos altifalantes a partir de uma posição central do ouvinte, Tg,A e/ou TdíA poderão ser aplicados a cada canal de saída.
Os vetores S, D, G, E são inicializados de acordo com o seguinte algoritmo: - Em primeiro lugar, é inicializado o contador de mapeamento: i=l - Se o canal de entrada existir também no formato de saída (por exemplo, o canal de entrada sob consideração é CH_M_R030 e o canal CH_M_R030 existe no formato de saída, então:
Si = índice do canal de origem no canal de entrada (Exemplo: o canal CH_M_R030 no Format_5_2_l está no segundo lugar de acordo com a Tabela 2, isto é, possui o índice 2 neste formato)
Di = índice do mesmo canal na saída G±= 1
Ei = 0 i=i + l
Assim, os mapeamentos diretos são geridos primeiro e um coeficiente de ganho de 1 e um índice do equalizador de zero é associado a cada mapeamento direto. Após cada mapeamento direto, i é aumentado em um, i = i+1.
Para cada canal de entrada, para o qual não exista um mapeamento direto, é localizada e selecionada a primeira entrada deste canal na coluna de entrada (coluna de origem) da Tabela 3, que exista(m) canal(ais) na respetiva linha da coluna de saída (coluna de destino) . Por outras palavras, é localizada e selecionada a primeira entrada deste canal que define um ou mais canais de entrada que estão presentes na configuração de um canal de saída (dada pelo format_out). Para regras específicas isto poderá significar, tal como para o canal de entrada CH_T_0 0 0 que define que o canal de entrada associado está mapeado para todos os cabais de saída com uma elevação específica, isto poderá significar que a primeira regra que define que um ou mais canais de saída com uma elevação específica e presentes na configuração de saída, é selecionada. Assim, o algoritmo continua: - Ou (isto é, se o canal de entrada não existir no formato de saída) procura a primeira entrada deste canal na coluna de Origem da Tabela 3, para a qual existem os canais na respetiva linha da coluna de Destino. 0 destino ALL U deve ser considerado válido (isto é, existem os canais relevantes de saída) se o formato de saída incluir pelo menos um canal "CH_U_". 0 destino ALL_M deve ser considerado válido (isto é, existem os canais relevantes de saída) se o formato de saída incluir pelo menos um canal .
Assim, é selecionada uma regra para cada canal de entrada. A regra é depois avaliada como segue para se obter os coeficientes a serem aplicados aos canais de entrada. - Se a coluna de destino incluir ALL_U, então:
Para cada canal de saída X com "CH_U_" no seu nome, efetuar:
Si = índice do canal de origem na entrada Di = índice do canal X na saída
Gi = (valor da coluna de ganho) /sqrt (número de canais "CH_U_")
Ei = valor da coluna EQ i = i + 1 - Ou, se a coluna de destino incluir ALL_M, então:
Para cada canal de saída X com no seu nome, efetuar:
Si = índice do canal de origem na entrada Di = índice do canal X na saída
Gi = (valor da coluna de ganho) /sqrt (número de canais "CH_M_")
Ei = valor da coluna EQ i = i + 1 - Ou, se existir um canal na coluna de Destino, então:
Si = índice do canal de origem na entrada Di = índice do canal de destino na saída G, = valor da coluna de ganho Ei = valor da coluna EQ i = i + 1 - Ou (dois canais na coluna de Destino)
Si = índice do canal de origem na entrada
Di = índice do primeiro canal de destino na saída
Gi = (valor da coluna de Ganho) * gi,
Ei = valor da coluna EQ i = i + 1 S± = Si-x,
Di = índice do Segundo canal de destino na saída G, = (valor da coluna de Ganho) * g2,
Ei = Ec, i = i + 1
Os ganhos g2 e g2 são calculados aplicando um balanço da amplitude da lei tangente no seguinte modo: desembrulhar os ângulos azimute do canal de origem e destino como positivos os ângulos azimute dos canais de destino são oq, e a2 (ver Tabela D . o ângulo azimute do canal de origem (referência de balanço) é GÇrc .
Pelo algoritmo anterior, são obtidos os coeficientes de ganho (Gi) a serem aplicados aos canais de entrada. Adicionalmente, é determinado se um equalizador deve ser aplicado e, se sim, qual o equalizador a ser aplicado, (Ei) .
Os coeficientes de ganho Gi poderão ser aplicados diretamente aos canais de entrada ou poderão ser adicionados a uma matriz de submistura que pode ser aplicada aos canais de entrada, isto é, os sinais de entrada associados aos canais de entrada. 0 algoritmo anterior é meramente exemplificativo. Em outras formas de realização, os coeficientes poderão ser obtidos a partir das regras ou baseados nas regras e poderão ser adicionados a uma matriz de submistura sem definir os vetores específicos acima descritos.
Os valores de ganho do equalizador GEq poderão ser determinados como segue: GEq consiste nos valores de ganho por banco de frequência k e indice do equalizador e. Os cinco equalizadores pré-definidos são combinações de diferentes filtros de pico. Conforme pode ser observado na Tabela 5, os equalizadores GEq,i GEq,2 e GEQ,5 incluem um único filtro de pico, o equalizador Geq,3 inclui três filtros de pico e o equalizador GEQí4 inclui dois filtros de pico. Cada equalizador é uma cascata em série de um ou mais filtros de pico e um ganho:
sendo que a banda(k) é a frequência central normalizada da banda de frequência j, especificada na Tabela 4, fs é a frequência de amostragem e o pico de função() é para o G negativo.
e, caso contrário,
Os parâmetros para os equalizadores são especificados na Tabela 5. Nas equações 1 e 2 acima, b é dado pela banda(k) . fs/2, Q é dado por PQ para o respetivo filtro de pico (1 to n), G é dado por Pg, para o respetivo filtro de pico e i é dado por Pf para o respetivo filtro de pico.
Como exemplo, os valores de ganho do equalizador GEq,4 para o equalizador com o índice 4, são calculados com os parâmetros do filtro obtidos a partir da respetiva linha da Tabela 5. A Tabela 5 lista dois conjuntos de parâmetros para os filtros de pico para GEq,4 isto é, conjuntos de parâmetros para n=l e n=2. Os parâmetros são a frequência de pico Pf em Hz, o fator de qualidade do filtro de pico PQ, o ganho Pg, (em dB) que é aplicado na frequência de pico e um ganho global g em dB que é aplicado à cascata dos dois filtros de pico (cascata de filtros para parâmetros n=l e n=2).
Assim
A definição de equalizador conforme acima mencionado, define os ganhos de etapa zero GEq,4 de forma independente para cada banda de frequência k. Cada banda k é especificada pela sua banda de frequência central normalizada (k) em que 0<=banda<=l. De notar que a banda de frequência normalizada band=l corresponde à frequência não normalizada fs/2, em que fs, indica a frequência de amostragem. Desse modo, a band(k).fs/2 indica a frequência central não normalizada da banda k em Hz.
Os atrasos de ajuste TdíA nas amostras para cada canal de saida A e os ganhos de ajuste Tg,A (valor de ganho linear) para cada canal de saida A são calculados como uma função das distâncias do altifalante no trimA:
sendo que
representa o trimA máximo de todos os canais de saida.
Se o maior TdíA exceder Nmaxdeiay, a inicialização poderá falhar e poderá ser criado um erro.
Os desvios da configuração de saida a partir de uma configuração padrão, podem ser tidos em consideração como segue.
Os desvios azimute razi,A (desvios azimute) são tidos em consideração aplicando simplesmente raziíA aos ângulos da configuração padrão conforme acima explicado. Assim, os ângulos modificados são utilizados quando se faz o balanço de um canal de entrada para dois canais de saida. Assim, raziíA é tido em consideração quando um canal de entrada é mapeado para dois ou mais canais de saida quando se efetua o balanço que está definido na respetiva regra. Em formas de realização alternativas, as respetivas regras poderão definir os respetivos valores de ganho (isto é, o balanço já foi efetuado antecipadamente). Nessas formas de realização, o sistema poderá estar adaptado para recalcular os valores de ganho com base nos ângulos aleatórios.
Os desvios de elevação reie,A poderão ser tidos em consideração num pós-processamento como segue. Assim que os parâmetros de saída sejam calculados, poderão ser alterados em relação aos ângulos de elevação aleatórios específicos. Esta etapa só deve ser apenas efetuada se os rei6íA não estiverem todos a zero. - Para cada elemento i em Di, efetuar: - se o canal de saída com o índice Di for um canal horizontal por definição (isto é, a etiqueta do canal de saída inclui a '_M_'), e se este canal de saída for agora um canal de altura (elevação na gama dos 0..60 graus), e se o canal de entrada com o índice Si for um canal de altura (isto é, a etiqueta inclui '_U_'), então h = min (elevação do canal de saída aleatório, 35)/35
Definir o novo equalizador com um novo índice e, sendo que
Ei=e ou se o canal de entrada com o índice Si for um canal horizontal (etiqueta inclui '_M_') h = min (elevação do canal de salda aleatório, 35) / 35 Definir o novo equalizador com um novo indice e, sendo que
Ei=e h é um parâmetro de elevação normalizado que indica a elevação de um canal de saida nominalmente horizontal ('_M_') devido a um desvio de elevação da configuração aleatória reie,A· Para o desvio de elevação zero, segue-se h=0 e não é, efetivamente, aplicado nenhum pós- processamento. A tabela de regras (Tabela 3) aplica no geral um ganho de 0,85 quando mapeia um canal de entrada superior ('_U_1 na etiqueta do canal) para um ou vários canais de saida horizontais (' M ' na (s) etiqueta (s) do canal) . No caso do canal de saida ficar elevado devido a um desvio de elevação da configuração aleatória reie,Aí o ganho de 0,85 é parcial (0<h<l) ou totalmente (h=l) compensado ponderando os ganhos do equalizador pelo fator GCOmp que se aproxima de 1/0,85 para h que se aproxima de h=l,0. De modo similar, as definições do equalizador diminuem na direção da curva
para h aproximando-se de h=1.0.
No caso de um canal de entrada horizontal ser mapeado para um canal de saida que fica elevado devido a um desvio de elevação da configuração aleatória reie,A/ o equalizador
é parcial (Ochcl) ou totalmente (h=l) aplicado.
Por este procedimento, os valores de ganho diferentes de 1 e os equalizadores, que são aplicados devido ao mapeamento de um canal de entrada para um canal de saida inferior, são alterados no caso do canal de saida aleatório ser superior ao canal de saida da configuração.
De acordo com a descrição anterior, a compensação do ganho é aplicada diretamente ao equalizador. Numa abordagem alternativa, os coeficientes de submistura Gi poderão ser alterados. Para essa abordagem alternativa, o algoritmo para aplicação da compensação do ganho será o seguinte: - se o canal de saida com o indice D± for um canal horizontal por definição (isto é, a etiqueta do canal de saída inclui a etiqueta '_M_'), e se este canal de saída for agora um canal de altura (elevação na gama dos 0..60 graus), e se o canal de entrada com o índice Si for um canal de altura (isto é, a etiqueta inclui então h = min (elevação do canal de saída aleatório, 35) / 35 Gi h Gi /0,85 + (1-h) G±
Definir o novo equalizador com um novo índice e, sendo que
Ei=e ou se o canal de entrada com o índice Si for um canal horizontal (a etiqueta inclui Λ_Μ_Λ) h = min (elevação do canal de saída aleatório, 35) / 35
Definir o novo equalizador com um novo índice e, sendo que
Ei=e
Como exemplo, consideremos Di como o índice do canal de canal de saída para o i-ésimo mapeamento de um canal de entrada para um canal de saída. Por exemplo, para o formato de saída F0RMAT_5_1 (ver Tabela 2), Di= 3 irá referir-se ao canal central CH_M_000. Considere reie,A=35 graus (isto é, reie,A do canal de saída para o mapeamento i) para um canal de saída Di que é nominalmente um canal de saída horizontal com elevação de 0 graus (isto é, um canal com uma etiqueta 'CH_M_' ) . Após aplicar rei6íA ao canal de saída (adicionando rei6íA ao respetivo ângulo de configuração padrão conforme definido na Tabela 1) o canal de saída D± possui agora uma elevação de 35 graus. Se um canal de entrada superior (com a etiqueta 'CH_U') for mapeado para este canal de saída Di, os parâmetros para este mapeamento, obtidos a partir da avaliação das regras acima descritas, serão alterados como segue: 0 parâmetro de elevação normalizado é calculado como h = min(35,35)/35 = 35/35 = 1.0.
Assim
É definido um índice e (por exemplo e=6) novo e não utilizado para o equalizador alterado
que é calculado de acordo com
e que poderá ser atribuído à regra de mapeamento configurando Ei = e = 6.
Assim, para o mapeamento do canal de entrada para o canal de saída elevado Di (anteriormente horizontal), os ganhos foram ponderados por um fator de 1/0,85 e o equalizador foi substituído por uma curva do equalizador com ganho constante = 1,0 (isto é, com uma resposta de frequência plana) . Este é o resultado pretendido dado que um canal superior foi mapeado para um canal de saída efetivamente superior (o canal de saída nominalmente horizontal torna-se efetivamente um canal de saída superior devido à aplicação do desvio de elevação da configuração aleatória de 35 graus).
Assim, nas formas de realização da invenção, o método e a unidade de processamento de sinal são configurados para ter em consideração os desvios do ângulo azimute e o ângulo de elevação dos canais de saída de uma configuração padrão (sendo que as regras foram desenvolvidas com base na configuração padrão). Os desvios são tidos em consideração quer pela alteração do cálculo dos respetivos coeficientes e/ou pelo recalcular/alteração dos coeficientes que foram calculados antes ou que estão definidos explicitamente nas regras. Assim, as formas de realização da invenção podem lidar com diferentes desvios de configurações a partir de configurações padrão.
Os parâmetros de inicialização de saída Nin, Nout, Tg,i/ TdíA, GEQ poderão ser obtidos como acima descrito. Os restantes parâmetros de inicialização de saída Mdmx, Ieq poderão ser obtidos dispondo novamente os parâmetros intermédios a partir da representação orientada para o mapeamento (enumerada pelo contador de mapeamento i) para uma representação orientada para o canal como a seguir definido: - Inicializar Mdmx como uma matriz zero Nout X Nin. - Para cada i (i em ordem ascendente) efetuar: MDmx,a,b= Gi com A = Dd, B=Sd (A, B são índices de canal)
Ieq,a= Ei com A = Si sendo que MDMXíAíB indica o elemento da matriz na A-ésima linha e a B-ésima coluna de Mdmx e Q,A indica o elemento A-ésimo do vetor
Ieq ·
Diferentes regras específicas e priorizações de regras desenvolvidas para proporcionar uma melhor qualidade de som podem ser obtidas na Tabela 3. Regras específicas das formas de realização reivindicadas e exemplos serão dados no que se segue. Uma regra de definição do mapeamento do canal de entrada para um ou mais canais de saída com um desvio menor de direção a partir do canal de entrada num plano horizontal do ouvinte, é mais prioritária do que uma regra de definição do mapeamento do canal de entrada para um ou mais canais de saída com um desvio superior de direção a partir de um canal de entrada no plano horizontal do ouvinte. Assim, a direção dos altifalantes na configuração de entrada é reproduzida tão exata quanto possível.
Uma regra de definição do mapeamento de um canal de entrada para um ou mais canais de saida com o mesmo ângulo de elevação do canal de entrada é mais prioritária do que uma regra de definição do mapeamento do canal de entrada para um ou mais canais de saida com um ângulo de elevação diferente do ângulo de elevação do canal de entrada. Assim, é considerado o facto dos sinais de decorrem de diferentes elevações serem percebidos de forma diferente por um utilizador.
Uma regra de um conjunto de regras associadas ao canal de entrada com uma direção diferente da direção central dianteira poderá definir o mapeamento do canal de entrada para dois canais de saida localizados no mesmo lado da direção central dianteira do canal de entrada e localizados em ambos os lados da direção do canal de entrada, e outra regra menos prioritária desse conjunto de regras define o mapeamento do canal de entrada para um único canal de saida localizado no mesmo lado da direção central dianteira do canal de entrada. Uma regra de um conjunto de regras associadas ao canal de entrada com um ângulo de elevação de 90° poderá definir o mapeamento do canal de entrada para todos os canais de saida disponíveis com um primeiro ângulo de elevação inferior ao ângulo de elevação do canal de entrada, e outra regra menos prioritária desse conjunto de regras define o mapeamento do canal de entrada para todos os canais de saída com um segundo ângulo de elevação inferior ao primeiro ângulo de elevação. Uma regra de um conjunto de regras associadas a um canal de entrada que incluem uma direção central dianteira, poderá definir o mapeamento do canal de entrada para dois canais de saída, um localizado no lado esquerdo da direção central dianteira e o outro localizado no lado direito da direção central dianteira. Assim, as regras poderão ser desenvolvidas para canais específicos de modo a obter propriedades e/ou semânticas específicas dos canais específicos sob consideração. Uma regra de um conjunto de regras associadas a um canal de entrada que incluem uma direção central traseira, poderá definir o mapeamento do canal de entrada para dois canais de saída, um localizado no lado esquerdo de uma direção centra dianteira e o outro localizado no lado direito da direção central dianteira, sendo que a regra define também, utilizando um coeficiente de ganho inferior a um, se um ângulo dos dois canais de saída relativo à direção central traseira é superior a 90°. Uma regra de um conjunto de regras associadas a um canal de entrada com uma direção diferente da direção central dianteira poderá definir, utilizando um coeficiente de ganho inferior a um, o mapeamento do canal de entrada para um único canal de saída localizado no mesmo lado da direção central dianteira do canal de entrada, sendo que um ângulo do canal de saída relativo à direção central dianteira é inferior ao ângulo do canal de entrada relativo à direção central dianteira. Assim, um canal pode ser mapeado para um ou mais canais afastados para reduzir a perceção de uma obtenção espacial não ideal do canal de entrada. Para além disto, poderá ajudar a reduzir a quantidade de som ambiente na submistura, o que representa uma característica desejada. 0 som ambiente poderá estar predominantemente presente nos canais traseiros.
Uma regra que define o mapeamento de um canal de entrada com um ângulo de elevação para um ou mais canais de salda com um ângulo de elevação inferior ao ângulo de elevação do canal de entrada, poderá definir a utilização de um coeficiente de ganho inferior a um. Uma regra que define o mapeamento de um canal de entrada para um ou mais canais de saida com um ângulo de elevação inferior ao ângulo de elevação do canal de entrada, poderá definir a aplicação de um processamento seletivo da frequência utilizando um filtro de equalização. Assim, deve ser tido em consideração o facto dos canais elevados serem geralmente percebidos de um modo diferente dos canais horizontal ou inferior ao mapear um canal de entrada para um ou mais canais de saida.
Em geral, os canais de entrada que são mapeados para os canais de saida que se desviam da posição do canal de entrada poderão ser atenuados quanto mais se desvie a perceção da reprodução resultante do canal de entrada mapeado da perceção do canal de entrada, isto é, um canal de entrada pode ser atenuado dependendo do grau de imperfeição da reprodução em relação aos altifalantes disponíveis. 0 processamento seletivo da frequência poderá ser obtido utilizando um filtro de equalização. Por exemplo, os elementos de uma matriz de submistura poderão ser alterados de forma dependente da frequência. Por exemplo, essa modificação poderá ser obtida utilizando diferentes fatores de ganho para diferentes bandas de frequência de modo a ser obtido o efeito da aplicação de um filtro de equalização.
Para resumir, nas formas de realização da invenção, é fornecido um conjunto de regras prioritárias que descrevem os mapeamentos dos canais de entrada para os canais de saida. Poderá ser definido por um projetista do sistema na etapa de desenvolvimento do sistema, refletindo os conhecimentos de submistura de um perito. 0 conjunto poderá ser implementado como uma lista ordenada. Para cada canal de entrada da configuração de um canal de entrada, o sistema seleciona uma regra adequada do conjunto de regras de mapeamento dependendo da configuração de um canal de entrada e da configuração de um canal de saida de determinado caso de utilização. Cada regra selecionada determina o coeficiente (ou coeficientes) de submistura de um canal de entrada para um ou vários canais de saida. 0 sistema poderá iterar através dos canais de entrada de determinada configuração de um canal de entrada e compilar uma matriz de submistura a partir dos coeficientes de submistura obtidos através da avaliação das regras de mapeamento selecionadas para todos os canais de entrada. A seleção da regra tem em consideração a priorização das regras, otimizando, desse modo, o desempenho do sistema, por exemplo, para obter a melhor qualidade de saida de submistura quando aplicar os coeficientes de submistura obtidos. As regras de mapeamento poderão ter em consideração os princípios psico-acústicos ou artísticos que não são refletidos nos algoritmos de mapeamento puramente matemáticos como VBAP. As regras de mapeamento podem ter em consideração a semântica do canal, por exemplo, aplicar um manuseamento diferente para o canal central ou um par esquerdo/direito do canal. As regras de mapeamento poderão reduzir a quantidade de balanço para os erros de ângulo na representação. As regras de mapeamento poderão inserir deliberadamente fontes fantasma (ex. por representação VBAP) mesmo que esteja disponível um único altifalante de saída. A intenção de fazer assim poderá ser a de preservar a diversidade inerente na configuração de um canal de entrada. Embora alguns aspetos tenham sido descritos no contexto de um aparelho, está claro que esses aspetos representam também uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou a uma característica de uma etapa do método. De forma análoga, os aspetos descritos no contexto de uma etapa do método representam também uma descrição de um bloco ou item correspondente ou caracterí stica de um aparelho correspondente. Poderão ser executadas algumas ou todas as etapas do método com (ou utilizando) um aparelho de hardware, como por exemplo, um microprocessador, um computador programável ou um circuito eletrónico. Em algumas formas de realização, poderá ser executada uma ou mais etapas importantes do método com esse aparelho. Nas formas de realização da invenção, os métodos aqui descritos são implementados por processador ou implementados por computador.
Dependendo de determinados requisitos de implementação, as formas de realização da invenção podem ser implementadas em hardware ou em software. A implementação pode ser efetuada utilizando um meio de armazenamento não transitório como um meio de armazenamento digital, por exemplo, uma disquete, um DVD, um Blu-Ray, um CD, um ROM, um PROM, uma EPROM, uma EEPROM ou uma memória amovível, com sinais de controlo eletronicamente legíveis aí guardados, que cooperam (ou conseguem cooperar) com um sistema de computador programável de modo a que o respetivo método seja efetuado. Desse modo, o meio de armazenamento digital poderá ser legível pelo computador.
Algumas formas de realização de acordo com a invenção incluem um transportador de dados com sinais de controlo eletronicamente legíveis, que conseguem cooperar com um sistema de computador programável de modo a que seja executado um dos métodos aqui descritos.
No geral, as formas de realização da presente invenção podem ser implementadas como um produto do programa de computador com um código do programa, sendo o código do programa operativo para efetuar um dos métodos quando o produto do programa de computador é executado num computador. 0 código do programa poderá, por exemplo, ser guardado num transportador legível pela máquina.
Outras formas de realização incluem o programa de computador para efetuar um dos métodos aqui descritos, guardados num suporte legível pela máquina.
Por outras palavras, uma forma de realização do método da invenção é, desse modo, um programa de computador com um código do programa para efetuar um dos métodos aqui descritos, quando o programa de computador é executado num computador.
Uma outra forma de realização do método inventivo é, desse modo, um transportador de dados (ou um meio de armazenamento digital ou um meio legível no computador) que inclui, conforme registado, o programa de computador para efetuar um dos métodos aqui descritos. 0 transportador de dados, o meio de armazenamento digital ou o meio registado são normalmente tangíveis e/ou não transitórios.
Uma outra forma de realização do método inventivo é, desse modo, um fluxo de dados ou uma sequência de sinais que representam o programa de computador para efetuar um dos métodos aqui descritos. 0 fluxo de dados ou a sequência de sinais poderão, por exemplo, ser configurados para serem transferidos através de uma ligação de comunicação de dados, por exemplo, através da data internet.
Uma outra forma de realização inclui um meio de processamento, por exemplo, um computador ou um dispositivo lógico programável programado para, configurado para ou adaptado para efetuar um dos métodos aqui descritos.
Outra forma de realização inclui um computador com o programa de computador nele instalado para efetuar um dos métodos aqui descritos.
Outra forma de realização de acordo com a invenção inclui um aparelho ou um sistema configurado para transferir (por exemplo, eletronicamente ou oticamente) para um recetor, um programa de computador para efetuar um dos métodos aqui descritos. 0 recetor poderá, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou similar. 0 aparelho ou sistema poderá, por exemplo, incluir um servidor de arquivo para transferência do programa de computador para o recetor.
Em algumas formas de realização, poderá ser utilizado um dispositivo lógico programável (por exemplo, uma matriz de portas programável em campo) para efetuar alguma sou todas as funcionalidades dos métodos aqui descritos. Nalgumas formas de realização, uma matriz de portas programável em campo poderá cooperar com um microprocessador para efetuar um dos métodos aqui descritos. No geral, os métodos são preferencialmente efetuados por qualquer aparelho de hardware.
As formas de realização acima descritas são meramente ilustrativas para os princípios da presente invenção. É entendido que as alterações e variações das disposições e dos pormenores aqui descritos serão aparentes aos especialistas versados na arte. É intenção, deste modo, estar limitado apenas pelo âmbito das reivindicações da patente iminente e não pelos pormenores específicos apresentados através da descrição e explicação das formas de realização.
Tabela 1: Canais com os correspondentes ângulos azimute e de elevação
i j ;j j :S*
I !
Tabela 2: Formatos com o número correspondente de canais e ordenação dos canais
Tabela 3: Conversor da Matriz de Regras,
• j :: -:j Ί | 1 i t !
I : j í ! i : t ·.{ ! : j· -! ! .+ i
I a teia 4: Freqgêncu® Centra® mmt&amp;zaúm das Bandas do Basco de Ftfiro 77
i Í
Tabela 5: Parâmetros do Equalizador
lÉ&amp;èia δ: cada tinha lista os canais que são considerados como estando acimaiabaixo um do outro
Γ ΐ 1 i \ 1 j
Referências citadas na descrição A lista de referências citada pelo proponente é somente para conveniência do leitor. Não é parte do documento europeu de patente. Apesar de todo o cuidado que foi tido na compilação das referências, erros ou omissões não podem ser excluídas e o EPO recusa quaisquer responsabilidades nesse sentido.
Documentos de Patente citados na descrição • US 2012093323 Al • WO 2013006338 A2 • US 8050434 Bl • WO 2009046460 A2 • US 2012288124 Al
Literatura, que não patentes, citada na descrição • V. PULKKI. Virtual Sound Source Positioning Using Vector Base Amplitude Panning. Journal of the Audio Engineering Society, 1997, vol. 45, 456-466 • A. ANDO. Conversion of Multichannel Sound Signal Maintaining
Physical Properties of Sound in Reproduced Sound Field. IEEE Transactions on Audio, Speech, and Language Processing, 0 6
August 2011, vol. 19

Claims (22)

  1. REIVINDICAÇÕES
    1. Método para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada (404) para os canais de saída de uma configuração de canais de saída (406), caracterizado por o método incluir: o fornecimento de um conjunto de regras (400) associadas a cada canal de entrada de uma pluralidade de canais de entrada, sendo que as regras definem diferentes mapeamentos entre o canal de entrada associado e um conjunto de canais de saída; para cada canal de entrada da pluralidade de canais de entrada, o acesso (500) a uma regra associada ao canal de entrada, a determinação (502) se o conjunto de canais de saída definidos na regra acedida está presente na configuração de um canal de saída (406), e a seleção (402, 504) da regra acedida se o conjunto de canais de saída definidos na regra acedida está presente na configuração de um canal de saída (406); e o mapeamento (508) dos canais de entrada para os canais de saída de acordo com a regra selecionada em que as regras nos conjuntos de regras são priorizadas, em que as regras mais prioritárias são selecionadas com maior preferência em relação às regras menos prioritárias, e compreendendo pelo menos uma das: em que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saída com um desvio menor de direção a partir do canal de entrada num plano horizontal do ouvinte é mais prioritária do que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saida com um desvio maior de direção a partir do canal de entrada no plano horizontal do ouvinte, em que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saida com um ângulo de elevação igual ao do canal de entrada é mais prioritária do que uma regra que define o mapeamento do canal de entrada para um ou mais canais de saida tendo um ângulo de elevação diferente do canal de entrada, em que, nos conjuntos de regras, a regra com mais prioridade define um mapeamento direto entre o canal de entrada e um canal de saida, que tenha a mesma direção, e em que uma regra de um conjunto de regras associadas a um canal de entrada tendo um ângulo de elevação de 90° define o mapeamento do canal de entrada para todos os canais de saida disponíveis tendo um primeiro ângulo de elevação inferior ao ângulo de elevação do canal de entrada, e outra regra menos prioritária desse conjunto de regras define o mapeamento do canal de entrada para todos os canais de saída disponíveis tendo um segundo ângulo de elevação inferior ao primeiro ângulo de elevação.
  2. 2. Método, de acordo com a reivindicação 1, caracterizado por incluir a não seleção da regra acedida se o conjunto de canais de entrada definidos na regra acedida não estiver presente na configuração de um canal de saida (406) e a repetição das etapas de acesso, determinação e seleção para pelo menos uma outra regra associada ao canal de entrada.
  3. 3. Método, de acordo com a reivindicação 1 ou 2, caracterizado por as regras definirem pelo menos um dos coeficientes de ganho a ser aplicado ao canal de entrada, um coeficiente de atraso a ser aplicado ao canal de entrada, uma lei de balanço a ser aplicada para mapear um canal de entrada para dois ou mais canais de saida e um ganho dependente da frequência a ser aplicado ao canal de entrada.
  4. 4. Método, de acordo com as reivindicações 1 a 3, caracterizado por incluir o acesso às regras nos conjuntos de regras numa ordem especifica até ser determinado que o conjunto de canais de saida definidos numa regra acedida está presente na configuração de um canal de saida (406) de modo a que a priorização das regras seja dada pela ordem especifica.
  5. 5. Método, de acordo com as reivindicações 1 a 4, caracterizado por uma regra que supostamente proporciona uma maior qualidade de som ser mais prioritária do que uma regra que supostamente proporciona uma menor qualidade de som.
  6. 6. Método, de acordo com as reivindicações 1 a 5, caracterizado por nos conjuntos de regras, a regra mais prioritária definir um mapeamento direto entre o canal de entrada e o canal de saida, que tenha a mesma direção, o método compreendendo, para cada canal de entrada verificar se um canal de saida que compreenda a mesma direção do canal de entrada está presente na configuração dos canais de salda (406) antes de aceder a uma memória (422) que armazena o conjunto de regras associadas a cada canal de entrada.
  7. 7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado por nos conjuntos de regras, a regra menos prioritária definir o mapeamento do canal de entrada para um ou ambos os canais de saida de uma configuração de canais de saida estéreo com um canal de saida esquerdo e um canal de saida direito.
  8. 8. Método, de acordo com qualquer uma das reivindicações 1 a 7, caracterizado por uma regra de um conjunto de regras associadas a um canal de entrada com uma direção diferente de uma direção central dianteira, definir o mapeamento do canal de entrada para dois canais de saida localizados no mesmo lado da direção central dianteira do canal de entrada e localizados em ambos os lados da direção do canal de entrada, e uma outra regra menos prioritária desse conjunto de regras que define o mapeamento do canal de entrada para um único canal de saida localizado no mesmo lado da direção central dianteira que o canal de entrada.
  9. 9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado por uma regra de um conjunto de regras associadas a um canal de entrada que inclui uma direção central dianteira definir o mapeamento do canal de entrada para dois canais de saida, um localizado no lado esquerdo da direção central dianteira e o outro localizado no lado direito da direção central dianteira.
  10. 10. Método de acordo com qualquer uma das reivindicações 1 a 9, caracterizado por uma regra de um conjunto de regras associadas a um canal de entrada com uma direção diferente de uma direção central dianteira definir a utilização um coeficiente de ganho inferior a um, ao mapear o canal de entrada para um único canal de saida localizado no mesmo lado da direção central dianteira do canal de entrada, sendo que um ângulo do canal de saida relativo a uma direção central dianteira é inferior a um ângulo do canal de entrada relativo à direção central dianteira.
  11. 11. Método, de acordo com qualquer uma das reivindicações 1 a 10, caracterizado por uma regra que define o mapeamento de um canal de entrada com um ângulo de elevação para um ou mais canais de saida com um ângulo de elevação inferior ao ângulo de elevação do canal de entrada utilizar um coeficiente de ganho inferior a um.
  12. 12. Método, de acordo com qualquer uma das reivindicações 1 a 11, caracterizado por uma regra que define o mapeamento de um canal de entrada com um ângulo de elevação para um ou mais canais de saida com um ângulo de elevação inferior ao ângulo de elevação do canal de entrada aplicar o processamento seletivo da frequência.
  13. 13. Método, de acordo com qualquer uma das reivindicações 1 a 12, caracterizado por incluir a receção dos sinais áudio de entrada associados aos canais de entrada, em que o mapeamento (508) dos canais de entrada para os canais de saida inclui a avaliação (410, 520) das regras selecionadas para obter os coeficientes a serem aplicados aos sinais áudio de entrada e aplicação (524) dos coeficientes aos sinais áudio de entrada para gerar sinais áudio de saída associados aos canais de saída e emissão (528) dos sinais áudio de saída para os altifalantes associados aos canais de saída.
  14. 14. Método, de acordo com a reivindicação 13, caracterizado por incluir a geração de uma matriz de submistura (414) e a aplicação da matriz de submistura (414) aos sinais áudio de entrada.
  15. 15. Método, de acordo com a reivindicação 13 ou 14, caracterizado por incluir a aplicação de atrasos de ajuste aos sinais áudio de saída de modo a reduzir ou compensar as diferenças entre as distâncias dos respetivos altifalantes a partir da posição central do ouvinte na configuração de um canal de entrada (404) e na configuração de um canal de saída (406) .
  16. 16. Método, de acordo com qualquer uma das reivindicações 13 a 15, caracterizado por compreender a consideração de um desvio entre um ângulo horizontal de um canal de saída de uma configuração de saída real e um ângulo horizontal de um canal de saída específico definido no conjunto de regras quando avaliar uma regra que define o mapeamento de um canal de entrada para um ou dois canais de saída, incluindo o canal de saída específico, sendo que os ângulos horizontais representam os ângulos dentro de um plano horizontal do ouvinte relativo a uma direção central dianteira.
  17. 17. Método, de acordo com qualquer uma das reivindicações 13 a 16, caracterizado por incluir a alteração de um coeficiente de ganho, que é definido numa regra que define o mapeamento de um canal de entrada com um ângulo de elevação para um ou mais canais de saída com ângulos de elevação inferiores ao ângulo de elevação do canal de entrada, tendo em consideração um desvio entre um ângulo de elevação de um canal de saída de uma configuração de saída real e um ângulo de elevação de um canal de saída definido nessas regras.
  18. 18. Método, de acordo com qualquer uma das reivindicações 13 a 17, caracterizado por incluir a alteração de um processamento seletivo da frequência da regra que define o mapeamento de um canal de entrada com um ângulo de elevação para um ou mais canais de saída com ângulos de elevação inferiores ao ângulo de elevação do canal de entrada, tendo em consideração um desvio entre um ângulo de elevação de um canal de saída de uma configuração de saída real e um ângulo de elevação do canal de saída definido nessa regra.
  19. 19. Programa de computador caracterizado por efetuar, quando executado num computador ou num processador, o método tal como descrito em qualquer uma das reivindicações 1 a 18.
  20. 20. Unidade de processamento de sinal (420) caracterizada por incluir um processador (422) configurado ou programado para efetuar um método tal como descrito em qualquer uma das reivindicações 1 a 18.
  21. 21. Unidade de processamento de sinal, de acordo com a reivindicação 20, caracterizada por incluir também: uma interface do sinal de entrada (426) para receber os sinais de entrada (228) associados aos canais de entrada da configuração de um canal de entrada (404), e uma interface do sinal de saida (428) para emissão dos sinais áudio de saida associados à configuração de canais de saida (406) .
  22. 22. Descodificador de áudio caracterizado por incluir uma unidade de processamento de sinal tal como descrito na reivindicação 20 ou 21.
PT147388623T 2013-07-22 2014-07-15 Método, unidade de processamento de sinal, e programa de computador para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída PT3025519T (pt)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP13177360 2013-07-22
EP13189249.9A EP2830332A3 (en) 2013-07-22 2013-10-18 Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration

Publications (1)

Publication Number Publication Date
PT3025519T true PT3025519T (pt) 2017-11-21

Family

ID=48874133

Family Applications (5)

Application Number Title Priority Date Filing Date
PT147388615T PT3025518T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiros e segundos canais de entrada para pelo menos um canal de saída
PT16187406T PT3133840T (pt) 2013-07-22 2014-07-15 Método e unidade de processamento de sinal para o mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída
PT17184927T PT3258710T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiro e segundo canais de entrada para pelo menos um canal de saída
PT147388623T PT3025519T (pt) 2013-07-22 2014-07-15 Método, unidade de processamento de sinal, e programa de computador para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída
PT191625797T PT3518563T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiro e segundo canais de entrada para pelo menos um canal de saída

Family Applications Before (3)

Application Number Title Priority Date Filing Date
PT147388615T PT3025518T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiros e segundos canais de entrada para pelo menos um canal de saída
PT16187406T PT3133840T (pt) 2013-07-22 2014-07-15 Método e unidade de processamento de sinal para o mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída
PT17184927T PT3258710T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiro e segundo canais de entrada para pelo menos um canal de saída

Family Applications After (1)

Application Number Title Priority Date Filing Date
PT191625797T PT3518563T (pt) 2013-07-22 2014-07-15 Aparelho e método para mapear primeiro e segundo canais de entrada para pelo menos um canal de saída

Country Status (20)

Country Link
US (6) US9936327B2 (pt)
EP (8) EP2830332A3 (pt)
JP (2) JP6227138B2 (pt)
KR (3) KR101803214B1 (pt)
CN (4) CN107040861B (pt)
AR (4) AR096996A1 (pt)
AU (3) AU2014295309B2 (pt)
BR (2) BR112016000999B1 (pt)
CA (3) CA2918811C (pt)
ES (5) ES2729308T3 (pt)
HK (1) HK1248439B (pt)
MX (2) MX355273B (pt)
MY (1) MY183635A (pt)
PL (5) PL3518563T3 (pt)
PT (5) PT3025518T (pt)
RU (3) RU2672386C1 (pt)
SG (3) SG11201600402PA (pt)
TW (2) TWI532391B (pt)
WO (2) WO2015010961A2 (pt)
ZA (1) ZA201601013B (pt)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2830052A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder, audio encoder, method for providing at least four audio channel signals on the basis of an encoded representation, method for providing an encoded representation on the basis of at least four audio channel signals and computer program using a bandwidth extension
KR102268836B1 (ko) * 2013-10-09 2021-06-25 소니그룹주식회사 부호화 장치 및 방법, 복호 장치 및 방법, 그리고 프로그램
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
EP3285257A4 (en) 2015-06-17 2018-03-07 Samsung Electronics Co., Ltd. Method and device for processing internal channels for low complexity format conversion
ES2797224T3 (es) 2015-11-20 2020-12-01 Dolby Int Ab Renderización mejorada de contenido de audio inmersivo
EP3179744B1 (en) * 2015-12-08 2018-01-31 Axis AB Method, device and system for controlling a sound image in an audio zone
EP3453190A4 (en) 2016-05-06 2020-01-15 DTS, Inc. SYSTEMS FOR IMMERSIVE AUDIO PLAYBACK
GB201609089D0 (en) * 2016-05-24 2016-07-06 Smyth Stephen M F Improving the sound quality of virtualisation
CN106604199B (zh) * 2016-12-23 2018-09-18 湖南国科微电子股份有限公司 一种数字音频信号的矩阵处理方法及装置
EP3583772B1 (en) * 2017-02-02 2021-10-06 Bose Corporation Conference room audio setup
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
GB2561844A (en) * 2017-04-24 2018-10-31 Nokia Technologies Oy Spatial audio processing
FI3619921T3 (fi) * 2017-05-03 2023-02-22 Audioprosessori, järjestelmä, menetelmä ja tietokoneohjelma audiorenderöintiä varten
CN109151704B (zh) * 2017-06-15 2020-05-19 宏达国际电子股份有限公司 音讯处理方法、音频定位系统以及非暂态电脑可读取媒体
DK3425928T3 (da) * 2017-07-04 2021-10-18 Oticon As System omfattende hørehjælpesystemer og systemsignalbehandlingsenhed og fremgangsmåde til at generere et forbedret elektrisk audiosignal
JP6988904B2 (ja) * 2017-09-28 2022-01-05 株式会社ソシオネクスト 音響信号処理装置および音響信号処理方法
JP7345460B2 (ja) 2017-10-18 2023-09-15 ディーティーエス・インコーポレイテッド 3dオーディオバーチャライゼーションのためのオーディオ信号のプレコンディショニング
US11540075B2 (en) * 2018-04-10 2022-12-27 Gaudio Lab, Inc. Method and device for processing audio signal, using metadata
CN109905338B (zh) * 2019-01-25 2021-10-19 晶晨半导体(上海)股份有限公司 一种串行数据接收器的多级均衡器增益的控制方法
US11568889B2 (en) 2019-07-22 2023-01-31 Rkmag Corporation Magnetic processing unit
JP2021048500A (ja) * 2019-09-19 2021-03-25 ソニー株式会社 信号処理装置、信号処理方法および信号処理システム
KR102283964B1 (ko) * 2019-12-17 2021-07-30 주식회사 라온에이엔씨 인터콤시스템 통신명료도 향상을 위한 다채널다객체 음원 처리 장치
GB2594265A (en) * 2020-04-20 2021-10-27 Nokia Technologies Oy Apparatus, methods and computer programs for enabling rendering of spatial audio signals
TWI742689B (zh) * 2020-05-22 2021-10-11 宏正自動科技股份有限公司 影音處理裝置、影音播放系統及其影音處理方法
CN112135226B (zh) * 2020-08-11 2022-06-10 广东声音科技有限公司 Y轴音频再生方法以及y轴音频再生系统
RU207301U1 (ru) * 2021-04-14 2021-10-21 Федеральное государственное бюджетное образовательное учреждение высшего образования "Санкт-Петербургский государственный институт кино и телевидения" (СПбГИКиТ) Усилительно-преобразовательное устройство
US20220386062A1 (en) * 2021-05-28 2022-12-01 Algoriddim Gmbh Stereophonic audio rearrangement based on decomposed tracks
WO2022258876A1 (en) * 2021-06-10 2022-12-15 Nokia Technologies Oy Parametric spatial audio rendering
CN114866948B (zh) * 2022-04-26 2024-07-05 北京奇艺世纪科技有限公司 一种音频处理方法、装置、电子设备和可读存储介质
KR102671956B1 (ko) * 2022-12-06 2024-06-05 주식회사 라온에이엔씨 인터콤용 실감음향 오디오출력장치

Family Cites Families (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4308423A (en) 1980-03-12 1981-12-29 Cohen Joel M Stereo image separation and perimeter enhancement
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
JPS6460200A (en) * 1987-08-31 1989-03-07 Yamaha Corp Stereoscopic signal processing circuit
GB9103207D0 (en) * 1991-02-15 1991-04-03 Gerzon Michael A Stereophonic sound reproduction system
JPH04281700A (ja) * 1991-03-08 1992-10-07 Yamaha Corp 多チャンネル再生装置
JP3146687B2 (ja) 1992-10-20 2001-03-19 株式会社神戸製鋼所 高耐食性表面改質TiまたはTi基合金部材
JPH089499B2 (ja) 1992-11-24 1996-01-31 東京窯業株式会社 焼成マグネシア・ドロマイトれんが
JP2944424B2 (ja) * 1994-06-16 1999-09-06 三洋電機株式会社 音響再生回路
US6128597A (en) * 1996-05-03 2000-10-03 Lsi Logic Corporation Audio decoder with a reconfigurable downmixing/windowing pipeline and method therefor
US6421446B1 (en) 1996-09-25 2002-07-16 Qsound Labs, Inc. Apparatus for creating 3D audio imaging over headphones using binaural synthesis including elevation
JP4304401B2 (ja) 2000-06-07 2009-07-29 ソニー株式会社 マルチチャンネルオーディオ再生装置
US20040062401A1 (en) * 2002-02-07 2004-04-01 Davis Mark Franklin Audio channel translation
US7660424B2 (en) * 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
TW533746B (en) * 2001-02-23 2003-05-21 Formosa Ind Computing Inc Surrounding sound effect system with automatic detection and multiple channels
MXPA05001413A (es) * 2002-08-07 2005-06-06 Dolby Lab Licensing Corp Conversion espacial de canales de audio.
DE60336499D1 (de) * 2002-11-20 2011-05-05 Koninkl Philips Electronics Nv Audio-gestüzte datenrepräsentationsvorrichtung und verfahren
JP3785154B2 (ja) * 2003-04-17 2006-06-14 パイオニア株式会社 情報記録装置、情報再生装置及び情報記録媒体
US7394903B2 (en) * 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
EP1914722B1 (en) 2004-03-01 2009-04-29 Dolby Laboratories Licensing Corporation Multichannel audio decoding
JP4936894B2 (ja) 2004-08-27 2012-05-23 パナソニック株式会社 オーディオデコーダ、方法及びプログラム
CN101010726A (zh) 2004-08-27 2007-08-01 松下电器产业株式会社 音频解码器、方法以及程序
JP4369957B2 (ja) * 2005-02-01 2009-11-25 パナソニック株式会社 再生装置
US8121836B2 (en) * 2005-07-11 2012-02-21 Lg Electronics Inc. Apparatus and method of processing an audio signal
KR100619082B1 (ko) 2005-07-20 2006-09-05 삼성전자주식회사 와이드 모노 사운드 재생 방법 및 시스템
US20080221907A1 (en) * 2005-09-14 2008-09-11 Lg Electronics, Inc. Method and Apparatus for Decoding an Audio Signal
US20070080485A1 (en) 2005-10-07 2007-04-12 Kerscher Christopher S Film and methods of making film
WO2007083952A1 (en) 2006-01-19 2007-07-26 Lg Electronics Inc. Method and apparatus for processing a media signal
TWI342718B (en) 2006-03-24 2011-05-21 Coding Tech Ab Decoder and method for deriving headphone down mix signal, receiver, binaural decoder, audio player, receiving method, audio playing method, and computer program
US8712061B2 (en) * 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8027479B2 (en) * 2006-06-02 2011-09-27 Coding Technologies Ab Binaural multi-channel decoder in the context of non-energy conserving upmix rules
FR2903562A1 (fr) * 2006-07-07 2008-01-11 France Telecom Spatialisation binaurale de donnees sonores encodees en compression.
CN101529504B (zh) * 2006-10-16 2012-08-22 弗劳恩霍夫应用研究促进协会 多通道参数转换的装置和方法
US8050434B1 (en) * 2006-12-21 2011-11-01 Srs Labs, Inc. Multi-channel audio enhancement system
EP2111616B1 (en) * 2007-02-14 2011-09-28 LG Electronics Inc. Method and apparatus for encoding an audio signal
RU2394283C1 (ru) * 2007-02-14 2010-07-10 ЭлДжи ЭЛЕКТРОНИКС ИНК. Способы и устройства для кодирования и декодирования объектно-базированных аудиосигналов
US8290167B2 (en) * 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
TWM346237U (en) * 2008-07-03 2008-12-01 Cotron Corp Digital decoder box with multiple audio source detection function
US8483395B2 (en) 2007-05-04 2013-07-09 Electronics And Telecommunications Research Institute Sound field reproduction apparatus and method for reproducing reflections
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
JP2009077379A (ja) * 2007-08-30 2009-04-09 Victor Co Of Japan Ltd 立体音響再生装置、立体音響再生方法及びコンピュータプログラム
GB2467247B (en) * 2007-10-04 2012-02-29 Creative Tech Ltd Phase-amplitude 3-D stereo encoder and decoder
JP2009100144A (ja) * 2007-10-16 2009-05-07 Panasonic Corp 音場制御装置、音場制御方法およびプログラム
EP2258120B1 (en) * 2008-03-07 2019-08-07 Sennheiser Electronic GmbH & Co. KG Methods and devices for reproducing surround audio signals via headphones
US8306233B2 (en) * 2008-06-17 2012-11-06 Nokia Corporation Transmission of audio signals
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata
CA2820199C (en) * 2008-07-31 2017-02-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Signal generation for binaural signals
CN102273233B (zh) * 2008-12-18 2015-04-15 杜比实验室特许公司 音频通道空间转换
EP2214161A1 (en) 2009-01-28 2010-08-04 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method and computer program for upmixing a downmix audio signal
JP4788790B2 (ja) * 2009-02-27 2011-10-05 ソニー株式会社 コンテンツ再生装置、コンテンツ再生方法、プログラム、及びコンテンツ再生システム
AU2013206557B2 (en) 2009-03-17 2015-11-12 Dolby International Ab Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding
PL2394268T3 (pl) 2009-04-08 2014-06-30 Fraunhofer Ges Forschung Urządzenie, sposób i program komputerowy do realizacji upmixu sygnału audio downmixu z użyciem wygładzania wartości faz
US20100260360A1 (en) * 2009-04-14 2010-10-14 Strubwerks Llc Systems, methods, and apparatus for calibrating speakers for three-dimensional acoustical reproduction
KR20100121299A (ko) 2009-05-08 2010-11-17 주식회사 비에스이 다기능 마이크로 스피커
WO2010131431A1 (ja) * 2009-05-11 2010-11-18 パナソニック株式会社 音響再生装置
EP2446435B1 (en) 2009-06-24 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio signal decoder, method for decoding an audio signal and computer program using cascaded audio object processing stages
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
EP2326108B1 (en) 2009-11-02 2015-06-03 Harman Becker Automotive Systems GmbH Audio system phase equalizion
WO2011072729A1 (en) 2009-12-16 2011-06-23 Nokia Corporation Multi-channel audio processing
KR101673232B1 (ko) 2010-03-11 2016-11-07 삼성전자주식회사 수직 방향 가상 채널을 생성하는 장치 및 그 방법
WO2011152044A1 (ja) * 2010-05-31 2011-12-08 パナソニック株式会社 音響再生装置
KR102033071B1 (ko) * 2010-08-17 2019-10-16 한국전자통신연구원 멀티 채널 오디오 호환 시스템 및 방법
JP5802753B2 (ja) * 2010-09-06 2015-11-04 ドルビー・インターナショナル・アクチボラゲットDolby International Ab マルチチャンネルオーディオ再生のためのアップミキシング方法及びシステム
US8903525B2 (en) * 2010-09-28 2014-12-02 Sony Corporation Sound processing device, sound data selecting method and sound data selecting program
KR101756838B1 (ko) 2010-10-13 2017-07-11 삼성전자주식회사 다채널 오디오 신호를 다운 믹스하는 방법 및 장치
KR20120038891A (ko) 2010-10-14 2012-04-24 삼성전자주식회사 오디오 시스템 및 그를 이용한 오디오 신호들의 다운 믹싱 방법
US20120093323A1 (en) * 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
EP2450880A1 (en) * 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
WO2012088336A2 (en) 2010-12-22 2012-06-28 Genaudio, Inc. Audio spatialization and environment simulation
WO2012109019A1 (en) * 2011-02-10 2012-08-16 Dolby Laboratories Licensing Corporation System and method for wind detection and suppression
CN104024155A (zh) 2011-03-04 2014-09-03 第三千禧金属有限责任公司 铝-碳组合物
WO2012140525A1 (en) * 2011-04-12 2012-10-18 International Business Machines Corporation Translating user interface sounds into 3d audio space
US9031268B2 (en) * 2011-05-09 2015-05-12 Dts, Inc. Room characterization and correction for multi-channel audio
TWI543642B (zh) * 2011-07-01 2016-07-21 杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
TWM416815U (en) * 2011-07-13 2011-11-21 Elitegroup Computer Sys Co Ltd Output/input module for switching audio source and audiovisual playback device thereof
EP2560161A1 (en) * 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
TWI479905B (zh) * 2012-01-12 2015-04-01 Univ Nat Central Multi-channel down mixing device
EP2645749B1 (en) 2012-03-30 2020-02-19 Samsung Electronics Co., Ltd. Audio apparatus and method of converting audio signal thereof
KR101915258B1 (ko) * 2012-04-13 2018-11-05 한국전자통신연구원 오디오 메타데이터 제공 장치 및 방법, 오디오 데이터 제공 장치 및 방법, 오디오 데이터 재생 장치 및 방법
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
CN107454511B (zh) * 2012-08-31 2024-04-05 杜比实验室特许公司 用于使声音从观看屏幕或显示表面反射的扬声器
KR101685408B1 (ko) * 2012-09-12 2016-12-20 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 3차원 오디오를 위한 향상된 가이드 다운믹스 능력을 제공하기 위한 장치 및 방법
KR101407192B1 (ko) * 2012-09-28 2014-06-16 주식회사 팬택 사운드 출력을 제어하는 휴대 단말 및 사운드 출력 제어 방법
US8638959B1 (en) 2012-10-08 2014-01-28 Loring C. Hall Reduced acoustic signature loudspeaker (RSL)

Also Published As

Publication number Publication date
KR20170141266A (ko) 2017-12-22
KR101803214B1 (ko) 2017-11-29
AU2017204282B2 (en) 2018-04-26
ZA201601013B (en) 2017-09-27
AR116606A2 (es) 2021-05-26
CN105556991A (zh) 2016-05-04
AU2014295309A1 (en) 2016-02-11
AU2014295310A1 (en) 2016-02-11
EP4061020A1 (en) 2022-09-21
EP3133840B1 (en) 2018-07-04
US10701507B2 (en) 2020-06-30
CA2918811A1 (en) 2015-01-29
PL3133840T3 (pl) 2019-01-31
AR097004A1 (es) 2016-02-10
KR20160034962A (ko) 2016-03-30
AR109897A2 (es) 2019-02-06
PL3025518T3 (pl) 2018-03-30
BR112016000999A2 (pt) 2017-07-25
ES2925205T3 (es) 2022-10-14
PL3258710T3 (pl) 2019-09-30
EP2830332A3 (en) 2015-03-11
CN106804023B (zh) 2019-02-05
US10798512B2 (en) 2020-10-06
CA2918843C (en) 2019-12-03
CA2968646A1 (en) 2015-01-29
PL3025519T3 (pl) 2018-02-28
US20180192225A1 (en) 2018-07-05
HK1248439B (zh) 2020-04-09
US9936327B2 (en) 2018-04-03
EP3025519A2 (en) 2016-06-01
WO2015010961A2 (en) 2015-01-29
CA2918843A1 (en) 2015-01-29
KR101810342B1 (ko) 2018-01-18
WO2015010962A2 (en) 2015-01-29
MX2016000905A (es) 2016-04-28
RU2672386C1 (ru) 2018-11-14
BR112016000999B1 (pt) 2022-03-15
EP2830335A3 (en) 2015-02-25
SG11201600475VA (en) 2016-02-26
CA2918811C (en) 2018-06-26
US20160142853A1 (en) 2016-05-19
EP2830335A2 (en) 2015-01-28
EP3518563B1 (en) 2022-05-11
RU2635903C2 (ru) 2017-11-16
EP3258710A1 (en) 2017-12-20
EP3258710B1 (en) 2019-03-20
CN107040861A (zh) 2017-08-11
EP3025518B1 (en) 2017-09-13
MY183635A (en) 2021-03-04
ES2649725T3 (es) 2018-01-15
WO2015010962A3 (en) 2015-03-26
US11272309B2 (en) 2022-03-08
CN105556992B (zh) 2018-07-20
ES2645674T3 (es) 2017-12-07
JP6130599B2 (ja) 2017-05-17
TW201513686A (zh) 2015-04-01
ES2729308T3 (es) 2019-10-31
AU2014295309B2 (en) 2016-10-27
US20210037334A1 (en) 2021-02-04
MX355273B (es) 2018-04-13
RU2016105608A (ru) 2017-08-28
AU2017204282A1 (en) 2017-07-13
PT3025518T (pt) 2017-12-18
RU2016105648A (ru) 2017-08-29
WO2015010961A3 (en) 2015-03-26
JP2016527805A (ja) 2016-09-08
KR101858479B1 (ko) 2018-05-16
US10154362B2 (en) 2018-12-11
BR112016000990B1 (pt) 2022-04-05
US20160134989A1 (en) 2016-05-12
RU2640647C2 (ru) 2018-01-10
PT3518563T (pt) 2022-08-16
MX355588B (es) 2018-04-24
TWI532391B (zh) 2016-05-01
EP3133840A1 (en) 2017-02-22
CN105556991B (zh) 2017-07-11
EP3518563A3 (en) 2019-08-14
SG10201605327YA (en) 2016-08-30
US11877141B2 (en) 2024-01-16
PT3133840T (pt) 2018-10-18
JP6227138B2 (ja) 2017-11-08
ES2688387T3 (es) 2018-11-02
EP3518563A2 (en) 2019-07-31
AU2014295310B2 (en) 2017-07-13
PL3518563T3 (pl) 2022-09-19
CA2968646C (en) 2019-08-20
CN107040861B (zh) 2019-02-05
EP3025518A2 (en) 2016-06-01
US20200396557A1 (en) 2020-12-17
MX2016000911A (es) 2016-05-05
PT3258710T (pt) 2019-06-25
AR096996A1 (es) 2016-02-10
JP2016527806A (ja) 2016-09-08
CN106804023A (zh) 2017-06-06
BR112016000990A2 (pt) 2017-07-25
CN105556992A (zh) 2016-05-04
SG11201600402PA (en) 2016-02-26
TW201519663A (zh) 2015-05-16
EP3025519B1 (en) 2017-08-23
EP2830332A2 (en) 2015-01-28
KR20160061977A (ko) 2016-06-01
US20190075419A1 (en) 2019-03-07
TWI562652B (en) 2016-12-11

Similar Documents

Publication Publication Date Title
PT3025519T (pt) Método, unidade de processamento de sinal, e programa de computador para mapeamento de uma pluralidade de canais de entrada de uma configuração de canais de entrada para canais de saída de uma configuração de canais de saída
BR122021021503B1 (pt) Aparelho e método para fornecer capacidades melhoradas de downmix guiado para áudio 3d