BR112020015417A2 - Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos - Google Patents

Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos Download PDF

Info

Publication number
BR112020015417A2
BR112020015417A2 BR112020015417-2A BR112020015417A BR112020015417A2 BR 112020015417 A2 BR112020015417 A2 BR 112020015417A2 BR 112020015417 A BR112020015417 A BR 112020015417A BR 112020015417 A2 BR112020015417 A2 BR 112020015417A2
Authority
BR
Brazil
Prior art keywords
spherical
representation
triangle
audio
triangles
Prior art date
Application number
BR112020015417-2A
Other languages
English (en)
Inventor
Oliver Wübbolt
Achim Kuntz
Christian Ertel
Sascha DICK
Frederik Nagel
Matthias Neusinger
Original Assignee
Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. filed Critical Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V.
Publication of BR112020015417A2 publication Critical patent/BR112020015417A2/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/02Spatial or constructional arrangements of loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field

Landscapes

  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

trata-se de um aparelho (100) para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana (110) em uma representação esférica (112). uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base (630, 532, 634, 636), e em que uma pluralidade de triângulos de domínio esférico (660, 662, 664, 666) são descritos em um círculo de uma representação esférica. o aparelho é configurado para determinar em qual dos triângulos de área de base uma projeção (p) da posição de objeto do objeto de áudio na área de base está disposta; e o aparelho é configurado para determinar uma posição mapeada (fórmula (i)) da projeção (p) da posição de objeto com o uso de uma transformada linear (fórmula (ii)), que mapeia o triângulo de área de base em seu triângulo de domínio esférico associado. o aparelho é configurado para derivar um ângulo de azimute () e um valor de raio intermediário (fórmula (iii)) da posição mapeada (fórmula (i)). o aparelho é configurado para obter um valor de raio de domínio esférico (fórmula (iv)) e um ângulo de elevação (fórmula (v)) em dependência do valor de raio intermediário (rxy, fórmula (iii)) e em dependência de uma distância (z) da posição de objeto da área de base. um aparelho para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica, aplicações desses aparelhos, métodos e programas de computador também são descritos.

Description

Relatório Descritivo da Patente de Invenção para “APARELHOS PARA CONVERTER UMA POSIÇÃO DE OBJETO DE UM OBJETO DE ÁUDIO, FORNECEDOR DE TRANSMISSÃO CONTÍNUA DE ÁUDIO, SISTEMA DE PRODUÇÃO DE CONTEÚDO DE ÁUDIO, APARELHO DE REPRODUÇÃO DE ÁUDIO E MÉTODOS”
DESCRIÇÃO CAMPO DA TÉCNICA
[001] As modalidades de acordo com a invenção estão relacionadas a aparelhos para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica e vice-versa.
[002] As modalidades de acordo com a invenção estão relacionadas a um fornecedor de transmissão contínua de áudio.
[003] As modalidades adicionais de acordo com a invenção estão relacionadas a um sistema de produção de conteúdo de áudio.
[004] As modalidades adicionais de acordo com a invenção estão relacionadas a um aparelho de reprodução de áudio.
[005] As modalidades adicionais de acordo com a invenção estão relacionadas a respectivos métodos.
[006] As modalidades adicionais de acordo com a invenção estão relacionadas a programas de computador.
[007] As modalidades de acordo com a invenção estão relacionadas a uma regra de mapeamento para metadados de posição de objeção dinâmica.
ANTECEDENTES DA INVENÇÃO
[008] As posições de objetos de áudio ou de alto-falantes são, algumas vezes, descritas em coordenadas cartesianas (descrição cêntrica de ambiente) e são, algumas vezes, descritas em coordenadas esféricas (descrição egocêntrica).
[009] No entanto, foi constatado que é, em geral, desejável converter uma posição de objeto, ou uma posição de alto-falante de uma representação na outra enquanto mantém uma boa impressão de escuta. Também é desejável manter a topologia geral de uma configuração de alto-falante descrita e manter as posições corretas de objeto reproduzidas a partir de posições de alto-falante designadas.
[010] Tendo em vista essa situação, há um desejo por um conceito que permita uma conversão entre uma representação cartesiana de metadados de objeto (por exemplo, dados de posição de objeto) e uma representação esférica que fornece uma boa troca entre uma impressão de audição alcançável e uma complexidade computacional.
SUMÁRIO DA INVENÇÃO
[011] Uma modalidade de acordo com a invenção cria um aparelho para converter uma posição de objeto de um objeto de áudio (por exemplo, “dados de posição de objeto”) de uma representação cartesiana (ou e um representação de sistema de coordenada cartesiana) (por exemplo, que compreende coordenadas x, y e z) em uma representação esférica (ou sistema de coordenada esférica representação) (por exemplo, que compreende um ângulo de azimute, um valor de raio de domínio esférico e um ângulo de elevação).
[012] Uma área de base da representação cartesiana (por exemplo, uma área quadrática em um plano x-y, por exemplo, que tem pontos de canto (-1;-1;0), (1;-1;0), (1;1;0) e (-1;1;0)) é subdividida em uma pluralidade de triângulos de área de base (por exemplo, um triângulo verde ou um triângulo que tem uma primeira hachura, um triângulo roxo ou um triângulo que tem uma segunda hachura, um triângulo vermelho ou um triângulo que tem uma terceira hachura e um triângulo branco ou um triângulo que tem uma quarta hachura). Por exemplo, os triângulos de área de base podem todos ter um canto em uma posição central da área de base. Ademais, uma pluralidade de (por exemplo, correspondentes ou associados) triângulos de domínio esférico pode ser inscrita em um círculo de uma representação esférica (em que, por exemplo, cada um dos triângulos de domínio esférico é associado a um triângulo de área de base, e em que os triângulos de domínio esférico são tipicamente deformados em comparação com os triângulos de área de base, em que há um mapeamento (de preferência, um mapeamento linear) para mapeamento de um determinado triângulo de área de base em seu triângulo de domínio esférico associado). Por exemplo, os triângulos de domínio esférico podem todos compreender um canto em um centro do círculo.
[013] O aparelho é configurado para determinar, em qual dos triângulos de área de base uma projeção da posição de objeto do objeto de áudio na área de base é disposta. Ademais, o aparelho é configurado para determinar uma posição mapeada da projeção da posição de objeto com o uso de uma transformada (de preferência, uma transformada linear), que mapeia o triângulo de área de base (no qual a projeção da posição de objeto do objeto de áudio na área de base é disposta) em seu triângulo de domínio esférico associado. O aparelho é ainda configurado para derivar um ângulo de azimute e um valor de raio intermediário (por exemplo, um valor de raio bidimensional, por exemplo, em um plano de base do sistema de coordenada esférica, por exemplo, em uma elevação de zero) da posição mapeada.
[014] Por exemplo, um ajuste de raio que mapeia um triângulo de domínio esférico inscrito no círculo em um segmento de círculo pode ser usado. Por exemplo, um ajuste de raio obter um raio intermediário ajustado rx, pode ser usado. O ajuste de raio pode, por exemplo, escalonar o valor de raio 7, obtido antes em dependência do ângulo de azimute q.
[015] O aparelho é configurado para obter um valor de raio de domínio esférico e um ângulo de elevação em dependência do valor de raio intermediário (que pode ser ajustado ou não ajustado) e em dependência de uma distância da posição de objeto da área de base. O ângulo de elevação pode ser determinado como um ângulo de um triângulo retângulo que tem hastes do valor de raio intermediário e da distância da posição de objeto da área de base. Ademais, o raio de domínio esférico pode ser um comprimento de hipotenusa do triângulo retângulo, ou uma versão ajustada do mesmo.
[016] Ademais, o aparelho pode ser opcionalmente configurado para obter um ângulo de elevação ajustado, por exemplo, com o uso de um mapeamento não linear que mapeia linearmente ângulos na primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente ou extensão em comparação com a primeira região de ângulo mapeada, e em que, por exemplo, uma faixa de ângulo coberta juntamente pela primeira região de ângulo e pela segunda região de ângulo é idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo.
[017] Esse aparelho tem como base a constatação de que a combinação das etapas de processamento mencionadas acima fornece uma conversão de uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica com esforço computacional comparativamente pequeno enquanto permite obter uma qualidade de áudio razoavelmente boa. Além disso, foi constatado que as etapas mencionadas são tipicamente inversíveis com esforço moderado, de modo que seja possível voltar da representação esférica para uma representação cartesiana, por exemplo, no lado de um decodificador de áudio, com esforço moderado.
[018] Por exemplo, ao subdividir a área de base (também designada como área de base) da representação cartesiana em triângulos de área de base (também designados como triângulos de área de base) e por mapeamento de posições dentro dos triângulos de ângulo de base em posições dentro dos triângulos de domínio esférico, uma simples transição pode ser realizada a partir da representação cartesiana na representação esférica, o que exige pouco esforço computacional e que é facilmente inversível. Ademais, por uma escolha apropriada dos triângulos, pode ser garantido com pouco esforço computacional, que uma degradação fiscalizável da impressão de audição pode ser evitada ou pelo menos minimizada. Isso se deve ao fato de que os triângulos podem ser definidos de tal maneira que fontes de áudio dentro de um determinado triângulo dentre os triângulos ocasione uma impressão de audição similar.
[019] Por exemplo, configurações de alto-falante descritas em parâmetros cêntricos de ambiente e são convertidos com a conversão proposta em descrição egocêntrica preservam sua topologia. Ademais, também é desejado que posições de objeto que caem em uma posição exata de alto-falante ainda estão localizadas no mesmo alto-falante após a conversão. As modalidades de acordo com a invenção podem cumprir com essas exigências.
[020] Ademais, foi constatado que usar um procedimento de múltiplas etapas, em que um ângulo de azimute e um valor de raio intermediário (que pode ter um valor de raio bidimensional) são derivados, e em que um valor de raio de domínio esférico e um ângulo de elevação são derivados do valor de raio intermediário e em dependência da distância da posição de objeto da área de base, o mapeamento pode ser subdividido em etapas "pequenas", que podem ser realizadas com o uso de esforço computacional relativamente pequeno e que podem ser projetados de uma maneira facilmente inversível.
[021] Em uma modalidade preferencial, o aparelho é configurado para determinar a posição mapeada da projeção da posição de objeto com o uso de uma transformada linear descrita por uma matriz de transformada. O aparelho é configurado para obter a matriz de transformada em dependência do triângulo de área de base determinado. Em outras palavras, com base na determinação, em que triângulo de área de base de uma projeção da posição de objeto do objeto de áudio na área de base é disposta, a matriz de transformada pode ser selecionada (por exemplo, com base em uma pluralidade de matrizes de transformada pré-computadas). De modo alternativo, a matriz de transformada também pode ser calculada pelo aparelho, por exemplo, em dependência de posições de cantos de um triângulo de área de base determinado e do triângulo de domínio esférico determinado (associado). Desse modo, é muito fácil selecionar a matriz de transformada direita, e a transformada pode ser realizada com o uso de operações lineares computacionalmente simples.
[022] Em uma modalidade preferencial, a matriz de transformada é definida de acordo com uma equação, como mostrado nas reivindicações. Nesse caso, a matriz de transformada é determinada por coordenadas x e y de (por exemplo, dois) cantos do triângulo de área de base determinado e por coordenadas x e y de (por exemplo, dois) cantos do triângulo de domínio esférico associado. Por exemplo, pode ser assumido que o terceiro canto do triângulo de área de base determinado e/ou o terceiro canto do triângulo de domínio esférico associado podem estar na origem do sistema de coordenada, o que facilita a computação da transformada.
[023] Em uma modalidade preferencial, os triângulos de área de base compreendem um primeiro triângulo de ângulo de base que cobre uma área “na frente” de uma origem da representação cartesiana. Um segundo triângulo de área de base cobre uma área em um lado esquerdo da origem da representação cartesiana. Um terceiro triângulo de área de base cobre uma área em um lado direito da origem da representação cartesiana. Um quarto triângulo de área de base cobre uma área atrás da origem da representação cartesiana. Ao usar tais triângulos de área de base, os diferentes triângulos de área de base definem regiões que resultam em uma impressão de audição diferente (se um objeto for colocado em tal região). No entanto, seria opcionalmente possível distinguir ainda mais diferentes triângulos, para obter uma resolução espacial mais precisa (e/ou para reduzir artefatos que resultam da conversão da representação cartesiana na representação esférica).
[024] De acordo com um aspecto, a definição dos triângulos de área de base de acordo com uma segmentação com base nas posições de alto-falante no plano/camada horizontal é um recurso importante, consulte as Figuras 18 a MM e fórmulas com base em uma configuração de alto-falante 5.1 no plano horizontal. Para detalhes, referência também é realizada para seção 10.
[025] De acordo com uma modalidade, os triângulos de domínio esférico podem compreender um primeiro triângulo de domínio esférico que cobre uma área na frente de uma origem da representação esférica, um segundo triângulo de domínio esférico que cobre uma área em um lado esquerdo da origem da representação esférica, um terceiro triângulo de domínio esférico que cobre uma área em um lado direito da origem da representação esférica e um quarto triângulo de domínio esférico que cobre uma área atrás da origem da representação esférica. Esses quatro triângulos de domínio esférico correspondem bem aos quatro triângulos de área de base mencionados antes. No entanto, deve ser observado que os triângulos de domínio esférico podem ser substancialmente diferentes dos triângulos de área de base associados, por exemplo, uma vez que os mesmos compreendem ângulos diferentes. Os triângulos de área de base são, de preferência, inscritos em uma área quadrática em um x-y da representação cartesiana. Em contrapartida, os triângulos de domínio esférico são, por exemplo, inscritos em um círculo em um plano de elevação zero da representação esférica. Possivelmente, a disposição de triângulos também pode compreender simetria em relação a um eixo geométrico de simetria, em que o eixo geométrico de simetria pode, por exemplo, se estender em uma direção que é associada a uma vista frontal de um ouvinte ou de um ambiente de audição.
[026] Em uma modalidade preferencial, as coordenadas de cantos dos triângulos de área de base e as coordenadas de cantos dos triângulos de domínio esférico associados podem ser definidas como mostrado nas reivindicações. Foi constatado que tal escolha de triângulos traz resultados particularmente bons.
[027] Em uma modalidade preferencial, o aparelho é configurado para derivar o ângulo de azimute das coordenadas mapeadas da posição mapeada de acordo com uma regra de mapeamento como mostrado nas reivindicações. Por exemplo, a regra de mapeamento pode usar uma função de tangente de arco (arctan) para mapear as coordenadas da posição mapeada em um ângulo de azimute, em que um gerenciamento para “casos especiais” pode ser implantado (em particular, para o caso quando uma das coordenadas é zero).
[028] Tal derivação de ângulo de azimute também é computacionalmente eficaz. A regra computacional descrita é computacionalmente eficaz de modo particular e também numericamente estável, em que resultados não confiáveis são invalidados.
[029] Em uma modalidade preferencial, o aparelho é configurado para derivar o valor de raio intermediário de coordenadas mapeadas das posições mapeadas de acordo com uma equação como mostrado nas reivindicações. Tal computação de raio é particularmente simples de implantar e fornece bons resultados.
[030] Em uma modalidade preferencial, o aparelho é configurado para obter o valor de raio de domínio esférico em dependência do valor de raio intermediário com o uso de um ajuste de raio que mapeia um triângulo de domínio esférico inscrito em um círculo em um segmento de círculo. Foi constatado que tal transformada pode ser realizada avaliando-se uma única função trigonométrica e é, portanto, computacionalmente muito eficaz e também facilmente inversível. Ademais, foi constatado que a faixa completa de valores de raio disponíveis no domínio esférico pode ser utilizada usando-se tal abordagem.
[031] Em uma modalidade preferencial, o aparelho é configurado para obter o valor de raio de domínio esférico em dependência do valor de raio intermediário com o uso de um ajuste de raio, em que o ajuste de raio é adaptado para escalonar os valores de raio intermediário obtidos antes em dependência do ângulo de azimute. Em conformidade, é, por exemplo, possível refinar o valor de raio intermediário em dependência de uma razão entre o raio do círculo, no qual o respectivo triângulo de domínio esférico é inscrito, e a distância de uma hipotenusa de um triângulo retângulo equilátero do canto oposto da hipotenusa na direção determinada pelo ângulo de azimute.
[032] Em uma modalidade preferencial, o aparelho é configurado para obter o valor de raio de domínio esférico em dependência do valor de raio intermediário com o uso das equações de mapeamento, como definido nas reivindicações. Foi constatado que essa abordagem é particularmente bem adequada para uma configuração de alto-falante 5.1 + 4H.
[033] Em uma modalidade preferencial, o aparelho é configurado para obter o ângulo de elevação as um ângulo de um triângulo retângulo que tem hastes do valor de raio intermediário e da distância da posição de objeto da área de base. Foi constatado que tal computação do ângulo de elevação fornece um resultado particularmente bom e também permite uma inversão da transformada de coordenada com um esforço moderado.
[034] Em uma modalidade preferencial, o aparelho é configurado para obter o raio de domínio esférico como um comprimento de hipotenusa de um triângulo retângulo que tem hastes do valor de raio intermediário e da distância da posição de objeto da base são, ou como uma versão ajustada do mesmo. Foi constatado que tal computação é de baixa complexidade e é inversível. No entanto, em alguns casos, por exemplo, se o valor de raio de domínio esférico for simplesmente obtido como o comprimento de hipotenusa do triângulo retângulo, o valor de raio pode exceder um raio do círculo no qual os triângulos de domínio esférico são inscritos, de modo que seja vantajoso realizar outro ajuste, para, dessa maneira, trazer o valor de raio de domínio esférico ajustado para uma faixa de valores que é menor ou igual ao raio do círculo no qual os triângulos de domínio esférico são inscritos.
[035] Em uma modalidade preferencial, o aparelho é configurado para obter o ângulo de elevação, como descrito nas reivindicações, e/ou para obter o raio de domínio esférico como descrito nas reivindicações. Foi constatado que essas regras de computação trazem um esforço de computação comparativamente pequeno e também tipicamente permitem uma inversão da transformada coordenada com esforço moderado.
[036] Em uma modalidade preferencial, o aparelho é configurado para obter um ângulo de elevação ajustado (por exemplo, com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada, e em que, por exemplo, uma faixa de ângulo coberta juntamente pela primeira região de ângulo e pela segunda região de ângulo é igual a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo). Em conformidade, é possível adaptar a transformada de coordenada, por exemplo, para posições de alto-falante. Além disso, usando-se tal mapeamento, pode ser considerado que, em termos de impressão de audição, não há correspondência um para um entre ângulos de elevação na representação cartesiana e ângulos de elevação na representação esférica. Desse modo, ao realizar tal mapeamento não linear, que pode ser um mapeamento linear em relação à peça, um ajuste apropriado do ângulo de elevação pode ser realizado, que também é reversível com esforço moderado.
[037] Em uma modalidade preferencial, o aparelho é configurado para obter o ângulo de elevação ajustado com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo para uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada. Em conformidade, em algumas regiões, os ângulos de elevação são “comprimidos” e, em outras regiões, os ângulos de elevação são “espalhados” ao realizar a conversão. Isso ajuda a obter uma boa impressão de escuta.
[038] Em uma modalidade preferencial, uma faixa de ângulo coberta pela primeira região de ângulo e pela segunda região de ângulo (juntas) é idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo. Desse modo, uma determinada região de ângulo da elevação (por exemplo, de 0º a 90º) pode ser mapeada em uma região de ângulo do mesmo tamanho (por exemplo, de 0º a 90º), em que algumas regiões de ângulo são espalhadas e, em que algumas regiões de ângulo são comprimidas pelo mapeamento não linear.
[039] Em uma modalidade preferencial, o aparelho é configurado para mapear o ângulo de elevação no ângulo de elevação ajustado de acordo com a regra fornecida nas reivindicações. Foi constatado que tal regra fornece uma impressão de escuta particularmente boa.
[040] Em uma modalidade preferencial, o aparelho é configurado para obter um raio de domínio esférico ajustado com base em um raio de domínio esférico. Foi constatado que ajustar o raio de domínio esférico pode ser útil para evitar que o raio de domínio esférico exceda o raio do círculo no qual os triângulos de domínio esférico são inscritos.
[041] Em uma modalidade preferencial, o aparelho é configurado para realizar um mapeamento que mapeia limiares de um quadrado em um sistema cartesiano em um círculo em um sistema de coordenada esférica, a fim de obter o raio de domínio esférico ajustado. Foi constatado que tal mapeamento é apropriado a fim de trazer o raio de domínio esférico para uma faixa desejada de valores.
[042] Em uma modalidade preferencial, o aparelho é configurado para mapear o raio de domínio esférico no raio de domínio esférico ajustado de acordo com a regra fornecida nas reivindicações. Foi constatado que essa regra é bem adequada para trazer o raio de domínio esférico ajustado para a faixa desejada de valor, e que a regra descrita também é facilmente inversível.
[043] Outra modalidade cria um aparelho para converter uma posição de objeto de um objeto de áudio (por exemplo, “dados de posição de objeto”) de uma representação esférica (ou de um sistema de coordenada esférica representação) (por exemplo, que compreende um ângulo de azimute, um valor de raio de domínio esférico e um ângulo de elevação) em uma representação cartesiana (ou representação de sistema de coordenada cartesiana) (por exemplo, que compreende coordenadas x, y ez).
[044] Uma área de base da representação cartesiana (por exemplo, uma área quadrática em um plano x-y, por exemplo, que tem pontos de canto (-1;-1;0), (1;-1;0) , (1;1;0) e (-1;1;0)) é subdividida em uma pluralidade de triângulos de área de base (por exemplo, um triângulo verde, ou um triângulo mostrado com o uso de uma primeira hachura, um triângulo roxo ou um triângulo mostrado com o uso de uma segunda hachura, um triângulo vermelho ou um triângulo mostrado com o uso de uma terceira hachura, e um triângulo branco ou um triângulo mostrado com o uso de uma quarta hachura) (em que, por exemplo, os triângulos de área de base podem todos ter um canto em uma posição central da área de base), e em que uma pluralidade de triângulos de domínio esférico (correspondentes ou associados) é inscrita em um círculo de uma representação esférica (em que, por exemplo, cada um dos triângulos de domínio esférico é associado a um triângulo de área de base, e em que os triângulos de domínio esférico são tipicamente deformados em comparação com a base são triângulos, e em que há, de preferência, um mapeamento linear para mapeamento de um determinado triângulo de área de base em seu triângulo de domínio esférico associado). Por exemplo, os triângulos de domínio esférico podem todos compreender um canto em um centro do círculo.
[045] O aparelho pode ser opcionalmente configurado para obter um ângulo de elevação mapeado com base em um ângulo de elevação, por exemplo, com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada, e em que, por exemplo, uma faixa de ângulo coberta juntamente pela primeira região de ângulo e pela segunda região de ângulo é idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo.
[046] O aparelho também pode ser opcionalmente configurado para obter um raio de domínio esférico mapeado com base no raio de domínio esférico.
[047] O aparelho é ainda configurado para obter um valor que descreve uma distância da posição de objeto da área de base e um raio intermediário (que pode, por exemplo, ser um raio bidimensional) com base no ângulo de elevação ou no ângulo de elevação mapeado e com base no raio de domínio esférico ou no raio de domínio esférico mapeado. O aparelho pode ser opcionalmente configurado para realizar uma correção de raio com base no raio intermediário.
[048] O aparelho também é configurado para determinar uma posição dentro de um dos triângulos inscritos no círculo com base no raio intermediário, ou com base em uma versão corrigida do mesmo, e com base em um ângulo de azimute. Ademais, o aparelho é configurado para determinar uma posição mapeada da projeção da posição de objeto no plano de base com base na posição determinada dentro de um dos triângulos inscritos no círculo (por exemplo, com o uso de um mapeamento de transformada linear do triângulo no qual a posição determinada se encontra, em um triângulo associado ao plano de base). Por exemplo, a posição mapeada e a distância da posição de objeto da área de base podem, juntas, determinar a posição do objeto de áudio no sistema de coordenada cartesiana.
[049] Deve ser observado que esse aparelho tem como base considerações similares como o aparelho mencionado acima para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica. A conversão realizada pelo aparelho para converter uma posição de objeto de uma representação esférica em uma representação cartesiana pode, por exemplo, reverter a operação do aparelho mencionado acima. Além disso, foi constatado que as operações realizadas pelo aparelho para converter uma posição de objeto de um objeto de áudio da representação esférica na representação cartesiana são tipicamente computacionalmente simples, parcialmente devido ao fato de que as mesmas são divididas em etapas de processamento independentes (ou subsequentes) separadas de baixa complexidade.
[050] Em uma modalidade preferencial, o aparelho é configurado para obter um ângulo de elevação mapeado com base em um ângulo de elevação. Isso ajuda a advir de um ângulo de elevação, que é bem adequado para uma renderização de domínio esférico, para um ângulo de elevação que é bem adaptado para uma renderização de domínio cartesiano.
[051] Em uma modalidade preferencial, o aparelho é configurado para obter o ângulo de elevação mapeado com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada. Foi constatado que tal mapeamento linear em relação à peça (que é, como um todo, um mapeamento não linear) pode ser realizado de uma maneira computacionalmente muito eficaz e tipicamente traz uma impressão de audição aprimorada.
[052] Em uma modalidade preferencial, uma faixa de ângulo coberta juntamente pela primeira faixa de região de ângulo e pela segunda faixa de região de ângulo é idêntica a uma faixa de ângulo coberta juntamente pela primeira faixa de região de ângulo mapeada e pela segunda faixa de região de ângulo mapeada. Desse modo, uma determinada faixa de ângulo (por exemplo, entre 0º e 90º) pode ser mapeada em uma faixa de ângulo correspondente (por exemplo, também de 0º a 90º), em que algumas regiões de ângulo são comprimidas e em que algumas regiões de ângulo são espalhadas pelo mapeamento não linear, mas linear em relação à peça. Foi constatado que tal mapeamento é útil para obter uma boa impressão de escuta e é computacionalmente eficaz.
[053] Em uma modalidade preferencial, o aparelho é configurado para mapear o ângulo de elevação no ângulo de elevação mapeado de acordo com a regra fornecida nas reivindicações. Foi constatado que essa regra é uma implantação particularmente vantajosa.
[054] Em uma modalidade preferencial, o aparelho é configurado para obter um raio de domínio esférico mapeado com base em um raio de domínio esférico. Deve ser observado que o raio de domínio esférico (que pode, por exemplo, estar dentro de uma faixa de valores determinada por um raio do círculo no qual os triângulos de domínio esférico são inscritos) é subideal. Por essa razão, é vantajoso aplicar um mapeamento, para derivar o raio de domínio esférico mapeado. Por exemplo, o raio de domínio esférico pode ser mapeado de modo que valores do raio de domínio esférico mapeado sejam maiores que um raio do círculo. Por exemplo, isso pode ser alcançado para um raio de domínio esférico que está próximo ao raio do círculo, por exemplo, com o uso da relação
1. E para s 45º | seng Para45º < 6 <90º
[055] com o raio de domínio esférico r e o raio de domínio esférico mapeado 7.
[056] Em outras palavras, o raio de domínio esférico mapeado pode, por exemplo, ser determinado de tal maneira que um valor de raio bidimensional derivado do valor de raio de domínio esférico mapeado seja menor ou igual ao raio do dito círculo.
[057] Em uma modalidade preferencial, o aparelho é configurado para escalonar o raio de domínio esférico em dependência do ângulo de elevação ou em dependência do ângulo de elevação mapeado. Por exemplo, o aparelho pode ser configurado para realizar um mapeamento, que mapeia um círculo em um sistema de coordenada esférica em limiares de um quadrado em um sistema cartesiano (por exemplo, para derivar o ângulo de elevação mapeado). Ao usar tal mapeamento, pode ser obtido que o raio de domínio esférico mapeado é bem adequado para uma derivação de um valor de raio bidimensional e também para obter um valor de coordenada z.
[058] Em uma modalidade preferencial, o aparelho é configurado para obter o raio de domínio esférico mapeado com base no raio de domínio esférico de acordo com uma regra, como descrito nas reivindicações. Foi constatado que tal regra é particularmente eficaz e resulta em uma boa impressão de escuta.
[059] Em uma modalidade preferencial, o aparelho é configurado para obter um valor z que descreve uma distância da posição de objeto de uma área de base de acordo com uma regra definida nas reivindicações. De modo alternativo ou além disso, o aparelho pode ser configurado para obter o raio intermediário de acordo com a regra definida nas reivindicações. Foi constatado que essas regras são particularmente eficazes e simples de implantar.
[060] Em uma modalidade preferencial, o aparelho é configurado para realizar a correção de raio com o uso de um mapeamento que mapeia segmentos de círculo em triângulos inscritos em um círculo. Por exemplo, o raio intermediário, que pode assumir valores entre zero e o raio do círculo no qual os triângulos de domínio esférico são inscritos independente de um ângulo de azimute, pode ser mapeado de tal maneira que o valor máximo obtenível do raio de domínio esférico mapeado seja limitado a uma distância de um lado do triângulo inscrito no círculo do centro do círculo (por exemplo, na direção descrita pelo ângulo de azimute). Por exemplo, o raio intermediário é escalonado com o uso de uma razão dependente de ângulo de azimute entre a distância de um lado de um respectivo triângulo de domínio esférico (por exemplo, na direção descrita pelo ângulo de azimute) e o raio do círculo no qual o triângulo de domínio esférico é inscrito.
[061] Em uma modalidade preferencial, o aparelho é configurado para escalonar o raio intermediário em dependência do ângulo de azimute, para obter um raio corrigido. Tal escalonamento é tipicamente computacionalmente simples e ainda apropriado para mapear um setor de um círculo em um triângulo sem ocasionar distorção excessiva.
[062] Outra modalidade preferencial tem como base a segmentação determinada pela configuração de alto-falante no plano horizontal, como, por exemplo, 5.1.
[063] Em uma modalidade preferencial, o aparelho é configurado para obter o raio corrigido com base no raio intermediário de acordo com uma regra, como definido nas reivindicações. Foi constatado que essa regra é particularmente vantajosa e resulta em uma impressão de escuta particularmente boa.
[064] Em uma modalidade preferencial, o aparelho é configurado para determinar uma posição dentro de um dos triângulos inscritos no círculo de acordo com uma regra definida nas reivindicações. Essa regra usa apenas funções trigonométricas simples, e é bem adequada para definir claramente uma coordenada x e uma coordenada y.
[065] Em uma modalidade preferencial, o aparelho é configurado para determinar a posição mapeada da proteção da posição de objeto no plano de base (por exemplo, uma coordenada x e uma coordenada y) com base na posição determinada dentro de um dos triângulos inscritos no círculo com o uso de uma transformada linear que mapeia o triângulo no qual a posição determinada está em um triângulo associado ao mesmo no plano de base. Foi constatado que tal transformada linear é um método muito eficaz (e inversível) para mapear entre o domínio esférico e o domínio cartesiano.
[066] Em uma modalidade preferencial, o aparelho é configurado para determinar a posição mapeada da projeção da posição de objeto no plano de base de acordo com a regra de mapeamento definida nas reivindicações. Foi constatado que essa regra de mapeamento é eficaz e inversível.
[067] Em uma modalidade preferencial, a matriz de transformada é definida como descrito nas reivindicações.
[068] Em uma modalidade preferencial, os triângulos de área de base compreendem um primeiro triângulo de área de base, um segundo triângulo de área de base, um terceiro triângulo de área de base e um quarto triângulo de área de base, como já mencionado acima.
[069] De modo similar, em uma modalidade preferencial, os triângulos de domínio esférico compreendem um primeiro triângulo de domínio esférico, um segundo triângulo de domínio esférico, um terceiro triângulo de domínio esférico e um quarto triângulo de domínio esférico, como já mencionado acima.
[070] Em outras modalidades preferenciais, coordenadas dos cantos da base ângulo triângulos são definidas como mencionado nas reivindicações. Uma escolha específica dos triângulos de área de base, dos triângulos de domínio esférico e dos cantos dos ditos triângulos tem como base as mesmas considerações, como mencionado acima, em relação ao aparelho para converter uma posição de objeto de uma representação cartesiana em uma representação esférica.
[071] Outra modalidade de acordo com a invenção cria um fornecedor de transmissão contínua de áudio para fornecer uma transmissão contínua de áudio. O fornecedor de transmissão contínua de áudio é configurado para receber informações de posição de objeto de entrada que descrevem uma posição de um objeto de áudio em uma representação cartesiana. O fornecedor de transmissão contínua de áudio é ainda configurado para fornecer uma transmissão contínua de áudio que compreende informações de posição de objeto de saída que descrevem a posição do objeto em uma representação esférica. O fornecedor de transmissão contínua de áudio compreende um aparelho como descrito acima a fim de converter a representação cartesiana na representação esférica.
[072] De acordo com outra modalidade, também é possível ter um fornecedor de transmissão contínua de áudio com uma transformada esférica para cartesiana.
[073] Tal fornecedor de transmissão contínua de áudio pode lidar com informações de posição de objeto de entrada com o uso de uma representação cartesiana e ainda pode fornecer uma transmissão contínua de áudio que compreende uma representação esférica da posição. Desse modo, a transmissão contínua de áudio é utilizável por decodificadores de áudio que necessitam de uma representação esférica da posição de um objeto a fim de trabalhar de modo eficaz.
[074] Outra modalidade de acordo com a invenção cria um sistema de produção de conteúdo de áudio. O sistema de produção de conteúdo de áudio é configurado para determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação cartesiana. O sistema de produção de conteúdo de áudio compreende um aparelho como descrito acima a fim de converter a representação cartesiana na representação esférica. Ademais, o sistema de produção de conteúdo de áudio é configurado para incluir a representação esférica em uma transmissão contínua de áudio.
[075] De modo alternativo, no entanto, também esférica para cartesiana é possível.
[076] Tal sistema de produção de conteúdo de áudio tem a vantagem de que a posição de objeto pode ser inicialmente determinada em uma representação cartesiana, que é conveniente e mais intuitiva para muitos usuários. No entanto, o sistema de produção de conteúdo de áudio pode, independentemente, fornecer a transmissão contínua de áudio de modo que a transmissão contínua de áudio compreenda uma representação esférica da posição de objeto que é originalmente determinada em uma representação cartesiana. Desse modo, a transmissão contínua de áudio é utilizável por decodificadores de áudio que necessitam de uma representação esférica da posição de um objeto a fim de trabalhar de modo eficaz.
[077] Outra modalidade de acordo com a invenção cria um aparelho de reprodução de áudio. O aparelho de reprodução de áudio é configurado para receber uma transmissão contínua de áudio que compreende uma representação esférica de informações de posição de objeto. O aparelho de reprodução de áudio também compreende um aparelho como descrito antes, que é configurado para converter a representação esférica em uma representação cartesiana das informações de posição de objeto (ou, de modo alternativo, vice-versa). O aparelho de reprodução de áudio ainda compreende um renderizador configurado para renderizar um objeto de áudio para uma pluralidade de sinais de canal associados a transdutores de som (por exemplo, alto-falantes) em dependência da representação cartesiana das informações de posição de objeto.
[078] Em conformidade, o aparelho de reprodução de áudio pode lidar com transmissões contínuas de áudio que compreendem uma representação esférica das informações de posição de objeto, embora o renderizador necessite das informações de posição de objeto em uma representação cartesiana. Em outras palavras, é evidente que o aparelho para converter a posição de objeto de uma representação esférica em uma representação cartesiana pode ser vantajosamente usado em um aparelho de reprodução de áudio.
[079] Deve ser observado que todas as aplicações (por exemplo, ferramenta de produção ou decodificador) podem ser implantadas de uma maneira reversa (espelhada), em que uma conversão das coordenadas esféricas em coordenadas cartesianas pode ser substituída por uma conversão de coordenadas cartesianas em coordenadas esféricas e vice-versa (por exemplo, Esf->Cart e Cart->Esf).
[080] As modalidades adicionais de acordo com a invenção criam respectivos métodos.
[081] No entanto, deve ser observado que os métodos têm como base as mesmas considerações que os aparelhos correspondentes. Ademais, os métodos podem ser suplementados por qualquer um dos recursos, funcionalidades e detalhes que são descritos no presente documento em relação aos aparelhos, tanto individualmente quanto tomados em combinação.
[082] Ademais, as modalidades de acordo com a invenção criam programas de computador para realizar os ditos métodos.
BREVE DESCRIÇÃO DAS FIGURAS
[083] As modalidades de acordo com o presente pedido serão, de modo subsequente, descritas em referência às figuras reveladas, nas quais: A Figura 1 mostra um diagrama esquemático de blocos de um aparelho para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica, de acordo com uma modalidade da presente invenção; A Figura 2 mostra um diagrama esquemático de blocos de um aparelho para converter uma posição de objeto de um objeto de uma representação esférica em uma representação cartesiana, de acordo com uma modalidade da presente invenção; A Figura 3 mostra uma representação esquemática de um exemplo de um ambiente de parâmetro cartesiano com posições correspondentes de alto-falante para uma configuração 5.1 +4H; A Figura 4 mostra uma representação esquemática de um sistema de coordenada esférica de acordo com Áudio MPEG-H 3D ISO/IEC 23008-3:2015; A Figura 5 mostra uma representação esquemática de posições de alto- falante em um sistema de coordenada cartesiana e em um sistema de coordenada esférica; A Figura 6 mostra uma representação gráfica de um mapeamento de triângulos em um sistema de coordenada cartesiana em triângulos correspondentes em um sistema de coordenada esférica; A Figura 7 mostra uma representação esquemática de um mapeamento de um ponto dentro de um triângulo no sistema de coordenada cartesiana em um ponto dentro de um triângulo correspondente no sistema de coordenada esférica; A Tabela 1 mostra coordenadas de cantos de triângulos no sistema de coordenada cartesiana e cantos ou triângulos correspondentes no sistema de coordenada esférica;
A Figura 8 mostra uma representação esquemática de um ajuste de raio que é usado em modalidades de acordo com a presente invenção;
A Figura 9 mostra uma representação esquemática de uma derivação de um ângulo de elevação e de um raio de domínio esférico, que é usada em modalidades de acordo com a presente invenção;
A Figura 10 mostra uma representação esquemática de uma correção de um raio, que é usada em modalidades de acordo com a presente invenção:
A Figura 11 mostra um diagrama esquemático de blocos de um fornecedor de transmissão contínua de áudio, de acordo com uma modalidade da presente invenção;
A Figura 12 mostra um diagrama esquemático de blocos de um sistema de produção de conteúdo de áudio, de acordo com uma modalidade da presente invenção;
A Figura 13 mostra um diagrama esquemático de blocos de um aparelho de reprodução de áudio, de acordo com uma modalidade da presente invenção;
A Figura 14 mostra um fluxograma de um método, de acordo com uma modalidade da presente invenção;
A Figura 15 mostra um fluxograma de um método, de acordo com uma modalidade da presente invenção; e
A Figura 16 mostra um fluxograma de um método, de acordo com uma modalidade da presente invenção;
A Figura 17 mostra uma representação esquemática de um exemplo de um ambiente de parâmetro cartesiano com posições correspondentes de alto-falante para uma configuração 5.1 +4H;
A Figura 18 mostra uma representação esquemática de um sistema de coordenada esférica de acordo com Áudio MPEG-H 3D ISO/IEC 23008-3:2015;
A Figura 19 mostra uma representação esquemática de posições de alto- falante em um sistema de coordenada cartesiana e em um sistema de coordenada esférica;
A Figura 20 mostra uma representação gráfica de um mapeamento de triângulos em um sistema de coordenada cartesiana em triângulos correspondentes em um sistema de coordenada esférica; A Figura 21 mostra uma representação esquemática de um mapeamento de um ponto dentro de um triângulo no sistema de coordenada cartesiana em um ponto dentro de um triângulo correspondente no sistema de coordenada esférica; A Tabela 2 mostra coordenadas de cantos de triângulos no sistema de coordenada cartesiana e cantos ou triângulos correspondentes no sistema de coordenada esférica; A Figura 22 mostra uma representação esquemática de um ajuste de raio que é usado em modalidades de acordo com a presente invenção; A Figura 23 mostra uma representação esquemática de uma derivação de um ângulo de elevação e de um raio de domínio esférico, que é usada em modalidades de acordo com a presente invenção; A Figura 24 mostra uma representação esquemática de uma correção de um raio, que é usada em modalidades de acordo com a presente invenção.
DESCRIÇÃO DETALHADA DAS MODALIDADES
[084] A seguir, modalidades inventivas diferentes e aspectos serão descritos. Além disso, modalidades adicionais serão definidas pelas reivindicações reveladas.
[085] Deve ser observado que quaisquer modalidades como definido pelas reivindicações podem ser suplementadas por qualquer um dos detalhes (recursos e funcionalidades) descritos no presente documento. Além disso, as modalidades descritas no presente documento podem ser usadas individualmente, e também podem ser opcionalmente suplementadas por qualquer um dos detalhes (recursos e funcionalidades) incluídos nas reivindicações.
[086] Além disso, deve ser observado que aspectos individuais descritos no presente documento podem ser usados individualmente ou em combinação. Desse modo, detalhes podem ser adicionados a cada um dos ditos aspectos individuais sem adicionar detalhes a outro aspecto dos ditos aspectos.
[087] Também deve ser observado que a presente revelação descreve, explícita ou implicitamente, recursos utilizáveis em um codificador de áudio (aparelho para fornecer uma representação codificada de um sinal de áudio de entrada) e em um decodificador de áudio (aparelho para fornecer uma representação decodificada de um sinal de áudio com base em uma representação codificada). Desse modo, qualquer um dos recursos descritos no presente documento pode ser usado no contexto de um codificador de áudio e no contexto de um decodificador de áudio.
[088] Ademais, recursos e funcionalidades revelados no presente documento que se referem a um método também podem ser usados em um aparelho (configurado para realizar tal funcionalidade). Ademais, quaisquer recursos e funcionalidades revelados no presente documento em relação a um aparelho também podem ser usados em um método correspondente. Em outras palavras, os métodos revelados no presente documento podem ser suplementados por qualquer um dos recursos e funcionalidades descritos em relação aos aparelhos.
[089] Além disso, qualquer um dos recursos e funcionalidades descritos no presente documento pode ser implantado em hardware ou em software, ou com o uso de uma combinação de hardware e software, como será descrito na seção “Alternativas de Implantação”.
1. MODALIDADE DE ACORDO COM A FIGURA 1
[090] A Figura 1 mostra um diagrama esquemático de blocos de um aparelho para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica.
[091] O aparelho 100 é configurado para receber a representação cartesiana 110, que pode, por exemplo, compreender coordenadas cartesianas x, y, z. Ademais, o aparelho 100 é configurado para fornecer uma representação esférica 112, que pode, por exemplo, compreender coordenadas r, q e 8.
[092] O aparelho pode ter como base a suposição de que uma área de base de uma representação cartesiana é subdividida em uma pluralidade de triângulos de área de base (por exemplo, como mostrado na Figura 6) e que uma pluralidade de triângulos de domínio esférico é inscrita em um círculo de uma representação esférica (por exemplo, como também mostrado na Figura 6).
[093] O aparelho 100 compreende um determinador de triângulo (ou determinação) 120, que é configurado para determinar, em qual dos triângulos de área de base uma projeção da posição de objeto do objeto de áudio na área de base é disposta. Por exemplo, o determinador de triângulo 120 pode fornecer uma identificação de triângulo 122 com base em uma coordenada x e uma coordenada y das informações de posição de objeto.
[094] Ademais, o aparelho pode compreender um determinador de posição mapeada que é configurado para determinar uma posição mapeada da projeção da posição de objeto com o uso de uma transformada linear, que mapeia o triângulo de área de base (no qual a projeção da posição de objeto do objeto de áudio na área de base é disposta) em seus triângulos de domínio esférico associados. Em outras palavras, o determinador de posição mapeada pode mapear posições dentro de um primeiro triângulo de área de base em posições dentro de um primeiro triângulo de domínio esférico, e pode mapear posições dentro de um segundo triângulo de área de base em posições dentro de um segundo triângulo de domínio esférico. De modo geral, posições dentro de um i-ésimo triângulo de área de base podem ser mapeadas em posições dentro de um i-ésimo triângulo de domínio esférico (em que um limiar do i-ésimo triângulo de área de base pode ser mapeado em um limiar do i-ésimo triângulo de domínio esférico). Em conformidade, o determinador de posição mapeada 130 pode fornecer uma posição mapeada 132 com base na coordenada x e na coordenada y e também com base na identificação de triângulo 122 fornecida pelo determinador de triângulo 120.
[095] Ademais, o aparelho 100 compreende um derivador de ângulo de azimute/valor de raio intermediário 140 que é configurado para derivar um ângulo de azimute (por exemplo, um ângulo q) e um valor de raio intermediário (por exemplo, um valor de raio intermediário 7.) da posição mapeada 132 (que pode ser descrito por duas coordenadas). As informações de ângulo de azimute são representadas com
142 e o valor de raio intermediário é representado com 144.
[096] Opcionalmente, o aparelho 100 compreende um ajustador de raio 146, que recebe o valor de raio intermediário 144 e fornece, com base no mesmo, um valor de raio intermediário ajustado 148. A seguir, o processamento adicional será descrito em referência ao valor de raio intermediário ajustado. No entanto, na ausência do ajustador de raio opcional 146, o valor de raio intermediário 144 pode ocorrer no lugar do valor de raio intermediário ajustado 148.
[097] O aparelho 100 também compreende um calculador de ângulo de elevação 150 que é configurado para obter um ângulo de elevação 152 (por exemplo, representado com 8) em dependência do valor de raio intermediário 144, ou independência do valor de raio intermediário ajustado 148, e também em dependência da coordenada z, que descreve a distância da posição de objeto da área de base.
[098] Ademais, o aparelho 100 compreende um calculador de valor de raio de domínio esférico que é configurado para obter um valor de raio de domínio esférico em dependência do valor de raio intermediário 144 ou do valor de raio intermediário ajustado 148 e também em dependência da coordenada z que descreve a distância da posição de objeto da área de base. Em conformidade, o calculador de valor de raio de domínio esférico 160 fornece um valor de raio de domínio esférico 162, que também é representado com 7.
[099] Opcionalmente, o aparelho 100 também compreende um corretor de ângulo de elevação (ou ajustador) 170, que é configurado para obter um ângulo de elevação ajustado ou corrigido 172 (representado, por exemplo, com 8) com base no ângulo de elevação 152.
[0100] Ademais, o aparelho 100 também compreende um corretor de valor de raio de domínio esférico (ou um ajustador de valor de raio de domínio esférico) 180, que é configurado para fornecer um valor de raio de domínio esférico ajustado ou corrigido 182 com base no valor de raio de domínio esférico 162. O valor de raio de domínio esférico ajustado ou corrigido 182 é representado, por exemplo, com r.
[0101] Deve ser observado que o aparelho 100 pode ser suplementado por qualquer um dos recursos e funcionalidades descritos no presente documento. Além disso, deve ser observado que cada um dos blocos individuais pode, por exemplo, ser implantado com o uso dos detalhes descritos abaixo, sem necessitar que outros blocos sejam implantados com o uso de detalhes específicos.
[0102] Em relação à funcionalidade do aparelho 100, deve ser observado que o aparelho é configurado para realizar múltiplas etapas pequenas, em que cada uma é inversível no lado de um aparelho que converte uma representação esférica de volta para uma representação cartesiana.
[0103] A funcionalidade geral do aparelho tem como base a ideia de que uma posição de objeto, que é determinada em uma representação cartesiana (em que, por exemplo, posições válidas de objeto podem estar dentro de um cubo centralizado em uma origem do sistema de coordenada cartesiana e alinhado com os eixos geométricos do sistema de coordenada cartesiana) pode ser mapeada em uma representação esférica (em que, por exemplo, posições válidas de objeto podem estar dentro de uma esfera centralizada em uma origem do sistema de coordenada esférica) sem degradar de modo significativo uma impressão de audição. Por exemplo, mapeamento de alto-falante direto é habilitado se posições de alto-falante definirem os triângulos/segmentação. Uma projeção da posição de objeto na área de base (por exemplo, no plano x-y) pode ser mapeada em uma posição dentro de um triângulo de domínio esférico que é associado a um triângulo no qual a projeção da posição de objeto na área de base é disposta. Em conformidade, uma posição mapeada 132 é obtida, que é uma posição bidimensional dentro da área dentro na qual os triângulos de domínio esférico são dispostos.
[0104] Um ângulo de azimute é diretamente derivado dessa posição mapeada 132 com o uso do derivador de ângulo de azimute ou derivação de ângulo de azimute. No entanto, foi constatado que um ângulo de elevação 152 e um valor de raio de domínio esférico 162 também podem ser obtidos com base em um valor de raio intermediário 144 (ou com base em um valor de raio intermediário ajustado 148) que pode ser derivado da posição mapeada 132. Em uma opção simples, o valor de raio intermediário 144, que pode ser derivado facilmente da posição mapeada 132, pode ser usado para derivar o valor de raio de domínio esférico 162, em que a coordenada z é considerada (calculador de valor de raio de domínio esférico 160). Além disso, o ângulo de elevação 152 pode ser facilmente derivado do valor de raio intermediário 144, ou do valor de raio intermediário ajustado 148, em que a coordenada z também é considerada. Em particular, o mapeamento que é realizado pelo determinador de posição mapeada 130 aprimora significativamente os resultados em comparação com uma abordagem que não realizaria tal mapeamento.
[0105] Ademais, foi constatado que a qualidade da conversão pode ser ainda aprimorada se o valor de raio intermediário for ajustado pelo ajustador de raio 146 e se o ângulo de elevação 152 for ajustado pelo corretor de ângulo de elevação opcional ou ajustador de ângulo de elevação 170 e se o valor de raio de domínio esférico 162 for corrigido ou ajustado pelo corretor de valor de raio de domínio esférico ou ajustador de valor de raio de domínio esférico 180. O raio ajustador 146 e o corretor de valor de raio de domínio esférico 180 podem, por exemplo, ser usados para ajustar a faixa de valores do raio, de modo que o valor de raio resultante 182 compreenda uma faixa de valores bem adaptada à representação cartesiana. De modo similar, o corretor de ângulo de elevação 170 pode fornecer um ângulo de elevação corrigido 172, que traz uma impressão de escuta particularmente boa, visto que será alcançado que o ângulo de elevação é mais bem ajustado à representação esférica que é tipicamente usada no campo de processamento de áudio.
[0106] Ademais, deve ser observado que o aparelho 100 pode ser opcionalmente suplementado por qualquer um dos recursos e funcionalidades descritos no presente documento, tanto individualmente quanto em combinação.
[0107] Em particular, o aparelho 100 pode ser opcionalmente suplementado por qualquer um dos recursos e funcionalidades descritos em relação à “conversão de lado de produção”.
[0108] Os recursos, funcionalidades e detalhes descritos no presente documento podem ser opcionalmente introduzidos individualmente ou em combinação no aparelho 100.
2. MODALIDADE DE ACORDO COM A FIGURA 2
[0109] A Figura 2 mostra um diagrama esquemático de blocos de um aparelho para converter uma posição de objeto de um objeto de áudio de uma representação esférica em uma representação cartesiana.
[0110] O aparelho para converter uma posição de objeto de uma representação esférica em uma representação cartesiana é representado em sua totalidade com 200.
[0111] O aparelho 200 recebe informações de posição de objeto, que são uma representação esférica. A representação esférica pode, por exemplo, compreender um valor de raio de domínio esférico r, um valor de ângulo de azimute (por exemplo, q) e um valor de elevação (por exemplo, 8).
[0112] Similar ao aparelho 100, o aparelho 200 também tem como base a suposição de que uma área de base da representação cartesiana (por exemplo, uma área quadrática em um plano x-y, por exemplo, que tem pontos de canto (-1;-1;0), (1;- 1;0), (1;1;0) e (-1;1;0)) é subdividida em uma pluralidade de triângulos de área de base (por exemplo, um primeiro triângulo de área de base, um segundo triângulo de área de base, um terceiro triângulo de área de base e quarto triângulo de área de base). Por exemplo, os triângulos de área de base podem todos ter um canto em uma posição central da área de base. Ademais, é assumido que há uma pluralidade de triângulos de domínio esférico (correspondentes ou associados) que são inscritos em um círculo de uma representação esférica (em que, por exemplo, cada um dos triângulos de domínio esférico é associado a um triângulo de área de base, em que os triângulos de domínio esférico são tipicamente deformados em comparação com os triângulos de área de base associados, e em que há um mapeamento linear para mapeamento de um determinado triângulo de área de base em seu triângulo de área esférica associado). Ademais, os triângulos de domínio esférico podem, por exemplo, compreender um canto em um centro do círculo.
[0113] O aparelho 200 compreende opcionalmente um mapeador de ângulo de elevação 220, que recebe o ângulo de valor de elevação da representação esférica
210. O mapeador de ângulo de elevação 220 é configurado para obter um ângulo de elevação mapeado 222 (por exemplo, representado com 8) com base em um ângulo de elevação (por exemplo, representado com 9). Por exemplo, o mapeador de ângulo de elevação 220 pode ser configurado para obter o ângulo de elevação mapeado 222 com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região angulada mapeada, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região angulada mapeada e em que, por exemplo, uma faixa de ângulo coberta juntamente pela primeira região de ângulo e pela segunda região de ângulo é idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo.
[0114] Ademais, o aparelho 200 compreende opcionalmente um mapeador de valor de raio de domínio esférico 230, que recebe o raio de domínio esférico (por exemplo, r). O mapeador de valor de raio de domínio esférico 230, que é opcional, pode ser configurado para obter um raio de domínio esférico mapeado 232 com base no raio de domínio esférico (por exemplo, r).
[0115] Ademais, o aparelho 200 compreende um calculador de coordenada z 240, que é configurado para obter um valor (por exemplo, z) que descreve uma distância da posição de objeto da área de base com base no ângulo de elevação 218 ou com base no ângulo de elevação mapeado 222, e com base no raio de domínio esférico 228 ou com base no raio de domínio esférico mapeado 232. O valor que descreve uma distância da posição de objeto da área de base é representado com 242, e também pode ser representado com “Z”.
[0116] Ademais, o aparelho 200 compreende um calculador de raio intermediário 250, que é configurado para obter um raio intermediário 252 (por exemplo, representado com rx) com base no ângulo de elevação 218 ou com base no ângulo de elevação mapeado 222 e também com base no raio de domínio esférico 228 ou com base no raio de domínio esférico mapeado 232.
[0117] O aparelho 200 compreende opcionalmente um corretor de raio 260, pode ser configurado para receber o raio intermediário 252 e o ângulo de azimute 258 e para fornecer um valor de raio corrigido (ou ajustado) 262.
[0118] O aparelho 200 também compreende um determinador de posição 270, que é configurado para determinar uma posição dentro de um dos triângulos inscritos no círculo (triângulo de domínio esférico) com base no raio intermediário 252, ou com base na versão corrigida 262 do raio intermediário, e com base no valor de azimute 258 (por exemplo, q). A posição dentro de um dos triângulos pode ser representada com 272 e pode, por exemplo, ser descrita por duas coordenadas X quaisquer 3 (que são coordenadas cartesianas dentro do plano no qual os triângulos de domínio esférico estão).
[0119] O aparelho 200 pode compreender opcionalmente uma identificação de triângulo 280, que determina em qual dos triângulos de domínio esférico a posição 272 está. Essa identificação, que é realizada pela identificação de triângulo 280, pode, por exemplo, ser usada para selecionar uma regra de mapeamento a ser usada por um mapeador 290.
[0120] O mapeador 290 é configurado para determinar uma posição mapeada 292 da projeção da posição de objeto no plano de base com base na posição determinada 272 dentro de um dos triângulos inscritos no círculo (por exemplo, com o uso de uma transformada ou um mapeamento de transformada linear o triângulo, no qual a posição determinada está, em um triângulo associado no plano de base). Em conformidade, a posição mapeada 292 (que pode ser uma posição bidimensional dentro do plano de base) e a distância da posição de objeto da área de base (por exemplo, o valor z 242) podem, juntas, determinar a posição do objeto de áudio no sistema de coordenada cartesiana.
[0121] Deve ser observado que a funcionalidade do aparelho 200 pode, por exemplo, ser inversa à funcionalidade do aparelho 100, de modo que seja possível mapear uma representação esférica 112 fornecida pelo aparelho 100 de volta para uma representação cartesiana da posição de objeto com o uso do aparelho 200 (em que as informações de posição de objeto 210, na representação esférica (que pode compreender o ângulo de elevação 218, o raio de domínio esférico 228 e ângulo de azimute 258) pode ser igual à representação esférica 112 fornecida pelo aparelho 100, ou pode ser derivada da representação esférica 112 (por exemplo, pode ser uma versão quantizada ou codificada com perdas da representação esférica 112) . Por exemplo, por uma escolha apropriada do processamento, pode ser alcançado que a conversão realizada pelo aparelho 100 é inversível com esforço moderado pelo aparelho 200.
[0122] Ademais, deve ser observado que é um recurso importante do aparelho 200 que há um mapeamento de uma posição dentro de um dos triângulos de domínio esférico em uma posição no plano de base da representação cartesiana, devido ao fato de que essa funcionalidade permite um mapeamento que fornece uma boa impressão de escuta com complexidade moderada.
[0123] Ademais, deve ser observado que o aparelho 200 pode ser suplementado por qualquer um os recursos, funcionalidades e detalhes que são descritos no presente documento, tanto individualmente quanto em combinação.
3. MODALIDADES E CONSIDERAÇÕES ADICIONAIS
[0124] A seguir, alguns detalhes relacionados à regra de mapeamento para posição de metadados de objeto ou para posição de metadados de objeto dinâmica serão descritos. Deve ser observado que a posição não tem que ser dinâmica. Além disso, posições estáticas de objeto podem ser mapeadas.
[0125] As modalidades de acordo com a invenção estão relacionadas a uma conversão de metadados de objeto de lado de produção, especialmente dados de posição de objeto, no caso de lado de produção, um sistema de coordenada cartesiana é usado, mas no formato de transporte a posição de metadados de objeto é descrita nas coordenadas esféricas.
[0126] Foi reconhecido que é um problema o fato de que, nas coordenadas cartesianas, os alto-falantes não estão sempre localizados nas posições matematicamente "corretas" em comparação com o sistema de coordenada esférica.
Portanto, é desejada conversão que garanta que a área cuboide do espaço cartesiano seja projetada corretamente na esfera, ou semiesfera.
[0127] Por exemplo, posições de alto-falante são igualmente renderizadas com o uso de um renderizador de objeto de áudio com base em um sistema de coordenada esférica (por exemplo, um renderizador como descrito no padrão de áudio MPEG-H 3D) ou com o uso de um renderizador baseado em cartesiana com o algoritmo de conversão correspondente.
[0128] Foi constatado que as superfícies cuboides devem ser mapeadas ou projetadas (ou, algumas vezes, têm que ser mapeadas ou projetadas) na superfície da esfera na qual os alto-falantes estão localizados. Ademais, é desejado (ou, algumas vezes, exigido), que o algoritmo de conversão tenha uma complexidade computacional pequena. Isso é especialmente verdadeiro para a etapa de conversão de coordenadas esféricas em cartesianas.
[0129] Uma aplicação exemplificativa para a invenção é: usar ferramentas de autorização de objeto de áudio de estado da técnica que, em geral, usam um espaço de parâmetro cartesiano (x, y, z) para as coordenadas de objeto de áudio, mas usam um formato de transporte que descreve as posições de objeto de áudio em coordenadas esféricas (azimute, elevação, raio), como, por exemplo, Áudio MPEG-H 3D. No entanto, o formato de transporte pode ser agnóstico ao renderizador (esférico ou cartesiano), que é aplicado posteriormente.
[0130] Deve ser observado que, a seguir, a invenção é descrita, como um exemplo, para uma configuração de alto-falante 5.1+4H, mas pode ser facilmente transferida para todos os tipos de configurações de alto-falante (por exemplo, 7.1+4,
22.2, etc.) ou espaços de parâmetro cartesiano variados (orientação diferente dos eixos geométricos, ou escalonamento diferente dos eixos geométricos, ...).
COMPARAÇÃO GERAL DE SISTEMAS DE COORDENADA
[0131] A seguir, uma comparação geral de sistemas de coordenada será fornecida.
[0132] Com esse propósito, a Figura 3 mostra uma representação esquemática de um exemplo de um ambiente de parâmetro cartesiano com posições correspondentes de alto-falante para uma configuração 5.1+4 H. Como pode ser observado, uma posição normalizada de objeto pode, por exemplo, estar dentro de cuboides que têm cantos nas coordenadas (-1;-1;0), (1;-1;0), (1;1;0), (-1;1;0), (-1;-1;1), (1;-1;1), (1;1;1) e (-1;1;1).
[0133] Como uma comparação, a Figura 4 mostra uma representação esquemática de um sistema de coordenada esférica de acordo com ISO/IEC 23008- 3:2015 áudio MEG-H 3D. Como pode ser observado, uma posição de um objeto é descrita por um ângulo de azimute, por um ângulo de elevação e por um (domínio esférico) raio.
[0134] No entanto, deve ser observado que as coordenadas X e Y no sistema de coordenada ISO são definidos de modo diferente em comparação com o sistema de coordenada cartesiana descrito acima.
[0135] No entanto, deve ser observado que os sistemas de coordenada mostrados aqui devem ser considerados apenas como exemplos.
3.1 CONVERSÃO DE LADO DE PRODUÇÃO (CARTESIANA 2 ESFÉRICA OU CARTESIANA PARA ESFÉRICA)
[0136] A seguir, uma conversão de uma representação cartesiana (por exemplo, de uma posição de objeto) em uma representação esférica (por exemplo, da posição de objeto) será descrita, que pode, de preferência, ser realizada pelo aparelho 100.
[0137] Deve ser observado que os recursos, funcionalidades e detalhes descritos aqui podem ser opcionalmente adotados no aparelho 100, tanto individualmente quanto em combinação.
[0138] No entanto, a “conversão de lado de projeção” (que é uma conversão de uma representação cartesiana para uma representação esférica) descrita aqui pode ser considerada como uma modalidade de acordo com a invenção, que pode ser usada como é (ou em combinação com um ou mais dos recursos e funcionalidades do aparelho 100, ou em combinação com um ou mais dos recursos e funcionalidades como definido pelas reivindicações).
[0139] Por exemplo, aqui é assumido que as posições de alto-falante são determinadas em coordenadas esféricas, como descrito, por exemplo, pela recomendação ITU ITU-R BS .2159-7 e descrito na especificação MPEG-H.
[0140] A conversão é aplicada em uma abordagem separada. Primeiro, as coordenadas x e y são mapeadas para o ângulo de azimute q e o raio ry, no plano xy/azimute (por exemplo, um plano de base). Isso pode, por exemplo, ser realizado por blocos 120, 130, 140 do aparelho 100. Posteriormente, o ângulo de elevação e o raio no espaço 3D (em geral, designado como valor de raio de domínio esférico) são calculados com o uso da coordenada z. Isso pode ser realizado, por exemplo, por blocos 146 (opcional), 150, 160, 170 (opcional) e 180 (opcional). O mapeamento é descrito, como um exemplo (ou de modo exemplificativo), para a configuração de alto- falante 5.1+4H.
CASO ESPECIAL X=Y=0;
[0141] Deve ser observado que, opcionalmente, a presunção a seguir pode ser realizada para o caso especial x=y= 0.
[0142] Paraz> O: q = indefinido (=0º), 0= 90º er=z.
Paraz=0O: q = indefinido (=0º), 0= 0º er=O, 1) CONVERSÃO EM PLANO XY
[0143] A conversão que ocorre no plano xy pode, por exemplo, compreender três etapas que serão descritas a seguir.
[0144] Etapa 1: (opcional; pode ser uma etapa preparatória)
[0145] Na primeira etapa, triângulos no sistema de coordenada cartesiana são mapeados para triângulos correspondentes no sistema de coordenada esférica.
[0146] Por exemplo, a Figura 6 mostra uma representação gráfica de triângulos de área de base e de triângulos de domínio esférico associados. Por exemplo, uma representação gráfica 610 mostra quatro triângulos. Por exemplo, há uma direção de coordenada x 620 e uma direção de coordenada y 622. Uma origem é, por exemplo,
na posição 624. Por exemplo, quatro triângulos são inscritos em um quadrado que pode, por exemplo, compreender coordenadas normalizadas (-1;-1), (1;-1), (1;1) e (- 1;1). Um primeiro triângulo (mostrado em verde ou com o uso de uma primeira hachura) é representado com 630 e compreende cantos em (1;1), (-1;1) e (0:0). Um segundo triângulo, mostrado em roxo ou com o uso de uma segunda hachura, é representado com 632 e tem cantos nas coordenadas (-1;1), (-1;-1) e (0:0). Um terceiro triângulo 634 é mostrado em vermelho ou com o uso de terceira hachura e tem cantos em coordenadas (-1;-1), (1;-1) e (0;0). Um quarto triângulo 636 é mostrado em branco ou com o uso de uma quarta hachura e tem cantos nas coordenadas (1;- 1), 1;1) e (0;0).
[0147] Em conformidade, toda a área interna de um quadrado de unidade (normalizado) é preenchida pelos quatro triângulos, em que os quatro triângulos, todos, têm um de seus cantos na origem do sistema de coordenada. Pode ser definido que o primeiro triângulo 630 está “na frente” da origem (por exemplo, na frente de um ouvinte que assume-se ser a origem), o segundo triângulo 632 está no lado esquerdo da origem, o terceiro triângulo está “atrás” da origem e o quarto triângulo 636 está no lado direito da origem. Dito de modo diferente, o primeiro triângulo 630 cobre uma primeira faixa de ângulo quando observado a partir da origem, o segundo triângulo 632 cobre uma segunda faixa de ângulo quando observado a partir da origem, o terceiro triângulo cobre uma terceira faixa de ângulo quando observado a partir da origem e o quarto triângulo cobre uma quarta faixa de ângulo quando observado a partir da origem. Deve ser observado que quatro possíveis posições de alto-falante coincidem com os cantos do quadrado de unidade, e que uma quinta posição de alto- falante (alto-falante central) pode ser assumida como estando na coordenada (0;1).
[0148] Uma representação gráfica 650 mostra triângulos associados que são inscritos em um círculo unitário em um sistema de coordenada esférica.
[0149] Como pode ser observado na representação gráfica 650, quatro triângulos são inscritos no círculo unitário, que está, por exemplo, em uma área de base de um sistema de coordenada esférica (por exemplo, um ângulo de elevação de zero). Um primeiro triângulo de domínio esférico 660 é mostrado na cor verde ou em uma primeira hachura, e é associado ao primeiro triângulo de área de base 630. O segundo triângulo de domínio esférico 662 é mostrado em uma cor roxa ou em uma segunda hachura e é associado ao segundo triângulo de área de base 632. Um terceiro triângulo de domínio esférico 664 é mostrado em uma cor vermelha ou uma terceira hachura e é associado ao terceiro triângulo de área de base 634. Um quarto triângulo de domínio esférico 666 é mostrado em uma cor branca ou em uma quarta hachura e é associado a um quarto triângulo de área de base 636. Os triângulos adjacentes de domínio esférico compartilham uma borda de triângulo comum. Além disso, os quatro triângulos de domínio esférico cobrem uma faixa completa de 360º quando observados a partir da origem. Por exemplo, o primeiro triângulo de domínio esférico 660 cobre uma primeira faixa de ângulo quando observado a partir da origem, o segundo triângulo de domínio esférico 662 cobre uma segunda faixa de ângulo quando observado a partir da origem, o terceiro triângulo de domínio esférico 664 cobre uma terceira faixa de ângulo quando observado a partir da origem e o quarto triângulo de domínio esférico 666 cobre uma quarta faixa de ângulo quando observado a partir da origem. Por exemplo, o primeiro triângulo de domínio esférico 660 pode cobrir uma faixa de ângulo na frente da origem, o segundo triângulo de domínio esférico 662 pode cobrir uma faixa de ângulo em um lado esquerdo ou origem, o terceiro triângulo de domínio esférico pode cobrir uma faixa de ângulo atrás da origem e o quarto triângulo de domínio esférico 666 pode cobrir uma faixa de ângulo em um lado direito da origem. Ademais, quatro posições de alto-falante podem ser dispostas em posições no círculo que são cantos comuns de triângulos adjacentes de domínio esférico. Outra posição de alto-falante (por exemplo, de um alto-falante central) pode ser disposta fora dos triângulos de domínio esférico (por exemplo, no círculo “na frente” do primeiro triângulo de domínio esférico).
[0150] De modo geral, também deve ser observado que as faixas de ângulo cobertas pelos triângulos de domínio esférico podem ser diferentes das faixas de ângulo cobertas pelos triângulos de área de base associados. Por exemplo, enquanto cada um dos triângulos de área de base pode, por exemplo, cobrir uma faixa de ângulo de 90º quando observado a partir da origem do sistema de coordenada cartesiana, o primeiro, o segundo e o quarto triângulos de domínio esférico podem cobrir faixas de ângulo que são menores que 90º e o terceiro triângulo de domínio esférico pode cobrir uma faixa de ângulo que é maior que 90º (quando observado a partir da origem do sistema de coordenada esférica). De modo alternativo, mais triângulos podem ser usados, como mostrado no exemplo abaixo com 5 segmentos.
[0151] Ademais, enquanto os triângulos de área de base 630, 632, 634, 636 podem ser iguais, os triângulos de domínio esférico podem ter formatos diferentes, em que o formato do segundo triângulo de domínio esférico 666 e o formato do quarto triângulo de domínio esférico 666 podem ser iguais (mas espelhados um em relação ao outro).
[0152] Ademais, deve ser observado que um número maior de triângulos poderia ser usado tanto na representação cartesiana quanto na representação esférica.
[0153] A seguir, um mapeamento de triângulos no sistema de coordenada cartesiana para triângulos correspondentes no sistema de coordenada esférica será mostrado, como um exemplo, para um triângulo.
[0154] Como um exemplo, a Figura 7 mostra uma representação gráfica de um triângulo de área de base e um triângulo de domínio esférico associado. Como pode ser observado em uma representação gráfica 710, o triângulo de área de base, que pode ser o “segundo triângulo de área de base" compreende cantos nas coordenadas P1, P2 e na origem do sistema de coordenada cartesiana. O triângulo de domínio esférico associado (por exemplo, o “segundo triângulo de domínio esférico”) pode compreender cantos nas coordenadas À,,P, e na origem do sistema de coordenada cartesiana, como pode ser observado em uma representação gráfica 750. Por exemplo, um ponto P dentro do primeiro triângulo de área de base 632 é mapeado em um ponto correspondente P no triângulo de domínio esférico associado 662.
[0155] Os triângulos, ou posições nos mesmos, como, por exemplo, o ponto P podem ser projetados (ou mapeados) um em relação ao outro com o uso de uma transformada linear: p= ()-2e
[0156] A matriz de transformada pode ser calculada (ou pré-calculada), por exemplo, com o uso das posições conhecidas dos cantos dos triângulos (associados) Py, Pa, P, e P, . Esses pontos dependem da configuração de alto-falante e das posições correspondentes dos alto-falantes e do triângulo no qual a posição P está localizada. n= [8 Pe peça leo nono meo ee 1Xx"2y 2x" 1y Ly 2y 2y7"1y 1X 27 17" 2X
[0157] No entanto, deve ser observado que a matriz de transformada T pode, por exemplo, ser pré-computada.
[0158] Por exemplo, se o conceito for implantado com o uso do aparelho 100, o determinador de triângulo 120 pode determinar em qual triângulo uma posição P a ser convertida de uma representação cartesiana em uma representação esférica está localizada (ou, mais precisamente, pode determinar em qual dos triângulos de área de base uma projeção P (bidimensional) da posição (original, tridimensional) no plano de base é disposta, em que é assumido que a posição pode ser uma posição tridimensional descrita por uma coordenada x, uma coordenada y e uma coordenada z). De acordo com a determinação na qual os triângulos da projeção P da posição estão, uma matriz de transformada apropriada T pode ser selecionada e pode ser aplicada (por exemplo, à projeção P) pelo determinador de posição mapeada 130.
[0159] Desse modo, a posição mapeada À é obtida.
[0160] A seguir, um exemplo relacionado aos triângulos de área de base e dos triângulos de domínio esférico será descrito.
[0161] Por exemplo, a configuração de alto-falante 5.1+4H contém na camada intermediária uma configuração de alto-falante 5.1 padrão, que é a base para a projeção no plano xy. Na tabela 1, os pontos correspondentes P1, P2, À, e P, são determinados para os quatro triângulos que têm que ser projetados. No entanto, deve ser observado que os pontos, como mostrado na tabela 1, devem ser considerados apenas como um exemplo, e que o conceito também pode ser aplicado em combinação com outras disposições de alto-falante, em que os triângulos podem naturalmente ser escolhidos de uma maneira diferente.
[0162] Etapa2
[0163] Em uma segunda etapa, um raio é, (que também pode ser designado como um raio intermediário ou valor de raio intermediário) e o ângulo de azimute q são calculados com base nas coordenadas mapeadas X% e 3. Por exemplo, esse cálculo é realizado pelo desviante de ângulo de azimute e pelo determinador de valor de raio intermediário, que é mostrado como bloco 140 no aparelho 100. Por exemplo, a computação ou mapeamento a seguir podem ser realizados: = ETT tanº o paray>0 —90º paraz =0 AX>O 0º parajy=0AX=O0 q= 90 paray=0AZX<O0 —90º + tan" = paray <0 AZX>O0 —180º paray<0AX=O0 90º + tan paraj<0AX<O
[0164] Etapa 3 (opcional)
[0165] O raio (por exemplo, o valor de raio intermediário £,, ) pode ser ajustado, devido ao fato de que os alto-falantes são, por exemplo, colocados em um quadrado no sistema de coordenada cartesiana em contraste com o sistema de coordenada esférica. No sistema de coordenada esférica, os alto-falantes são posicionados, por exemplo, em um círculo.
[0166] Para ajustar o raio, o limiar do quadrado de alto-falante cartesiano é projetado no círculo do sistema de coordenada esférica. Isso significa que a corda é projetada no segmento correspondente do círculo.
[0167] Deve ser observado que essa funcionalidade, pode, por exemplo, ser realizada pelo ajustador de raio 146 do aparelho 100.
[0168] A Figura8 ilustra o escalonamento, considerando, por exemplo, o primeiro triângulo de domínio esférico. Um ponto 840 dentro do primeiro triângulo de domínio esférico 830 é descrito, por exemplo, por um valor de raio intermediário £,, e por um ângulo de azimute À. Os pontos na corda podem, por exemplo, tipicamente compreender valores de raio (intermediários) que são menores que o raio do círculo (em que o raio do círculo pode ser 1 se for assumido que o raio é normalizado). No entanto, o “raio” (ou coordenada de raio, ou distância da origem) dos pontos na corda pode ser dependente do ângulo de azimute, em que pontos de extremidade da corda podem ter um valor de raio que é idêntico ao raio do círculo. No entanto, para os pontos dentro do primeiro triângulo de domínio esférico, os valores de raio podem ser escalonados pela razão entre o raio do círculo (por exemplo, 1) e o valor de raio (por exemplo, a distância da origem) de um respectivo ponto na corda. Em conformidade, os valores de raio de pontos na corda podem ser escalonados de modo que se tornem iguais ao raio do círculo. Outros pontos (como, por exemplo, ponto 840) que têm o mesmo ângulo de azimute, são escalonados de uma maneira proporcional.
[0169] Um exemplo para tal ajuste do raio (mais precisamente, do valor de raio intermediário) será fornecido a seguir:
[0170] Para || < 30º: . Ccosq xy = Txy cos 30º Para 30º < |Q| < 110º: , cos(70º — lol) xy = xy o Para 110º < |é| < 180º: . cos(180º—|Q|) IE cost4or 2) CONVERSÃO DE COMPONENTE Z
[0171] Por exemplo, a elevação de uma camada de topo é assumida como sendo um ângulo de elevação de 30º em um sistema de coordenada esférica.
[0172] Dito de modo diferente, é assumido, como um exemplo, que alto-falantes elevados (que podem ser considerados como constituindo uma “camada de topo”) são dispostos em um ângulo de elevação de 30º.
[0173] A Figura 9 mostra, como um exemplo, uma definição de quantidades em um sistema de coordenada esférica. Como pode ser observado na Figura 9, definições são mostradas em uma vista de projeção bidimensional. Em particular, a Figura 9 mostra o valor de raio intermediário (ajustado) rx, a coordenada z da representação cartesiana, um valor de raio de domínio esférico 7 e um ângulo de elevação ôÔ.
[0174] A seguir, diferentes etapas para determinar 7 e 6, ou versões corrigidas ou ajustadas r, 9 das mesmas, serão descritas.
[0175] Etapa 1: Em um exemplo, é possível calcular o ângulo de elevação ô com base no raio rx, (que pode ser o valor de raio intermediário ajustado) e o componente z (que pode ser o valor z da representação cartesiana). Essa computação pode, por exemplo, ser realizada pelo calculador de ângulo de elevação 150. Ademais, o método também compreende calcular o raio 3D 7 (também designado como valor de raio de domínio esférico) com base no ângulo ô (também designado como ângulo de elevação) e rxy. Por exemplo, uma computação f= rxy /cos(Ô) pode ser usada.
[0176] De modo alternativo, no entanto, o raio 3D 7 pode ser computado com base no raio r., e o componente z. Essa computação pode, por exemplo, ser realizada pelo calculador de valor de raio de domínio esférico 160.
[0177] Por exemplo, ô e f podem ser computadas de acordo com: d=tan'Éú Toy
[0178] Etapa 2: (opcional)
[0179] Opcionalmente, uma correção do raio 7 devido à projeção dos limiares retangulares do sistema cartesiano no círculo unitário da coordenada esférica pode ser realizada.
[0180] A Figura 10 mostra uma representação esquemática dessa transformada.
[0181] Como pode ser observado a partir da Figura 10, o valor de raio de domínio esférico f pode assumir valores que são maiores que o raio do círculo unitário no sistema de coordenada esférica. Em referência à equação mencionada acima nas etapas anteriores, * pode assumir valores até V2 sob a suposição de que rx, pode assumir valores entre O e 1 e sob a suposição de que z pode assumir valores entre O e 1, ou entre -1 e 1 (por exemplo, para pontos dentro de um cubo unitário dentro do sistema de coordenada esférica).
[0182] Em conformidade, o valor de raio de domínio esférico é corrigido ou ajustado, para obter, dessa maneira, um valor de raio corrigido (ou ajustado) de domínio esférico r. Por exemplo, a correção ou ajuste podem ser realizados com o uso das equações ou regras de mapeamento a seguir: Para 0 < 0 < 45º: r=f cosô Para 45º < D < 90º: r=senô
[0183] Ademais, deve ser observado que o ajuste ou correção mencionados acima do valor de raio de domínio esférico podem ser realizados pelo corretor de valor de raio de domínio esférico 180.
[0184] Etapa 3: (opcional)
[0185] Opcionalmente, uma correção do ângulo de elevação à pode ser realizada devido à colocação diferente dos alto-falantes no sistema de coordenada cartesiana (8 = 45º) e esférica (6 = 30º).
[0186] Em outras palavras, visto que os alto-falantes de altura ou alto-falantes elevados são, por exemplo, dispostos em diferentes elevações em um sistema de coordenada cartesiana e em um sistema de coordenada esférica, um mapeamento de Ô para O pode ser opcionalmente realizado. Tal mapeamento pode ser útil para aprimorar uma impressão de audição que pode ser alcançada no lado de um decodificador de áudio. Por exemplo, o mapeamento de Ô para 8 será realizado de acordo com a equação ou regra de mapeamento a seguir:
52 para 8 < 45º 9= 45º . - 459) DO ÃO 30º para45º < ô<90º
[0187] No entanto, fórmulas mais gerais poderiam ser usadas, como será descrito abaixo.
[0188] Por exemplo, o mapeamento de à para 8 pode ser realizado pelo corretor de ângulo de elevação 170.
[0189] Em conclusão, detalhes relacionados à funcionalidade que pode ser usada quando transforma uma representação cartesiana em uma representação esférica, foram descritos. Os detalhes descritos aqui podem ser opcionalmente introduzidos no aparelho 100, tanto individualmente quanto em combinação.
3.2 CONVERSÃO DE LADO DE DECODIFICADOR (ESFÉRICO PARA CARTESIANO OU “ESF 2 CART”) (MODALIDADE)
[0190] No lado de decodificador, uma conversão inversa (que pode ser inversa ao procedimento realizado no lado de produção) pode ser executada. Isso significa que as etapas de conversão podem, por exemplo, ser revertida em ordem oposta.
[0191] A seguir, alguns detalhes serão descritos.
1) CONVERSÃO DE ELEVAÇÃO E PROJEÇÃO DE RAIO EM PLANO XY (CÁLCULO DE COMPONENTE Z) CASO ESPECIAL O = 90º: (OPCIONAL)
[0192] Opcionalmente, um gerenciamento especial pode ser realizado no caso de 8 = 90º. Por exemplo, as configurações a seguir podem ser usadas nesse caso: x=0,y=0ez=r
[0193] Etapa 1: (opcional)
[0194] Opcionalmente, um mapeamento de 6 a Ô pode ser realizado que pode, por exemplo, reverter o mapeamento (opcional) de Ô para 8 mencionado acima. Por exemplo, o mapeamento de 6 para Ô pode ser realizado com o uso da regra de mapeamento a seguir:
E para 6 < 30º õ= | eo [E 39º) aos 305) * 45º para30º< é <90º
[0195] Deve ser observado que o mapeamento de 8 para Ô pode, por exemplo, ser realizado pelo mapeador de ângulo de elevação 220, que pode ser considerado como sendo opcional.
[0196] Etapa 2: (opcional)
[0197] Opcionalmente, uma inversão de uma correção de raio pode ser realizada. Por exemplo, a correção mencionada acima do raio 7 devido à projeção dos limiares retangulares do sistema cartesiano para o círculo unitário do sistema de coordenada esférica pode ser revertida por tal operação.
[0198] Por exemplo, a inversão da correção de raio pode ser realizada com o uso da regra de mapeamento a seguir: = para Ô < 45º F= cos 8 : — para 45º < 6 < 90º
[0199] Por exemplo, a inversão da correção de raio pode ser realizada pelo mapeador de valor de raio de domínio esférico 230.
[0200] Etapa 3: Ademais, uma coordenada z e um valor de raio ou “valor de raio intermediário “r.y podem ser calculados com base no valor de raio de domínio esférico mapeado 7 e com base no ângulo de elevação mapeado 6 (ou, de modo alternativo, com base em um valor de raio de domínio esférico r e um ângulo de elevação 8, se o mapeamento opcional mencionado acima de 6 para 6 e a inversão opcional mencionada acima da correção de raio forem omitidos).
[0201] Por exemplo, o cálculo de z e r,, pode ser realizado de acordo com as regras de mapeamento a seguir: z=f senô nW=f cos 3
[0202] Por exemplo, o cálculo da coordenada z pode ser realizado pelo calculador de coordenada z 240. O cálculo de rx, pode, por exemplo, ser realizado pelo calculador de raio intermediário 250.
2) CÁLCULO DE COMPONENTE X E Y
[0203] A seguir, a computação de um componente x e de um componente y será descrita. Por exemplo, o componente x e o componente y são determinados com base no raio intermediário r, e com base no ângulo de azimute q.
[0204] Etapa 1: (opcional)
[0205] Opcionalmente, uma inversão da correção de raio pode ser realizada. Por exemplo, o ajuste de raio opcional, que é realizado devido ao fato de que os alto- falantes são colocados em um quadrado no sistema de coordenada cartesiana em contraste com o sistema de coordenada esférica, pode ser revertido.
[0206] A inversão opcional da correção de raio pode, por exemplo, ser realizada de acordo com a regra de mapeamento a seguir: cos 30º ara || < 30º x Tos ? p PIS ty = cos so” ra 30º <|q| < 110º xy = Ty cos(70º — [q1) para [NS cos 140” 110º < |&]| < 180º xy cos(180º — |&|) para 91 <
[0207] Por exemplo, a inversão opcional da correção de raio pode ser realizada pelo corretor de raio 260.
[0208] Etapa 2: Ademais, um cálculo de coordenadas X e 37 pode ser realizado. Por exemplo, X e y podem ser determinadas com base no valor de raio corrigido %,, e com base no ângulo de azimute. Por exemplo, a regra de mapeamento a seguir pode ser usada pelo cálculo de e 5: o —fy Senq para |&| < 90º 7 (th, sent180º - q) para9goº <Q] <180º so Fey Cos Q para |&| < 90º 7? (é, cos(180º — ||) para 90º < [q] < 180º
[0209] O cálculo de X e 7 pode, por exemplo, ser realizado pelo determinador de posição 270.
[0210] Etapa 3: Ademais, um cálculo de coordenadas x e y, que são coordenadas na representação cartesiana, pode ser realizado.
[0211] Em particular, uma transformada linear Tº pode ser usada. A matriz de transformada T pode ser um inverso da matriz de transformada T mencionada acima. A matriz de transformada T pode, por exemplo, ser selecionada em dependência da questão na qual o triângulo de domínio esférico das coordenadas X e 3 é disposto. Com esse propósito, uma identificação de triângulo 280 pode ser opcionalmente realizada. Então, uma matriz de transformada apropriada T pode ser selecionada, que é definida como mencionado acima.
[0212] Por exemplo, o cálculo de coordenadas x e y pode ser realizado de acordo com a regra de mapeamento a seguir: re Gero
[0213] Por exemplo, o cálculo de x e y será realizado pelo mapeador 290, em que a matriz de mapeamento apropriada T? é selecionada em dependência de coordenadas 7 e 7 e, em particular, em dependência da questão na qual os triângulos de domínio esférico de um ponto têm coordenadas 3 e 3 estão dispostos.
[0214] Para concluir, uma derivação de coordenadas cartesianas x, y, z com base em coordenadas esféricas r, q e 8 foi descrita.
[0215] No entanto, deve ser mencionado que o cálculo acima poderia ser adaptado, por exemplo, escolhendo-se diferentes triângulos de área de base, triângulos de domínio esférico ou constantes de regra de mapeamento. Além disso, diversos triângulos poderiam ser variados, por exemplo, dividindo-se um dos triângulos de área de base em dois triângulos de área de base e/ou definindo-se mais triângulos de domínio esférico.
[0216] Também deve ser observado que qualquer um dos detalhes descritos no presente documento pode ser opcionalmente introduzido no aparelho 200, tanto individualmente, quanto em combinação.
3. FORNECEDOR DE TRANSMISSÃO CONTÍNUA DE ÁUDIO DE
ACORDO COM A FIGURA 11
[0217] A Figura 11 mostra um diagrama esquemático de blocos de um fornecedor de transmissão contínua de áudio, de acordo com uma modalidade da presente invenção.
[0218] O fornecedor de transmissão contínua de áudio de acordo com a Figura 11 é representado em sua totalidade com 1100. O fornecedor de transmissão contínua de áudio 1100 é configurado para receber informações de posição de objeto de entrada que descreve uma posição de um objeto de áudio em uma representação cartesiana. Ademais, o fornecedor de transmissão contínua de áudio é configurado para fornecer uma transmissão contínua de áudio 1112 que compreende informações de posição de objeto de saída que descreve a posição do objeto de áudio em uma representação esférica. O fornecedor de transmissão contínua de áudio 1100 compreende um aparelho 1130 para converter posição de objeto de um objeto de áudio para uma representação cartesiana em uma representação esférica.
[0219] O aparelho 1130 é usado para converter a representação cartesiana, que é incluída nas informações de posição de objeto de entrada, na representação esférica, que é incluída na transmissão contínua de áudio 1112. Em conformidade, o fornecedor de transmissão contínua de áudio 1100 tem capacidade para fornecer uma transmissão contínua de áudio que descreve uma posição de objeto em uma representação esférica, embora as informações de posição de objeto de entrada descrevam meramente a posição do objeto de áudio em uma representação cartesiana. Desse modo, a transmissão contínua de áudio 1112 é utilizável por decodificadores de áudio que exigem uma representação esférica de uma posição de objeto para renderizar de modo apropriado um conteúdo de áudio. Desse modo, o fornecedor de transmissão contínua de áudio 1100 é bem adequado para uso em um ambiente de produção em que as informações de posição de objeto estão disponíveis em uma representação cartesiana. Deve ser observado que muitos ambientes de produção de áudio são adaptados para especificar de modo conveniente uma posição de um objeto de áudio em uma representação cartesiana (por exemplo, com o uso de coordenadas x, y, z). Desse modo, o fornecedor de transmissão contínua de áudio 1100 pode receber informações de posição de objeto de tal equipamento de produção de áudio e fornece uma transmissão contínua de áudio 1112 que é utilizável por um decodificador de áudio que depende de uma representação esférica das informações de posição de objeto.
[0220] Ademais, deve ser observado que o fornecedor de transmissão contínua de áudio 1100 pode compreender opcionalmente funcionalidades adicionais. Por exemplo, o fornecedor de transmissão contínua de áudio 1100 pode compreender um codificador de áudio que recebe informações de áudio de entrada e fornece, com base no mesmo, uma representação de áudio codificada. Por exemplo, o fornecedor de transmissão contínua de áudio pode receber um sinal de entrada de um canal ou pode receber um sinal de entrada de múltiplos canais e fornecer, com base no mesmo, uma representação codificada do sinal de áudio de entrada de um canal ou do sinal de áudio de entrada de múltiplos canais, que também é incluído na transmissão contínua de áudio 1112. Por exemplo, o um ou mais canais de entrada podem representar um sinal de áudio de um “objeto de áudio” (por exemplo, de uma fonte de áudio específica, como um instrumento musical específico, ou uma outra fonte de som específica). O sinal de áudio pode ser codificado por um codificador de áudio incluído no fornecedor de transmissão contínua de áudio e a representação codificada pode ser incluída na transmissão contínua de áudio. A codificação pode, por exemplo, usar um codificador de domínio de frequência (como um codificador AAC, ou uma versão aprimorada do mesmo) ou um codificador de áudio de domínio de predição linear (como um codificador de áudio baseado em LPC). No entanto, uma posição do objeto de áudio pode, por exemplo, ser descrita pelas informações de posição de objeto de entrada 1110, e pode ser convertida em uma representação esférica pelo aparelho 1130, em que a representação esférica das informações de posição de objeto de entrada pode ser incluída na transmissão contínua de áudio. Em conformidade, o conteúdo de áudio de um objeto de áudio pode ser codificado separadamente das informações de posição de objeto, o que tipicamente aprimora significativamente uma eficácia de codificação.
[0221] No entanto, deve ser observado que o fornecedor de transmissão contínua de áudio pode compreender opcionalmente funcionalidades adicionais, como uma funcionalidade de mixagem de redução (por exemplo, para sinais de mixagem de redução de uma pluralidade de objetos de áudio em um ou dois ou mais sinais de mixagem de redução), e pode ser configurado para fornecer uma representação codificada do um ou dois ou mais sinais de mixagem de redução na transmissão contínua de áudio 1112.
[0222] Ademais, o fornecedor de transmissão contínua de áudio pode opcionalmente também compreende uma funcionalidade para obter algumas informações de lado que descrevem uma relação entre dois ou mais sinais de objeto de dois ou mais objetos de áudio (como, por exemplo, uma correlação interobjeto, uma diferença de tempo interobjeto, uma diferença de fase interobjeto e/ou uma diferença de nível interobjeto). Essas informações de lado podem ser incluídas na transmissão contínua de áudio 1112 pelo fornecedor de transmissão contínua de áudio, por exemplo, em uma versão codificada.
[0223] Dessa maneira, as informações podem ser incluídas na transmissão contínua de áudio 1112 pelo fornecedor de transmissão contínua de áudio, por exemplo, em uma versão codificada.
[0224] Desse modo, o fornecedor de transmissão contínua de áudio 1100 pode, por exemplo, ser configurado para incluir um sinal de mixagem de redução codificado, metadados de relação de objeto codificados (informações de lado) e informações codificadas de posição de objeto na transmissão contínua de áudio, em que as informações codificadas de posição de objeto podem ser em uma representação esférica.
[0225] No entanto, o fornecedor de transmissão contínua de áudio 1100 pode ser opcionalmente suplementado por qualquer um dos recursos e funcionalidades conhecidos pelo indivíduo versado na técnica em relação a fornecedores de transmissão contínua de áudio e codificadores de áudio.
[0226] Além disso, deve ser observado que o aparelho 1130 pode, por exemplo, corresponde ao aparelho 100 descrito acima, e pode compreender opcionalmente recursos e funcionalidades e detalhes adicionais, como descrito no presente documento.
4. SISTEMA DE PRODUÇÃO DE CONTEÚDO DE ÁUDIO DE ACORDO COM A FIGURA 12
[0227] A Figura 12 mostra um diagrama esquemático de blocos de um sistema de produção de conteúdo de áudio 1200, de acordo com uma modalidade da presente invenção.
[0228] O sistema de produção de conteúdo de áudio 1200 pode ser configurado para determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação cartesiana. Por exemplo, o sistema de produção de conteúdo de áudio pode compreender uma interface de usuário, em que um usuário pode inserir as informações de posição de objeto em uma representação cartesiana. No entanto, opcionalmente, o sistema de produção de conteúdo de áudio pode também derivar as informações de posição de objeto na representação cartesiana de outras informações de entrada, por exemplo, de uma medição da posição de objeto ou de uma simulação de um movimento de um objeto, ou de qualquer outra funcionalidade apropriada.
[0229] Ademais, o sistema de produção de conteúdo de áudio compreende um aparelho para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica, como descrito no presente documento. O aparelho para converter a posição de objeto é representado com 1230 e pode corresponder ao aparelho 100 como descrito acima. Ademais, o aparelho 1230 é usado para converter a determinada representação cartesiana na representação esférica.
[0230] Ademais, o sistema de produção de conteúdo de áudio é configurado para incluir a representação esférica fornecida pelo aparelho 1230 em uma transmissão contínua de áudio 1212.
[0231] Desse modo, o sistema de produção de conteúdo de áudio pode fornecer uma transmissão contínua de áudio que compreende informações de posição de objeto em uma representação esférica embora as informações de posição de objeto possam ser originalmente determinadas em uma representação cartesiana (por exemplo, de uma interface de usuário ou com o uso de qualquer outro conceito de determinação de posição de objeto).
[0232] Naturalmente, o sistema de produção de conteúdo de áudio pode também incluir outras informações de conteúdo de áudio, por exemplo, uma representação codificada de um sinal de áudio e, possivelmente, meta informações adicionais na transmissão contínua de áudio 1212. Por exemplo, o sistema de produção de conteúdo de áudio pode incluir as informações adicionais descritas em relação ao fornecedor de transmissão contínua de áudio 1110 na transmissão contínua de áudio
1212.
[0233] Desse modo, o sistema de produção de conteúdo de áudio 1200 pode compreender opcionalmente um codificador de áudio que fornece uma representação codificada de um ou mais sinais de áudio. O sistema de produção de conteúdo de áudio 1200 pode também compreender opcionalmente um instrumento de mixagem de redução, que realiza mixagem de redução de sinais de áudio de uma pluralidade de objetos de áudio em um ou dois ou mais sinais de mixagem de redução. Ademais, o sistema de produção de conteúdo de áudio pode ser opcionalmente configurado para derivar informações de relação de objeto (como, por exemplo, informações de diferença de nível de objeto ou valores de correlação interobjeto, ou valores de diferença de tempo interobjeto, ou similares) e pode incluir uma representação codificada do mesmo na transmissão contínua de áudio 1212.
[0234] Para resumir, o sistema de produção de conteúdo de áudio 1200 pode fornecer uma transmissão contínua de áudio 1212 na qual as informações de posição de objeto são incluídas em uma representação esférica, embora a posição de objeto seja originalmente fornecida em uma representação cartesiana.
[0235] Naturalmente, o aparelho 1230 para converter a posição de objeto da representação cartesiana na representação esférica pode ser suplementado por qualquer um dos recursos e funcionalidades e detalhes descritos no presente documento.
5. APARELHO DE REPRODUÇÃO DE ÁUDIO DE ACORDO COM À FIGURA 13
[0236] A Figura 13 mostra um diagrama esquemático de blocos de um aparelho de reprodução de áudio 1300, de acordo com uma modalidade da presente invenção.
[0237] O aparelho de reprodução de áudio 1300 é configurado para receber uma transmissão contínua de áudio 1310 que compreende uma representação esférica de informações de posição de objeto. Ademais, a transmissão contínua de áudio 1310 tipicamente também compreende dados de áudio codificados.
[0238] O aparelho de reprodução de áudio compreende um aparelho 1330 para converter uma posição de objeto de uma representação esférica em uma representação cartesiana, como descrito no presente documento. O aparelho 1330 para converter a posição de objeto pode, por exemplo, corresponde ao aparelho 200 descrito no presente documento. Desse modo, o aparelho 1330 para converter uma posição de objeto pode receber as informações de posição de objeto na representação esférica e fornecer as informações de posição de objeto em uma representação cartesiana, como mostrado no número de referência 1332.
[0239] Ademais, o aparelho de reprodução de áudio 1300 também compreende um renderizador 1340 que é configurado para renderizar um objeto de áudio para uma pluralidade de sinais de canal 1350 associados a transdutores de som em dependência da representação cartesiana 1332 das informações de posição de objeto.
[0240] Opcionalmente, o aparelho de reprodução de áudio também compreende uma decodificação de áudio (ou um decodificador de áudio) 1360 que pode, por exemplo, receber dados de áudio codificados, que são incluídos na transmissão contínua de áudio 1310, e fornecer, com base no mesmo, informações de áudio decodificadas 1362. Por exemplo, a decodificação de áudio pode fornecer, como as informações de áudio decodificadas 1362, um ou mais sinais de canal ou um ou mais sinais de objeto para o renderizador 1340.
[0241] Ademais, deve ser observado que o renderizador 1340 pode renderizar um sinal de um objeto de áudio em uma posição (dentro de um ambiente de audição) determinada pela representação cartesiana 1332 da posição de objeto. Desse modo, o renderizador 1340 pode usar a representação cartesiana 1332 da posição de objeto para determinar como um sinal associado a um objeto de áudio deve ser distribuído para os sinais de canal 1350. Em outras palavras, o renderizador 1340 decide, com base na representação cartesiana das informações de posição de objeto, por quais transdutores de som ou alto-falantes de um sinal de um objeto de áudio é renderizado (e em qual intensidade o sinal é renderizado nos diferentes sinais de canal).
[0242] Isso fornece um conceito eficaz para uma reprodução de áudio. Além disso, deve ser observado que diversos tipos de renderizadores poderiam ser usados que recebem informações de posição de objeto em uma representação cartesiana, devido ao fato de que muitos renderizadores tipicamente têm dificuldades de lidar com uma representação de posição de objeto em uma representação esférica (ou não pode lidar com informações de posição de objeto em uma representação esférica de nenhum modo).
[0243] Desse modo, usando-se o aparelho 1330 para converter informações de posição de objeto em uma representação esférica em uma representação cartesiana, o aparelho de reprodução de áudio pode usar aparelhos de renderização que são mais bem adequados para informações de posição de objeto fornecidas em uma representação cartesiana. Além disso, deve ser observado que o aparelho 1330 pode ser implantado com esforço computacional comparativamente pequeno, como discutido acima.
[0244] Ademais, deve ser observado que o aparelho 1330 pode ser suplementado por qualquer um dos recursos e funcionalidades e detalhes descritos em relação ao aparelho 200.
6. MÉTODO DE ACORDO COM A FIGURA 14
[0245] A Figura 14 mostra um fluxograma de um método para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica.
[0246] O método 1400 de acordo com a reivindicação 14 compreende determinar 1410 em qual dos diversos triângulos de área de base uma projeção da posição de objeto do objeto de áudio na área de base é disposta. O método também compreende determinar 1420 uma posição mapeada da projeção da posição de objeto com o uso de uma transformada linear, que mapeia o triângulo de área de base em seu triângulo de domínio esférico associado.
[0247] O método também compreende derivar 1430 um ângulo de azimute e um valor de raio intermediário da posição mapeada. O método também compreende obter 1440 um valor de raio de domínio esférico e um ângulo de elevação em dependência do valor de raio intermediário e em dependência de uma distância da posição de objeto da área de base.
[0248] Esse método tem como base as mesmas considerações que o aparelho mencionado acima para converter uma posição de objeto de uma representação cartesiana em uma representação esférica. Em conformidade, o método 1400 pode ser suplementado por qualquer um dos recursos, funcionalidades e detalhes descritos no presente documento, por exemplo, em relação ao aparelho 100.
7. MÉTODO DE ACORDO COM A FIGURA 15
[0249] A Figura 15 mostra um fluxograma de um método para converter uma posição de objeto de um objeto de áudio de uma representação esférica em uma representação cartesiana.
[0250] O método compreende obter 1510 um valor que descreve uma distância da posição de objeto da área de base e um raio intermediário com base em um ângulo de elevação ou um ângulo de elevação mapeado e com base em um raio de domínio esférico ou um raio de domínio esférico mapeado.
[0251] O método também compreende determinar 1520 uma posição dentro de um dentre uma pluralidade de triângulos inscritos em um círculo com base no raio intermediário, ou uma versão corrigida do mesmo, e com base em um ângulo de azimute.
[0252] O método também compreende determinar 1530 uma posição mapeada da projeção da posição de objeto em um plano de base de uma representação cartesiana com base na posição determinada dentro de um dos triângulos inscritos no círculo.
[0253] Esse método tem como base as mesmas considerações que os aparelhos descritos acima. Além disso, o método 1500 pode ser suplementado por qualquer um dos recursos, funcionalidades e detalhes descritos no presente documento.
[0254] Em particular, o método 1500 pode ser suplementado por qualquer um dos recursos, funcionalidades e detalhes descritos em relação ao aparelho 200.
8. MÉTODO DE ACORDO COM A FIGURA 16
[0255] A Figura 16 mostra um fluxograma de um método 1600 para reprodução de áudio.
[0256] O método compreende receber 1610 uma transmissão contínua de áudios que compreende uma representação esférica de informações de posição de objeto.
[0257] O método também compreende converter 1620 a representação esférica em uma representação cartesiana das informações de posição de objeto.
[0258] O método também compreende renderizar 1630 um objeto de áudio para uma pluralidade de sinais de canal associados a transdutores de som em dependência da representação cartesiana das informações de posição de objeto.
[0259] Em particular, o método 1600 pode ser suplementado por qualquer um dos recursos, funcionalidades e detalhes descritos no presente documento.
9. CONCLUSÕES E MODALIDADES ADICIONAIS
[0260] A seguir, modalidades adicionais serão descritas que podem ser usados individualmente ou em combinação com os recursos, funcionalidades e detalhes descritos no presente documento.
[0261] Além disso, os recursos e funcionalidades e detalhes descritos a seguir podem ser opcionalmente usados em combinação com qualquer uma das outras modalidades descritas no presente documento.
[0262] Um primeiro aspecto cria um método para converter metadados relacionados a áudio de objeto entre diferentes espaços de coordenada.
[0263] Um segundo aspecto cria um método para converter metadados relacionados a áudio de objeto de coordenadas relacionadas a ambiente em coordenadas relacionadas a ouvinte e vice-versa.
[0264] Um terceiro aspecto cria um método para converter posições de alto-falante entre diferentes espaços de coordenada.
[0265] Um quarto aspecto cria um método para converter metadados de posições de alto-falante de coordenadas relacionadas a ambiente em coordenadas relacionadas a ouvinte e vice-versa.
[0266] Um quinto aspecto cria um método para converter metadados de posição de objeto de áudio de um espaço de parâmetro cartesiano em um sistema de coordenada esférica, que separa a conversão do plano xy para o ângulo de azimute j e a conversão do componente z no ângulo de elevação q.
[0267] Um sexto aspecto cria um método de acordo com o quinto aspecto que mapeia corretamente as posições de alto-falante do espaço cartesiano para o sistema de coordenada esférica.
[0268] Um sétimo aspecto cria um método de acordo com o quinto aspecto que projeta as superfícies do espaço de cuboide no sistema de coordenada cartesiana, no qual os alto-falantes estão localizados na superfície da esfera que contém os alto- falantes correspondentes no sistema de coordenada esférica.
[0269] Um oitavo aspecto cria um método de acordo com um dentre o primeiro aspecto e o quinto aspecto compreende as etapas de processamento a seguir: - Projetar triângulos formados por 2 posições próximas de alto-falante no plano xy e o centro do cuboide no triângulo correspondente ao espaço esférico - Corrigir o raio para mapear a borda externa do retângulo de alto-falante do plano xy no círculo correspondente que contém os alto-falantes no plano horizontal do sistema de coordenada esférica - Aplicar a elevação no raio com base no componente z, para determinar um raio esférico (3D) - Corrigir o raio com base no ângulo de elevação para mapear também os alto-falantes de altura na esfera - Corrigir o ângulo de elevação para refletir as diferentes elevações dos alto-falantes de altura nos sistemas de coordenada cartesiana e esférica
[0270] Um novo aspecto cria um método que realiza as operações inversas de acordo com o quinto aspecto.
[0271] Um décimo aspecto cria um método que realiza as operações inversas de acordo com o sexto aspecto.
[0272] Um décimo primeiro aspecto cria um método que realiza as operações inversas de acordo com o sétimo aspecto.
[0273] Um décimo segundo aspecto cria um método que realiza as operações inversas de acordo com o oitavo aspecto.
10. MODALIDADES ADICIONAIS
[0274] A seguir, modalidades adicionais de acordo com a invenção serão descritas, que podem ser usadas individualmente ou em combinação com qualquer um dos recursos, funcionalidades e detalhes descritos no presente documento (também nas reivindicações). Além disso, qualquer uma das outras modalidades descritas no presente documento (também nas reivindicações) pode ser opcionalmente suplementada por qualquer um dos recursos, funcionalidades e detalhes descritos nessa seção, tanto individualmente quanto tomados em combinação.
REGRA DE MAPEAMENTO PARA POSIÇÃO DE METADADOS DE OBJETO DINÂMICA:
[0275] Essa seção descreve uma conversão de metadados de objeto de lado de produção, especialmente dados de posição de objeto, no caso de lado de produção de um sistema de coordenada cartesiana ser usado, mas no formato de transporte, a posição de metadados de objeto é descrita em coordenadas esféricas.
[0276] O problema é que, nas coordenadas cartesianas, os alto-falantes não estão sempre localizados nas posições matematicamente corretas em comparação com o sistema de coordenada esférica. Portanto, uma conversão é necessária, o que garante que a área cuboide do espaço cartesiano seja projetada corretamente na esfera (ou semiesfera). Por exemplo, posições de alto-falante são igualmente renderizadas com o uso de um renderizador de objeto de áudio com base em um sistema de coordenada esférica (por exemplo, um renderizador como descrito no padrão de áudio MPEG-H 3D) ou com o uso de um renderizador baseado em cartesiana com o algoritmo de conversão correspondente. As superfícies cuboides devem ser ou têm que ser mapeadas/projetadas na superfície da esfera na qual os alto-falantes estão localizados.
[0277] Ademais, é desejado ou necessário que o algoritmo de conversão tenha uma complexidade computacional pequena, especialmente a etapa de conversão de coordenadas esféricas em cartesianas.
[0278] Uma aplicação exemplificativa para as modalidades de acordo com a invenção é: usar ferramentas de autorização de objeto de áudio do estado da técnica que, em geral, usam um espaço de parâmetro cartesiano (x,y,z) para as coordenadas de objeto de áudio, mas usam um formato de transporte que descreve as posições de objeto de áudio em coordenadas esféricas (azimute, elevação, raio), como, por exemplo, Áudio MPEG-H 3D. No entanto, o formato de transporte pode ser (ou tem que ser) agnóstico para o renderizador (esférico ou cartesiano), que é aplicado posteriormente.
[0279] A conversão é descrita de modo exemplificativo para uma configuração de alto-falante 5.1+4H, mas pode facilmente ser transferida para todos os tipos de configurações de alto-falante (por exemplo, 7.1+4, 22.2, etc.) ou espaços de parâmetro cartesiano variantes (diferente orientação dos eixos geométricos, ou diferente escalonamento dos eixos geométricos, ...)
COMPARAÇÃO GERAL DE SISTEMAS DE COORDENADA
[0280] Um exemplo de um ambiente de parâmetro cartesiano com posições correspondentes de alto-falante para uma configuração 5.1+4H é mostrado na Figura
17.
[0281] Um exemplo de um Sistema de Coordenada Esférica de acordo com ISO/IEC 23008-3:2015 Áudio MPEG-H 3D é mostrado na Figura 18.
[0282] Observe que as coordenadas X e Y no sistema de coordenada ISO são definidas de modo diferente em comparação com o sistema de coordenada cartesiana descrito acima.
CONVERSÃO DE LADO DE PRODUÇÃO (CARTESIANA 2 ESFÉRICA)
[0283] As posições de alto-falante são determinadas em coordenadas esféricas, como, por exemplo, descrito pela recomendação de ITU-R ITU-R BS.2051-1 (sistema de som avançado para produção de programa) e descritas na especificação MPEG- H. A conversão é aplicada em uma abordagem separada. Primeiro, as coordenadas x e y são mapeadas para o ângulo de azimute q e o raio r., no plano azimute/xy. Posteriormente, o ângulo de elevação e o raio no espaço 3D são calculados com o uso da coordenada z. O mapeamento é descrito de modo exemplificativo para a configuração de alto-falante 5.1+4H.
CASO ESPECIAL X=Y = 0: Paraz> O: q = indefinido (=0º), 0= 90º er=z.
Paraz= O: q = indefinido (=0º), 0= 0º er=O0, 1) CONVERSÃO EM PLANO XY
[0284] Referência é realizada à Figura 19, que mostra uma representação esquemática de um sistema de coordenada cartesiana e de um sistema de coordenada esférica, e de alto-falantes (quadrados carregados).
[0285] Etapa 1: Na primeira etapa, os triângulos no sistema de coordenada cartesiana são mapeados para triângulos correspondentes no sistema de coordenada esférica.
[0286] Referência é realizada à Figura 20, que mostra uma representação gráfica de triângulos inscritos em um quadrado no sistema de coordenada cartesiana e em um círculo no sistema de coordenada esférica.
[0287] A seguir, isso é mostrado de modo exemplificativo para um triângulo. Referência também é realizada à Figura 21.
[0288] Os triângulos podem ser projetados um em relação ao outro com o uso de uma transformada linear: p=)"
[0289] A matriz de transformada pode ser calculada com o uso das posições conhecidas dos cantos do triângulo P1, P2., À, e P, . Esses pontos dependem da configuração de alto-falante e das posições correspondentes dos alto-falantes e do triângulo no qual a posição P está localizada. - . . TT? [é eu) Put, : PaxP, ESSA o no a 1x52,y 2,x"1y V17D2y 27"1y 1x52,y 175 2x.
[0290] A configuração de alto-falante 5.1+4H contém na camada intermediária uma configuração padrão de alto-falante 5.1, que é a base para a projeção no plano xy. Na Tabela 2, os pontos correspondentes P,, P2, P, e P, são determinados para os triângulos que têm que ser projetados.
[0291] Etapa 2: Calcular o raio %., e o ângulo de azimute q com base nas coordenadas mapeadas X e 3.
fy=/X+P tan? — paray>0 —90º paraz=0 AX>O 0º parajy=0AZ%=O0 q= 90º para J=0AZX<O0 —90º + tan"! = parajy <0 AX>O0 —180º paray<0AZX=0 90º + tan" parajy <0 AZX<O
[0292] Etapa 3: O raio tem que ser ajustado, devido ao fato de que os alto-falantes são colocados em um quadrado no sistema de coordenada cartesiana em contraste com o sistema de coordenada esférica. No sistema de coordenada esférica, os alto- falantes são posicionados em um círculo.
[0293] Para ajustar o raio, o limiar do quadrado de alto-falante cartesiano é projetado no círculo do sistema de coordenada esférica. Isso significa que a corda é projetada no segmento correspondente do círculo.
[0294] Paraç(h)<o< o(D): cos (LT) z (Po) = o) Ty = xy cos (O 7 E) 2) CONVERSÃO DE COMPONENTE Z
[0295] A elevação da camada de topo é assumida como estando em 67,5, = 30º (ou 35º) de ângulo de elevação no sistema de coordenada esférica (elevação típica recomendada por ITU-R BS.2051).
[0296] Referência também é realizada à Figura 23.
[0297] Etapa 1: Calcular o ângulo de elevação 8 com base no raio Tx, E no componente z. Ademais, calcular o raio 3D 7 com base no ângulo à e Tay: õ= tan! 2 rey
[0298] Etapa 2: Correção do raio 7 devido à projeção dos limiares retangulares do sistema cartesiano no círculo unitário do sistema de coordenada esférica.
[0299] Referência também é realizada à Figura 24.
[0300] Parao<6ô<45º: r=cosô Para 45º < À < 90º: r=senô
[0301] Etapa 3:
Correção do ângulo de elevação Brop: devido à colocação diferente dos alto-falantes no sistema de coordenada cartesiana (rop = 45º) e esférica (967,5, = 30º (ou 35º)).
[0302] Mapeamento de à para 6: go para 8 < ôroy o rop l — rop) (90º — Prop) +Orop parabrop < 8 <90º rop CONVERSÃO DE LADO DE DECODIFICADOR (ESF 2 CART)
[0303] No lado de decodificador, a conversão inversa para o lado de produção deve ser executada. Isso significa que as etapas de conversão são revertidas em ordem oposta.
CONVERSÃO DE ELEVAÇÃO E PROJEÇÃO DE RAIO EM PLANO XY (CÁLCULO DE COMPONENTE Z) CASO ESPECIAL 6 = 90º: x=0,y=0ez=r
[0304] Etapa: Mapeamento de 6 para 8: com rop = 30º (ou 35º) o para 6 < rop õ= o (9 - od) +Ôrop paradrop< 9<90º
[0305] Etapa 2: Inversão de correção de raio: com Brop = 45º " EP para õ< or send para 75, < 8 < 90º
[0306] Etapa3: Calcular z e r., z=t senô rey = Ff cosl
CÁLCULO DE X E COMPONENTE Y
[0307] Etapa 1: Inversão da correção de raio. P2) — o(ê, cos (« A >) Ffoy E ly BS TB P. P. cos ( 2) X PÉ) -.)
[0308] Etapa2: Cálculo de X% e 3. o —fry seno para |&| < 90º 7 (rn, sen(180º - q) para9go0º <Q] <180º ao Fry COS Q para |&| < 90º 7? (—hy cos(180º — ||) para 90º < || < 180º
[0309] Etapa3: Cálculo de x e y. = x — 156 = Gens REGRA DE MAPEAMENTO PARA METADADOS ESPALHADOS: Codificador (Cart > Esf): (Observe: não se deve usar sinalização espalhada uniforme) 180º 2 So = na (sx + sy) s, paralo|<45º sa=D"*<4s, para45<|Q|<135º com D=15,5 é o valor máximo de distância Ss, para135< || <180º se = 90º" s, largura espalhada: s, , altura espalhada: s, e distância espalhada: sq Decodificador (Esf > Cart) 45, Sa Pa < 45º 180º” p Para l9l < 45 Sa Ss = 7 para 45 < |Q| < 135º 45, Sa — < < º 180º” D para 135 < |é| < 180
> para |é| < 45º = fa- = para 45 < |é| < 135º = para 135 < |é| < 180º 1 Sz= gg So
[0310] No caso de espalhada uniforme no fluxo de bits a conversão é: Limitar s,, sy, e s, a faixas entre [0, 1].
11. OBSERVAÇÕES ADICIONAIS
[0311] Como uma observação geral, deve ser observado que não é necessário usar exatamente 4 segmentos ou triângulos. Por exemplo, os segmentos (ou triângulos, como triângulos de domínio cartesiano e triângulos de domínio esférico) podem ser definidos pelas posições de alto-falante do plano horizontal da configuração de alto-falante. Por exemplo, em uma configuração de alto-falante de altura 5.1 + 4 (alto-falantes elevados), os segmentos ou triângulos podem ser definidos pela configuração de base 5.1. Em conformidade, 5 segmentos podem ser definidos nesse exemplo (consulte, por exemplo, a descrição na seção 10). Em uma configuração de alto-falantes de altura 7.1+4 (alto-falantes elevados), 7 segmentos ou triângulos podem ser definidos. Isso pode, por exemplo, ser representado pelas equações mas genéricas mostradas na seção 10 (que não compreendem ângulos fixos). Além disso, os ângulos dos alto-falantes de altura (alto-falantes elevados) podem, por exemplo, diferir de configuração para configuração (por exemplo, 30 graus ou 35 graus).
[0312] Desse modo, o número de triângulos e das faixas de ângulo pode, por exemplo, variar de modalidade para modalidade.
12. ALTERNATIVAS DE IMPLANTAÇÃO
[0313] Qualquer um dos recursos e funcionalidades descritos no presente documento pode ser implantado em hardware ou em software, ou com o uso de uma combinação de hardware e software, como será descrito nessa seção.
[0314] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa do método ou a um recurso de uma etapa do método. De modo análogo, os aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item correspondente ou um recurso de um aparelho correspondente. Parte ou todas as etapas do método podem ser executadas por (ou com o uso de) um aparelho de hardware, como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, uma ou mais dentre as etapas de método mais importantes podem ser executadas por tal aparelho.
[0315] Dependendo de determinados requisitos de implantação, as modalidades da invenção podem ser implantadas em hardware ou em software. A implantação pode ser realizada com o uso de uma mídia de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma ROM, uma PROM, uma EPROM, uma EEPROM ou uma memória FLASH, que tem sinais de controle eletronicamente legíveis armazenados no mesmo, que cooperam (ou têm capacidade para cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Portanto, a mídia de armazenamento digital pode ser legível por computador.
[0316] Algumas modalidades, de acordo com a invenção, compreendem uma portadora de dados que tem sinais de controle eletronicamente legíveis, que têm capacidade para cooperar com um sistema de computador programável, de modo que um dentre os métodos descritos no presente documento seja realizado.
[0317] De modo geral, as modalidades da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, sendo que o código de programa é operacional para realizar um dentre os métodos quando o produto de programa de computador for executado em um computador. O código de programa pode, por exemplo, ser armazenado em uma portadora legível por máquina.
[0318] Outras modalidades compreendem o programa de computador para realizar um dentre os métodos descritos no presente documento, armazenado em uma portadora legível por máquina.
[0319] Em outras palavras, uma modalidade do método inventivo é, portanto, um programa de computador que tem um código de programa para realizar um dentre os métodos descritos no presente documento, quando o programa de computador for executado em um computador.
[0320] Uma modalidade adicional dos métodos inventivos é, portanto, uma portadora de dados (ou uma mídia de armazenamento digital, ou uma mídia legível por computador) que compreende, gravado na mesma, o programa de computador para realizar um dentre os métodos descritos no presente documento. A portadora de dados, a mídia de armazenamento digital ou a mídia gravada são, tipicamente, tangíveis e/ou de não transição.
[0321] Uma modalidade adicionalmente do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descritos no presente documento. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurada para ser transferida por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.
[0322] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado ou adaptado para realizar um dentre os métodos descritos no presente documento.
[0323] Uma modalidade adicional compreende um computador que tem instalado no mesmo o programa de computador para realizar um dentre os métodos descritos no presente documento.
[0324] Uma modalidade adicional de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, de maneira eletrônica ou óptica) um programa de computador para realizar um dentre os métodos descritos no presente documento a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhantes. O aparelho ou sistema podem compreender, por exemplo, um servidor de arquivo para transferir o programa de computador para o receptor.
[0325] Em algumas modalidades, um dispositivo de lógica programável (por exemplo, uma matriz de portas programável em campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, um arranjo de porta programável em campo pode cooperar com um microprocessador a fim de realizar um dentre os métodos descritos no presente documento. De modo geral, os métodos são realizados, de preferência, por qualquer aparelho de hardware.
[0326] O aparelho descrito no presente documento pode ser implantado com o uso de um aparelho de hardware, ou com o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.
[0327] O aparelho descrito no presente documento, ou quaisquer componentes do aparelho descrito no presente documento, podem ser implantados pelo menos parcialmente em hardware e/ou em software.
[0328] Os métodos descritos no presente documento podem ser realizados com o uso de um aparelho de hardware, ou com o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.
[0329] Os métodos descritos no presente documento, ou quaisquer componentes do aparelho descrito no presente documento, podem ser realizados pelo menos parcialmente por hardware e/ou por software.
[0330] As modalidades descritas acima são apenas ilustrativas para os princípios da presente invenção. Fica entendido que as modificações e variações das disposições e os detalhes descritos no presente documento serão evidentes para outros indivíduos versados na técnica. Portanto, pretende-se que sejam limitadas somente pelo escopo das reivindicações da patente iminentes e não pelos detalhes específicos apresentados a título de descrição e explicação das modalidades no presente documento.

Claims (69)

REIVINDICAÇÕES
1. Aparelho (100) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana (110) em uma representação esférica (112), em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base (630,532,634,636), e em que uma pluralidade de triângulos de domínio esférico (660,662,664,666) são inscritos em um círculo de uma representação esférica, em que o aparelho é configurado para determinar, em qual dos triângulos de área de base uma projeção (P) da posição de objeto do objeto de áudio na área de base é disposta; e em que o aparelho é configurado para determinar uma posição mapeada (P) da projeção (P) da posição de objeto com o uso de uma transformada linear (T), que mapeia o triângulo de área de base em seu triângulo de domínio esférico associado, em que o aparelho é configurado para derivar um ângulo de azimute (q) e um valor de raio intermediário (%,, ) da posição mapeada (É); em que o aparelho é configurado para obter um valor de raio de domínio esférico (f, r) e um ângulo de elevação (8) em dependência do valor de raio intermediário (rx, f.,) e em dependência de uma distância (z) da posição de objeto da área de base.
2. Aparelho, de acordo com a reivindicação 1, em que o aparelho é caracterizado por ser configurado para determinar a posição mapeada P da projeção P da posição de objeto com o uso de uma transformada linear descrita por uma matriz de transformada T de acordo com a Gene em que o aparelho é configurado para obter a matriz de transformada em dependência do triângulo de área de base determinado.
3. Aparelho, de acordo com a reivindicação 2, caracterizado por a matriz de transformada ser definida de acordo com T= [& e - 1 Fo - PaxPay Paxbox = se 21 22 PaxPoy= PaxPiy [PiyPoy— PoyPay PaxPoy— PayPox em que Px, Pay, Pax, Pa, São coordenadas x e y de dois cantos do triângulo de área de base determinado; e em que P1 x, Pay, Pox, Pa, São coordenadas x e y de dois cantos do triângulo de domínio esférico associado.
4. Aparelho, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por os triângulos de área de base compreenderem - um primeiro triângulo de área de base que cobre uma área na frente de uma origem da representação cartesiana, - um segundo triângulo de área de base que cobre e área em um lado esquerdo da origem da representação cartesiana, - um terceiro triângulo de área de base que cobre uma área em um lado direito da origem da representação cartesiana, e - um quarto triângulo de área de base que cobre uma área atrás de uma origem da representação cartesiana.
5. Aparelho, de acordo com qualquer uma das reivindicações 1 a 4, caracterizado por os triângulos de domínio esférico compreenderem - um primeiro triângulo de domínio esférico que cobre uma área na frente de uma origem da representação esférica, - um segundo triângulo de domínio esférico que cobre e área em um lado esquerdo da origem da representação esférica, - um terceiro triângulo de domínio esférico que cobre uma área em um lado direito da origem da representação esférica, e - um quarto triângulo de domínio esférico que cobre uma área atrás de uma origem da representação esférica.
6. Aparelho, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado por os triângulos de área de base compreenderem - um primeiro triângulo de área de base que cobre uma área em uma região frontal direita de uma origem da representação cartesiana, - um segundo triângulo de área de base que cobre uma área em uma região frontal esquerda de uma origem da representação cartesiana - um terceiro triângulo de área de base que cobre e área em um lado esquerdo da origem da representação cartesiana, - um quarto triângulo de área de base que cobre uma área em um lado direito da origem da representação cartesiana, e - um quinto triângulo de área de base que cobre uma área atrás de uma origem da representação cartesiana.
7. Aparelho, de acordo com qualquer uma das reivindicações 1 a4e6, caracterizado por os triângulos de domínio esférico compreenderem - um primeiro triângulo de domínio esférico que cobre uma área em uma área frontal direita de uma origem da representação esférica, - um segundo triângulo de domínio esférico que cobre uma área em uma área frontal esquerda de uma origem da representação esférica, - um terceiro triângulo de domínio esférico que cobre e área em um lado esquerdo da origem da representação esférica, - um quarto triângulo de domínio esférico que cobre uma área em um lado direito da origem da representação esférica, e - um quinto triângulo de domínio esférico que cobre uma área atrás de uma origem da representação esférica.
8. Aparelho, de acordo com qualquer uma das reivindicações 1 a 5, caracterizado por as coordenadas P1, P2 de cantos de triângulos de área de base e coordenadas P, e P, de cantos de triângulos de domínio esférico associados serem definidas como a seguir:
o SB o — BS Par del(1,1)) ( (sen 30º = Z ,cos 30º = 2 (- 2 triângul 1,1) os 1 31 Par del (- |(1- (=> 3) (-0,93969, - triângul | 1,1) | 1) 0,34202) os 2 Par del (1) (1, ( (0,93969, —0,342072 triângul | 1) | 1) |—cos(110º — 90º) = —0,93969, —sen(20º) = ) os 3 0,34202) NV3 1 Par del (1, (1,1) (0,93969, —0,34202) Gs) triângul | 1) os 4 em que um terceiro canto dos respectivos triângulos está em uma origem do respectivo sistema de coordenadas.
9. Aparelho, de acordo com qualquer uma das reivindicações 1 a 3e6a7, caracterizado por as coordenadas P1, P2 de cantos de triângulos de área de base e coordenadas P, e P, de cantos de triângulos de domínio esférico associados serem definidas como a seguir: Den = Pz 01) | 1) esp = 30º rep = 1 den o triângulos 16, (0,1) F72) 1 Par de| (-1,1) | (1,-1) qsp = 30º, rsp =1 sp = 110º, rs5 =1 triângulos 18, 2 Ez72) (—0,93969, —0,34202) Par de (-1,-1) | (1,-1) sp = 110º, rsp=1 sp =-110º, rs =1 triângulos 3 (—0,93969, —0,34202) (0,93969,—0,34202) Par de| (1-1) | (1,1) sp = -110º, rsp=1 sp = -30º, rs =1 triângulos — 1 Vy3 4 (0,93969,—0,34202) GG) Par = del (11) | (01) | psp=-30%rs,=1 triângulos 13 G 2 ) (0,1) em que um terceiro canto dos respectivos triângulos está em uma origem do respectivo sistema de coordenadas.
10. Aparelho, de acordo com qualquer uma das reivindicações 1 a 9, em que o aparelho é caracterizado por ser configurado para derivar o ângulo de azimute q a partir de coordenadas mapeadas X e 3 da posição mapeada (P) de acordo com tan! para > O —90º paraj =0 AX>O 0º paraj=0AX%=0 q= 90º parag=0AX<O —90º +tan'Z paraj <0 AZX>O0 —180º paray<0AZX=0 90º + tan" paray <0 AX<O
11. Aparelho, de acordo com qualquer uma das reivindicações 1 a 10, em que o aparelho é caracterizado por ser configurado para derivar o valor de raio intermediário 7, a partir de coordenadas mapeadas 3 e y da posição mapeada (P) de acordo com fy = JVX2 +
12. Aparelho, de acordo com qualquer uma das reivindicações 1 a 11, em que o aparelho é caracterizado por ser configurado para obter o valor de raio de domínio esférico (f,r) em dependência do valor de raio intermediário com o uso de um ajuste de raio que mapeia um triângulo de domínio esférico inscrito no círculo em um segmento de círculo.
13. Aparelho, de acordo com qualquer uma das reivindicações 1 a 12, em que o aparelho é caracterizado por ser configurado para obter o valor de raio de domínio esférico (7,r) em dependência do valor de raio intermediário com o uso de um ajuste de raio, em que o ajuste de raio é adaptado para escalonar o valor de raio intermediário (%,,) obtido antes em dependência do ângulo de azimute q.
14. Aparelho, de acordo com qualquer uma das reivindicações 1 a 13, em que o aparelho é caracterizado por ser configurado para obter o valor de raio de domínio esférico (f,r) em dependência do valor de raio intermediário com o uso de um mapeamento da forma para || < 30º: 2 Ccosq xy = ey cos 30º para 30º < |é| < 110º:
, cos(70º — lol) para 110º < |é| < 180º: , cos(180º — lo) TI cos140º em que r,, é uma versão ajustada de raio do valor de raio intermediário 7, ; e em que « é um ângulo de azimute.
15. Aparelho, de acordo com qualquer uma das reivindicações 1 a 14, em que o aparelho é caracterizado por ser configurado para obter o valor de raio de domínio esférico r., em dependência do valor de raio intermediário ,,, com o uso de um mapeamento da forma Para (Ph) <o< Q(D): cos (O) + CG .) Ty = xy (O) — E) cos TA = em que (A) e p(P.) são ângulos de posição de dois cantos de um respectivo triângulo de domínio esférico.
16. Aparelho, de acordo com qualquer uma das reivindicações 1 a 15, em que o aparelho é caracterizado por ser configurado para obter o ângulo de elevação como um ângulo de um triângulo retângulo que tem hastes do valor de raio intermediário e da distância da posição de objeto da área de base.
17. Aparelho, de acordo com qualquer uma das reivindicações 1 a 16, em que o aparelho é caracterizado por ser configurado para obter o raio de domínio esférico como um comprimento de hipotenusa 7 de um triângulo retângulo que tem hastes do valor de raio intermediário e da distância da posição de objeto da área de base, ou como uma versão ajustada da mesma.
18. Aparelho, de acordo com qualquer uma das reivindicações 1 a 17, em que o aparelho é caracterizado por ser configurado para obter o ângulo de elevação 8 de acordo com d=tan'ÊÉ Toy e/ou para obter o raio de domínio esférico 7 de acordo com fe SBTZ, em que z é a distância da posição de objeto da área de base, e em que r,, é o valor de raio intermediário, ou uma versão ajustada do mesmo.
19. Aparelho, de acordo com qualquer uma das reivindicações 1 a 18, em que o aparelho é caracterizado por ser configurado para obter um ângulo de elevação ajustado (6).
20. Aparelho, de acordo com a reivindicação 19, em que o aparelho é caracterizado por ser configurado para obter o ângulo de elevação ajustado com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada.
21. Aparelho, de acordo com a reivindicação 20, caracterizado por uma faixa de ângulo coberta juntamente pela primeira região de ângulo e pela segunda região de ângulo ser idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e pela segunda região mapeada de ângulo.
22. Aparelho, de acordo com qualquer uma das reivindicações 19 a 21, em que o aparelho é caracterizado por ser configurado para mapeamento do ângulo de elevação à no ângulo de elevação ajustado 6 de acordo com 52 para ô < 45º o= | ã (902309) ã : (FG — 450) *+30º para45º < 0 <90º
23. Aparelho, de acordo com qualquer uma das reivindicações 19 a 22, em que o aparelho é caracterizado por ser configurado para mapeamento do ângulo de elevação ô no ângulo de elevação ajustado 6 de acordo com go para 8 < 8rop 0= rop l — Brop) (90º Prop) +Arop paradro, < 8 <90º rop em que 67,, é um ângulo de elevação de alto-falantes de altura no sistema de coordenada cartesiana; e em que Brop é um ângulo de elevação de alto-falantes de altura no sistema de coordenada esférica.
24. Aparelho, de acordo com qualquer uma das reivindicações 1 a 23, em que o aparelho é caracterizado por ser configurado para obter um raio de domínio esférico ajustado com base em um raio de domínio esférico.
25. Aparelho, de acordo com a reivindicação 24, em que o aparelho é caracterizado por ser configurado para realizar um mapeamento, que mapeia limiares de um quadrado em um sistema cartesiano em um círculo em um sistema de coordenada esférica, a fim de obter um raio de domínio esférico ajustado.
26. Aparelho, de acordo com a reivindicação 24 ou 25, em que o aparelho é caracterizado por ser configurado para mapear o raio de domínio esférico f no raio de domínio esférico ajustado r de acordo com: para O < À < 45º: r=f cos para 45º < À < 90º: r=fsenô em que à é o ângulo de elevação.
27. Aparelho (200) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação esférica (218,228,258) em uma representação cartesiana (242,292), em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo de uma representação esférica,
em que o aparelho é configurado para obter um valor (z) (242) que descreve uma distância da posição de objeto da área de base e um raio intermediário (252, rxy) com base no ângulo de elevação (218) ou o ângulo de elevação mapeado (222) e com base no raio de domínio esférico (228) ou no raio de domínio esférico mapeado (232); em que o aparelho é configurado para determinar uma posição (272, P) dentro de um dos triângulos inscritos no círculo com base no raio intermediário (252), ou uma versão corrigida (262) do mesmo, e com base em um ângulo de azimute (q); e em que o aparelho é configurado para determinar uma posição mapeada (292) da projeção (272, P) da posição de objeto no plano de base com base na posição determinada (272, P) dentro de um dos triângulos inscritos no círculo.
28. Aparelho, de acordo com a reivindicação 27, em que o aparelho é caracterizado por ser configurado para obter um ângulo de elevação mapeado (8) com base em um ângulo de elevação.
29. Aparelho, de acordo com a reivindicação 28, em que o aparelho é caracterizado por ser configurado para obter o ângulo de elevação mapeado com o uso de um mapeamento não linear que mapeia linearmente ângulos em uma primeira região de ângulo em uma primeira região de ângulo mapeada e que mapeia linearmente ângulos dentro de uma segunda região de ângulo em uma segunda região mapeada de ângulo, em que a primeira região de ângulo tem uma largura diferente em comparação com a primeira região de ângulo mapeada.
30. Aparelho, de acordo com a reivindicação 29, caracterizado por uma faixa de ângulo coberta juntamente pela primeira região de ângulo e a segunda região de ângulo ser idêntica a uma faixa de ângulo coberta juntamente pela primeira região de ângulo mapeada e a segunda região mapeada de ângulo.
31. Aparelho, de acordo com qualquer uma das reivindicações 28 a 30, em que o aparelho é caracterizado por ser configurado para mapear o ângulo de elevação 0 no ângulo de elevação mapeado À de acordo com 2 | x, para 6 < 30º (9 — 30º) Bo 305 +45º para30º< 6<90º
32. Aparelho, de acordo com qualquer uma das reivindicações 28 a 31, em que o aparelho é caracterizado por ser configurado para mapear o ângulo de elevação 0 no ângulo de elevação mapeado à de acordo com 92 para 6 < O7op õ= Prop Cm Bro) +BÔrop Paradrop < 9 <90º (90º = rop) em que 67,, é um ângulo de elevação de alto-falantes de altura no sistema de coordenada cartesiana; e em que Brop é um ângulo de elevação de alto-falantes de altura no sistema de coordenada esférica.
33. Aparelho, de acordo com qualquer uma das reivindicações 27 a 32, em que o aparelho é caracterizado por ser configurado para obter um raio de domínio esférico mapeado 7 com base em um raio de domínio esférico.
34. Aparelho, de acordo com a reivindicação 33, em que o aparelho é caracterizado por ser configurado para escalonar o raio de domínio esférico em dependência do ângulo de elevação ou em dependência do ângulo de elevação mapeado, em que o aparelho é configurado para realizar um mapeamento, que mapeia um círculo em um sistema de coordenada esférica em limiares de um quadrado em um sistema cartesiano.
35. Aparelho, de acordo com a reivindicação 33 ou 34, em que o aparelho é caracterizado por ser configurado para obter o raio de domínio esférico mapeado 7 com base em um raio de domínio esférico r de acordo com r z — para 6 < 45º = — 1 cos T= r x —— para45º <6ô<90º sen 8 em que ô é o ângulo de elevação ou o ângulo de elevação mapeado.
36. Aparelho, de acordo com qualquer uma das reivindicações 33 a 35, em que o aparelho é caracterizado por ser configurado para obter o raio de domínio esférico mapeado 7 com base em um raio de domínio esférico r de acordo com ” 6 <ô — ara Ô < = — 1 cos P Top T= r 2 z —— parar, <A<90º sen 8 em que à é o ângulo de elevação ou o ângulo de elevação mapeado, e em que ô7,, é um ângulo de elevação de alto-falantes de altura no sistema de coordenada esférica.
37. Aparelho, de acordo com qualquer uma das reivindicações 27 a 36, em que o aparelho é caracterizado por ser configurado para obter o valor z que descreve uma distância da posição de objeto da área de base de acordo com z=7 senô e/ou em que o aparelho é configurado para obter o raio intermediário rx, de acordo com Ty = F cosÔ, em que 7 é o raio de domínio esférico ou o raio de domínio esférico mapeado; e em que à é o ângulo de elevação ou o ângulo de elevação mapeado.
38. Aparelho, de acordo com qualquer uma das reivindicações 27 a 37, em que o aparelho é caracterizado por ser configurado para realizar a correção de raio com o uso de um mapeamento que mapeia segmentos de círculo em triângulos inscritos em um círculo.
39. Aparelho, de acordo com qualquer uma das reivindicações 27 a 38, em que o aparelho é caracterizado por ser configurado para escalonar o raio intermediário em dependência do ângulo de azimute, para obter um raio corrigido.
40. Aparelho, de acordo com qualquer uma das reivindicações 27 a 39, em que o aparelho é caracterizado por ser configurado para obter o raio corrigido £,, com base no raio intermediário 1,,, de acordo com cos 30º ara |é| < 30º cos q Pp vis fEy = cos 80º ara 30º < |p| < 110º = | PTosmo-fan Pê cos 140º ara 110º < |9| < 180º xy cos(180º — |&|) Pp Pis em que « é o ângulo de azimute.
41. Aparelho, de acordo com qualquer uma das reivindicações 27 a 40, em que o aparelho é caracterizado por ser configurado para obter o raio corrigido £,, com base no raio intermediário 1, de acordo com Pa) — o(P. cos (« 2) 7 A J) Py = ly BT TB Da) + (À, cos (« 2) 5 9(É) - -) em que « é o ângulo de azimute, e em que 94(Ã) e p(Ê) são ângulos de posição de dois cantos de um respectivo triângulo de domínio esférico.
42. Aparelho, de acordo com qualquer uma das reivindicações 27 a 41, em que o aparelho é caracterizado por ser configurado para determinar uma posição (P) dentro de um dos triângulos inscritos no círculo de acordo com . —fy senq para |&| < 90º (sh sen(180º - À) para 90º <q] < 180º . fry Cos para || < 90º 7? (é, cos(180º — |&]) para 90º < |&]| < 180º em que Z e 3 são valores de coordenada; em que 7, é o raio intermediário ou o raio corrigido; e em que + é o ângulo de azimute.
43. Aparelho, de acordo com qualquer uma das reivindicações 27 a 42, em que o aparelho é caracterizado por ser configurado para determinar a posição mapeada da projeção (P) da posição de objeto no plano de base com base na posição determinada (P) dentro de um dos triângulos inscritos no círculo com o uso de um mapeamento de transformada linear do triângulo no qual a posição determinada se encontra, em um triângulo associado no plano de base.
44. Aparelho, de acordo com qualquer uma das reivindicações 27 a 43, em que o aparelho é caracterizado por ser configurado para determinar a posição mapeada da projeção P da posição de objeto no plano de base de acordo com P=()=n7s em que T é uma matriz de transformada, e em que P é um vetor que representa a projeção da posição de objeto no plano de base.
45. Aparelho, de acordo com a reivindicação 44, caracterizado por a matriz de transformada ser definida de acordo com = . .
T= [é e) — 1 [> - PaxPay Paxbor = 2 21 “22 PixP2y = PoxP1y PiyP2y - PoyP1y PrxP2y = PayP2x em que Px, Piy, Pox, P2, São coordenadas x e y de dois cantos do triângulo de área de base determinado; e em que P1 x, P1y, Pax, Pa, São coordenadas x e y de dois cantos do triângulo de domínio esférico associado.
46. Aparelho, de acordo com qualquer uma das reivindicações 27 a 45, caracterizado por os triângulos de área de base compreenderem - um primeiro triângulo de área de base que cobre uma área na frente de uma origem da representação cartesiana, - um segundo triângulo de área de base que cobre e área em um lado esquerdo da origem da representação cartesiana, - um terceiro triângulo de área de base que cobre uma área em um lado direito da origem da representação cartesiana, e - um quarto triângulo de área de base que cobre uma área atrás de uma origem da representação cartesiana.
47. Aparelho, de acordo com qualquer uma das reivindicações 27 a 46,
caracterizado por os triângulos de domínio esférico compreenderem - um primeiro triângulo de domínio esférico que cobre uma área na frente de uma origem da representação esférica, - um segundo triângulo de domínio esférico que cobre e área em um lado esquerdo da origem da representação esférica, - um terceiro triângulo de domínio esférico que cobre uma área em um lado direito da origem da representação esférica, e - um quarto triângulo de domínio esférico que cobre uma área atrás de uma origem da representação esférica.
48. Aparelho, de acordo com qualquer uma das reivindicações 27 a 45, caracterizado por os triângulos de área de base compreenderem - um primeiro triângulo de área de base que cobre uma área em uma região frontal direita de uma origem da representação cartesiana, - um segundo triângulo de área de base que cobre uma área em uma região frontal esquerda de uma origem da representação cartesiana - um terceiro triângulo de área de base que cobre e área em um lado esquerdo da origem da representação cartesiana, - um quarto triângulo de área de base que cobre uma área em um lado direito da origem da representação cartesiana, e - um quinto triângulo de área de base que cobre uma área atrás de uma origem da representação cartesiana.
49. Aparelho, de acordo com qualquer uma das reivindicações 27 a 45 e 48, caracterizado por os triângulos de domínio esférico compreenderem - um primeiro triângulo de domínio esférico que cobre uma área em uma área frontal direita de uma origem da representação esférica, - um segundo triângulo de domínio esférico que cobre uma área em uma área frontal esquerda de uma origem da representação esférica, - um terceiro triângulo de domínio esférico que cobre e área em um lado esquerdo da origem da representação esférica,
- um quarto triângulo de domínio esférico que cobre uma área em um lado direito da origem da representação esférica, e - um quinto triângulo de domínio esférico que cobre uma área atrás de uma origem da representação esférica.
50. Aparelho, de acordo com qualquer uma das reivindicações 27 a 49, caracterizado por as coordenadas P1, P2 de cantos de triângulos de área de base e coordenadas de cantos de triângulos de domínio esférico associados P, e P, serem definidas como a seguir: o — 3 o — Bs Par del(1,1)| ( (sen 30º =* ,cos30º =) (= Za triângul 1,1) os 1 V31 Par del (- |(1- (3) (-0,93969, - triângul | 1,1) | 1) 0,34202) os 2 Par del (1. | (1- ( (0,93969, —0,3420 triângul | 1) | 1) |—cos(110º — 90º) = —0,93969, —sen(20º) ) os 3 0,34202) 3 1 Par del (1, (1,1) (0,93969, —0,34202) Gs) triângul | 1) os 4 em que um terceiro canto dos respectivos triângulos está em uma origem do respectivo sistema de coordenadas.
51. Fornecedor de transmissão contínua de áudio (1100) para fornecer uma transmissão contínua de áudio, em que o fornecedor de transmissão contínua de áudio é caracterizado por ser configurado para receber informações de posição de objeto de entrada (1110) que descrevem uma posição de um objeto de áudio em uma representação cartesiana e para fornecer uma transmissão contínua de áudio (1112) que compreende informações de posição de objeto de saída que descreve a posição do objeto em uma representação esférica, em que o fornecedor de transmissão contínua de áudio compreende um aparelho (100;1130), de acordo com qualquer uma das reivindicações 1 a 26, a fim de converter a representação cartesiana na representação esférica.
52. Sistema de produção de conteúdo de áudio (1200), em que o sistema de produção de conteúdo de áudio é caracterizado por ser configurado para determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação cartesiana, e em que o sistema de produção de conteúdo de áudio compreende um aparelho (100;1230), de acordo com qualquer uma das reivindicações 1 a 26, a fim de converter a representação cartesiana na representação esférica, e em que o sistema de produção de conteúdo de áudio é configurado para incluir a representação esférica em uma transmissão contínua de áudio.
53. Aparelho de reprodução de áudio (1300), em que o aparelho de reprodução de áudio é caracterizado por ser configurado para receber uma transmissão contínua de áudios (1112;1212;1310) que compreende uma representação esférica de informações de posição de objeto, e em que o aparelho de reprodução de áudio compreende um aparelho (200;1330), de acordo com uma das reivindicações 27 a 50, que é configurado para converter a representação esférica em uma representação cartesiana das informações de posição de objeto, e em que o aparelho de reprodução de áudio compreende um renderizador (1340) configurado para renderizar um objeto de áudio para uma pluralidade de sinais de canal (1350) associados a transdutores de som em dependência da representação cartesiana das informações de posição de objeto.
54. Fornecedor de transmissão contínua de áudio (1100) para fornecer uma transmissão contínua de áudio, em que o fornecedor de transmissão contínua de áudio é caracterizado por ser configurado para receber informações de posição de objeto de entrada (1110) que descrevem uma posição de um objeto de áudio em uma representação esférica e para fornecer uma transmissão contínua de áudio (1112) que compreende informações de posição de objeto de saída que descreve a posição do objeto em uma representação cartesiana, em que o fornecedor de transmissão contínua de áudio compreende um aparelho (100;1130), de acordo com uma das reivindicações 27 a 50, a fim de converter a representação esférica na representação cartesiana.
55. Sistema de produção de conteúdo de áudio (1200), em que o sistema de produção de conteúdo de áudio é caracterizado por ser configurado para determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação esférica, e em que o sistema de produção de conteúdo de áudio compreende um aparelho (100;1230), de acordo com uma das reivindicações 27 a 50, a fim de converter a representação esférica em uma representação cartesiana, e em que o sistema de produção de conteúdo de áudio é configurado para incluir a representação cartesiana em uma transmissão contínua de áudio.
56. Aparelho de reprodução de áudio (1300), em que o aparelho de reprodução de áudio é caracterizado por ser configurado para receber uma transmissão contínua de áudio (1112;1212;1310) que compreende uma representação cartesiana de informações de posição de objeto, e em que o aparelho de reprodução de áudio compreende um aparelho (200;1330), de acordo com uma das reivindicações 1 a 27, que é configurado para converter a representação cartesiana em uma representação esférica das informações de posição de objeto, e em que o aparelho de reprodução de áudio compreende um renderizador (1340) configurado para renderizar um objeto de áudio para uma pluralidade de sinais de canal (1350) associados a transdutores de som em dependência da representação esférica das informações de posição de objeto.
57. Método (1400) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica, em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo de uma representação esférica, em que o método compreende determinar (1410), em qual dos triângulos de área de base uma projeção (P) da posição de objeto do objeto de áudio na área de base é disposta; e em que o método compreende determinar (1420) uma posição mapeada (P) da projeção (P) da posição de objeto com o uso de uma transformada linear (T), que mapeia o triângulo de área de base em seu triângulo de domínio esférico associado, em que o método compreende derivar (1430) um ângulo de azimute [4] e um valor de raio intermediário (7) da posição mapeada (P); em que o método compreende obter (1440) um valor de raio de domínio esférico (%,r) e um ângulo de elevação (d) em dependência do valor de raio intermediário (rxy, 4) e em dependência de uma distância (z) da posição de objeto da área de base.
58. Método (1500) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação esférica em uma representação cartesiana, em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo de uma representação esférica, em que o método compreende obter (1510) um valor (z) que descreve uma distância da posição de objeto da área de base e um raio intermediário (rh) com base em um ângulo de elevação ou um ângulo de elevação mapeado e com base em um raio de domínio esférico ou um raio de domínio esférico mapeado; em que o método compreende determinar (1520) uma posição (P) dentro de um dos triângulos inscritos no círculo com base no raio intermediário, ou uma versão corrigida do mesmo, e com base em um ângulo de azimute [4]; e em que o método compreende determinar (1530) uma posição mapeada da projeção (P) da posição de objeto no plano de base com base na posição determinada (P) dentro de one dos triângulos inscritos no círculo.
59. Método para fornecer uma transmissão contínua de áudio, em que o método é caracterizado por compreender receber informações de posição de objeto de entrada que descrevem uma posição de um objeto de áudio em uma representação cartesiana e fornecer uma transmissão contínua de áudio que compreende informações de posição de objeto de saída que descreve a posição do objeto em uma representação esférica, em que o método compreende converter a representação cartesiana na representação esférica com o uso do método, de acordo com a reivindicação 57.
60. Método para produzir um conteúdo de áudio, em que o método é caracterizado por compreender determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação cartesiana, e em que o método compreende converter a representação cartesiana na representação esférica com o uso do método, de acordo com a reivindicação 57, e em que o método compreende incluir a representação esférica em uma transmissão contínua de áudio.
61. Método (1600) para reprodução de áudio, em que o método é caracterizado por compreender receber (1610) uma transmissão contínua de áudios que compreende uma representação esférica de informações de posição de objeto, e em que o método compreende converter (1620) a representação esférica em uma representação cartesiana das informações de posição de objeto, de acordo com a reivindicação 58, e em que o método compreende renderizar (1630) um objeto de áudio para uma pluralidade de sinais de canal associados a transdutores de som em dependência da representação cartesiana das informações de posição de objeto.
62. Método para fornecer uma transmissão contínua de áudio, em que o método é caracterizado por compreender receber informações de posição de objeto de entrada que descrevem uma posição de um objeto de áudio em uma representação esférica e fornecer uma transmissão contínua de áudio que compreende informações de posição de objeto de saída que descreve a posição do objeto em uma representação cartesiana, em que o método compreende converter a representação esférica na representação cartesiana com o uso do método, de acordo com a reivindicação 58.
63. Método para produzir um conteúdo de áudio, em que o método é caracterizado por compreender determinar informações de posição de objeto que descrevem uma posição de um objeto de áudio em uma representação esférica, e em que o método compreende converter a representação esférica na representação cartesiana com o uso do método, de acordo com a reivindicação 58, e em que o método compreende incluir a representação cartesiana em uma transmissão contínua de áudio.
64. Método (1600) para reprodução de áudio, em que o método é caracterizado por compreender receber uma transmissão contínua de áudios que compreende uma representação cartesiana de informações de posição de objeto, e em que o método compreende converter a representação cartesiana em uma representação esférica das informações de posição de objeto, de acordo com a reivindicação 57, e em que o método compreende renderizar um objeto de áudio para uma pluralidade de sinais de canal associados a transdutores de som em dependência da representação esférica das informações de posição de objeto.
65. Programa de computador caracterizado por ser para realizar um método, de acordo com qualquer uma das reivindicações 57 a 64, quando o programa de computador é executado em um computador.
66. Aparelho (100) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana (110) em uma representação esférica (112), em que a posição de objeto é descrita com o uso de um ângulo de azimute, um ângulo de elevação e um raio de domínio esférico, em que, por exemplo, alto-falantes são colocados em um quadrado em um sistema de coordenada cartesiana associado à representação cartesiana e alto- falantes são colocados em um círculo em um sistema de coordenada esférica associado à representação esférica; em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base (630,532,634,636), e em que uma pluralidade de triângulos de domínio esférico (660,662,664,666) são inscritos em um círculo da representação esférica, em que cada um dos triângulos de domínio esférico é associado a um triângulo de área de base; em que as posições de cantos de pelo menos alguns dos triângulos de área de base correspondem às posições de alto-falantes no sistema de coordenada cartesiana, e em que posições de cantos de pelo menos alguns dos triângulos de domínio esférico correspondem às posições de alto-falantes no sistema de coordenada esférica; em que o aparelho é configurado para determinar, em qual dos triângulos de área de base uma projeção (P) da posição de objeto do objeto de áudio na área de base é disposta; e em que o aparelho é configurado para determinar uma posição mapeada (P) da projeção (P) da posição de objeto com o uso de uma transformada linear (T), que mapeia o triângulo de área de base em um triângulo de domínio esférico associado, em que o aparelho é configurado para derivar um ângulo de azimute (q) e um valor de raio intermediário (7, ) da posição mapeada (P); em que o aparelho é configurado para obter um valor de raio de domínio esférico (, r) e um ângulo de elevação (6) em dependência do valor de raio intermediário (rx, 4,,) e em dependência de uma distância (z) da posição de objeto da área de base.
67. Método (1400) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação cartesiana em uma representação esférica, na qual a posição de objeto é descrita com o uso de um ângulo de azimute, um ângulo de elevação e um raio de domínio esférico, em que, por exemplo, alto-falantes são colocados em um quadrado em um sistema de coordenada cartesiana associado à representação cartesiana e alto- falantes são colocados em um círculo em um sistema de coordenada esférica associado à representação esférica; em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo da representação esférica, em que cada um dos triângulos de domínio esférico é associado a um triângulo de área de base; em que as posições de cantos de pelo menos alguns dos triângulos de área de base correspondem às posições de alto-falantes no sistema de coordenada cartesiana, e em que posições de cantos de pelo menos alguns dos triângulos de domínio esférico correspondem às posições de alto-falantes no sistema de coordenada esférica; em que o método compreende determinar (1410), em qual dos triângulos de área de base uma projeção (P) da posição de objeto do objeto de áudio na área de base é disposta; e em que o método compreende determinar (1420) uma posição mapeada (P) da projeção (P) da posição de objeto com o uso de uma transformada linear (T), que mapeia o triângulo de área de base em seu triângulo de domínio esférico associado, em que o método compreende derivar (1430) um ângulo de azimute [79] e um valor de raio intermediário (%,,) da posição mapeada (É); em que o método compreende obter (1440) um valor de raio de domínio esférico (f%,r) e um ângulo de elevação (0) em dependência do valor de raio intermediário (rx, .,) e em dependência de uma distância (z) da posição de objeto da área de base.
68. Aparelho (200) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação esférica (218,228,258), na qual a posição de objeto é descrita com o uso de um ângulo de azimute, um ângulo de elevação e um raio de domínio esférico, em uma representação cartesiana (242,292), em que, por exemplo, alto-falantes são colocados em um quadrado em um sistema de coordenada cartesiana associado à representação cartesiana e alto- falantes são colocados em um círculo em um sistema de coordenada esférica associado à representação esférica; em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo da representação esférica, em que as posições de cantos de pelo menos alguns dos triângulos de área de base correspondem às posições de alto-falantes no sistema de coordenada cartesiana, e em que posições de cantos de pelo menos alguns dos triângulos de domínio esférico correspondem às posições de alto-falantes no sistema de coordenada esférica; em que o aparelho é configurado para obter um valor (z) (242) que descreve uma distância da posição de objeto da área de base e um raio intermediário (252, rxy) com base no ângulo de elevação (218) ou um ângulo de elevação mapeado (222) e com base no raio de domínio esférico (228) ou um raio de domínio esférico mapeado (232); em que o aparelho é configurado para determinar uma posição (272, P) dentro de um dos triângulos inscritos no círculo com base no raio intermediário (252), ou uma versão corrigida (262) do mesmo, na qual um ajuste de raio, que é realizado devido aos alto-falantes serem colocados em um quadrado no sistema de coordenada cartesiana em contraste com o sistema de coordenada esférica, é revertida, e com base no ângulo de azimute (q); e em que o aparelho é configurado para determinar uma posição mapeada (292) da projeção (272, P) da posição de objeto no plano de base com base na posição determinada (272, P) dentro de um dos triângulos inscritos no círculo, com o uso de um mapeamento de transformada linear do triângulo no qual a posição determinada se encontra, em um triângulo associado ao plano de base, em que o valor (z) (242) que descreve a distância da posição de objeto da área de base e a posição mapeada (292) descreve a posição de objeto na representação cartesiana.
69. Método (1500) caracterizado por ser para converter uma posição de objeto de um objeto de áudio de uma representação esférica, na qual a posição de objeto é descrita com o uso de um ângulo de azimute, um ângulo de elevação e um raio de domínio esférico, em uma representação cartesiana,
em que, por exemplo, alto-falantes são colocados em um quadrado em um sistema de coordenada cartesiana associado à representação cartesiana e alto- falantes são colocados em um círculo em um sistema de coordenada esférica associado à representação esférica;
em que uma área de base da representação cartesiana é subdividida em uma pluralidade de triângulos de área de base, e em que uma pluralidade de triângulos de domínio esférico são inscritos em um círculo de uma representação esférica,
em que as posições de cantos de pelo menos alguns dos triângulos de área de base correspondem às posições de alto-falantes no sistema de coordenada cartesiana, e em que posições de cantos de pelo menos alguns dos triângulos de domínio esférico correspondem às posições de alto-falantes no sistema de coordenada esférica;
em que o método compreende obter (1510) um valor (z) que descreve uma distância da posição de objeto da área de base e um raio intermediário (rh) com base em um ângulo de elevação ou um ângulo de elevação mapeado e com base em um raio de domínio esférico ou um raio de domínio esférico mapeado;
em que o método compreende determinar (1520) uma posição (P) dentro de um dos triângulos inscritos no círculo com base no raio intermediário, ou uma versão corrigida do mesmo no qual um ajuste de raio, que é realizado devido aos alto- falantes serem colocados em um quadrado no sistema de coordenada cartesiana em contraste com o sistema de coordenada esférica, é revertida, e com base em um ângulo de azimute [4]; e em que o método compreende determinar (1530) uma posição mapeada da projeção (P) da posição de objeto no plano de base com base na posição determinada (P) dentro de um dos triângulos inscritos no círculo, com o uso de um mapeamento de transformada linear do triângulo no qual a posição determinada se encontra, em um triângulo associado ao plano de base; em que o valor (z) (242) que descreve a distância da posição de objeto da área de base e a posição mapeada (292) descreve a posição de objeto na representação cartesiana.
BR112020015417-2A 2018-01-30 2019-01-29 Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos BR112020015417A2 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP18154307.5 2018-01-30
EP18154307 2018-01-30
PCT/EP2018/025211 WO2019149337A1 (en) 2018-01-30 2018-08-08 Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs
EPPCT/EP2018/025211 2018-08-08
PCT/EP2019/052156 WO2019149710A1 (en) 2018-01-30 2019-01-29 Apparatuses for converting an object position of an audio object, audio stream provider, audio content production system, audio playback apparatus, methods and computer programs

Publications (1)

Publication Number Publication Date
BR112020015417A2 true BR112020015417A2 (pt) 2020-12-08

Family

ID=61188596

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112020015417-2A BR112020015417A2 (pt) 2018-01-30 2019-01-29 Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos

Country Status (15)

Country Link
US (1) US11653162B2 (pt)
EP (1) EP3747204B1 (pt)
JP (1) JP7034309B2 (pt)
KR (1) KR102412012B1 (pt)
CN (1) CN112154676B (pt)
AR (2) AR114348A1 (pt)
AU (1) AU2019214298C1 (pt)
BR (1) BR112020015417A2 (pt)
CA (1) CA3090026C (pt)
ES (1) ES2962111T3 (pt)
MX (1) MX2020007998A (pt)
RU (1) RU2751129C1 (pt)
SG (1) SG11202007293UA (pt)
TW (1) TWI716810B (pt)
WO (2) WO2019149337A1 (pt)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020008890A1 (ja) * 2018-07-04 2020-01-09 ソニー株式会社 情報処理装置および方法、並びにプログラム

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6684176B2 (en) * 2001-09-25 2004-01-27 Symbol Technologies, Inc. Three dimensional (3-D) object locator system for items or sites using an intuitive sound beacon: system and method of operation
ZA200503594B (en) * 2002-12-02 2006-08-30 Thomson Licensing Sa Method for describing the composition of audio signals
FR2858403B1 (fr) * 2003-07-31 2005-11-18 Remy Henri Denis Bruno Systeme et procede de determination d'une representation d'un champ acoustique
WO2010131431A1 (ja) * 2009-05-11 2010-11-18 パナソニック株式会社 音響再生装置
EP3913931B1 (en) * 2011-07-01 2022-09-21 Dolby Laboratories Licensing Corp. Apparatus for rendering audio, method and storage means therefor.
EP2600637A1 (en) 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for microphone positioning based on a spatial power density
RU2602346C2 (ru) * 2012-08-31 2016-11-20 Долби Лэборетериз Лайсенсинг Корпорейшн Рендеринг отраженного звука для объектно-ориентированной аудиоинформации
US9913064B2 (en) * 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
JP6253031B2 (ja) 2013-02-15 2017-12-27 パナソニックIpマネジメント株式会社 キャリブレーション方法
CN105103569B (zh) * 2013-03-28 2017-05-24 杜比实验室特许公司 使用被组织为任意n边形的网格的扬声器呈现音频
EP2809088B1 (en) * 2013-05-30 2017-12-13 Barco N.V. Audio reproduction system and method for reproducing audio data of at least one audio object
KR102226420B1 (ko) 2013-10-24 2021-03-11 삼성전자주식회사 다채널 오디오 신호 생성 방법 및 이를 수행하기 위한 장치
JP2015179986A (ja) * 2014-03-19 2015-10-08 ヤマハ株式会社 オーディオ定位設定装置、方法、及び、プログラム
EP2925024A1 (en) * 2014-03-26 2015-09-30 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio rendering employing a geometric distance definition
EP2928216A1 (en) 2014-03-26 2015-10-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for screen related audio object remapping
US9723419B2 (en) * 2014-09-29 2017-08-01 Bose Corporation Systems and methods for determining metric for sound system evaluation
US9578439B2 (en) * 2015-01-02 2017-02-21 Qualcomm Incorporated Method, system and article of manufacture for processing spatial audio
EP3286930B1 (en) * 2015-04-21 2020-05-20 Dolby Laboratories Licensing Corporation Spatial audio signal manipulation
US10334387B2 (en) * 2015-06-25 2019-06-25 Dolby Laboratories Licensing Corporation Audio panning transformation system and method
EP3332557B1 (en) * 2015-08-07 2019-06-19 Dolby Laboratories Licensing Corporation Processing object-based audio signals
EP4333461A3 (en) * 2015-11-20 2024-04-17 Dolby Laboratories Licensing Corporation Improved rendering of immersive audio content
GB2546504B (en) * 2016-01-19 2020-03-25 Facebook Inc Audio system and method
CN105898668A (zh) * 2016-03-18 2016-08-24 南京青衿信息科技有限公司 一种声场空间的坐标定义方法
US9949052B2 (en) * 2016-03-22 2018-04-17 Dolby Laboratories Licensing Corporation Adaptive panner of audio objects

Also Published As

Publication number Publication date
CN112154676A (zh) 2020-12-29
ES2962111T3 (es) 2024-03-15
JP7034309B2 (ja) 2022-03-11
MX2020007998A (es) 2020-09-21
JP2021513775A (ja) 2021-05-27
TW201937944A (zh) 2019-09-16
CA3090026A1 (en) 2019-08-08
KR20200139670A (ko) 2020-12-14
KR102412012B1 (ko) 2022-06-22
EP3747204C0 (en) 2023-09-27
EP3747204A1 (en) 2020-12-09
WO2019149337A1 (en) 2019-08-08
AU2019214298C1 (en) 2023-07-20
AR127189A2 (es) 2023-12-27
WO2019149710A1 (en) 2019-08-08
TWI716810B (zh) 2021-01-21
AR114348A1 (es) 2020-08-26
CA3090026C (en) 2023-03-21
RU2751129C1 (ru) 2021-07-08
US11653162B2 (en) 2023-05-16
SG11202007293UA (en) 2020-08-28
CN112154676B (zh) 2022-05-17
AU2019214298B2 (en) 2022-04-07
US20200359149A1 (en) 2020-11-12
EP3747204B1 (en) 2023-09-27
AU2019214298A1 (en) 2020-09-17

Similar Documents

Publication Publication Date Title
CN105981411B (zh) 用于高声道计数的多声道音频的基于多元组的矩阵混合
US20220272481A1 (en) Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio
CN112262585A (zh) 环境立体声深度提取
JP7226436B2 (ja) 情報処理装置および方法、並びにプログラム
US20140023196A1 (en) Scalable downmix design with feedback for object-based surround codec
US20190069110A1 (en) Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
JP7388492B2 (ja) 信号処理装置および方法、並びにプログラム
CN115955622A (zh) 针对在麦克风阵列之外的位置的麦克风阵列所捕获的音频的6dof渲染
BR112020015417A2 (pt) Aparelhos para converter uma posição de objeto de um objeto de áudio, fornecedor de transmissão contínua de áudio, sistema de produção de conteúdo de áudio, aparelho de reprodução de áudio e métodos
CN115244501A (zh) 音频对象的表示和渲染
CN109479178B (zh) 基于呈现器意识感知差异的音频对象聚集
CN111869241A (zh) 使用多通道扬声器系统的空间声音再现
GB2572419A (en) Spatial sound rendering
CN112616110A (zh) 空间声渲染方法、装置和电子设备
TW202348047A (zh) 用於沉浸式3自由度/6自由度音訊呈現的方法和系統
Kim et al. A Study on Realistic Audio Sound Generation according to User's Movement in Virtual Reality System

Legal Events

Date Code Title Description
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06W Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette]