BR112018014724B1 - Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo - Google Patents

Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo Download PDF

Info

Publication number
BR112018014724B1
BR112018014724B1 BR112018014724-9A BR112018014724A BR112018014724B1 BR 112018014724 B1 BR112018014724 B1 BR 112018014724B1 BR 112018014724 A BR112018014724 A BR 112018014724A BR 112018014724 B1 BR112018014724 B1 BR 112018014724B1
Authority
BR
Brazil
Prior art keywords
channel
gain
subband
talk
cross
Prior art date
Application number
BR112018014724-9A
Other languages
English (en)
Other versions
BR112018014724A2 (pt
Inventor
Zachary Seldess
James Tracey
Alan Kraemer
Original Assignee
Boomcloud 360, Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Boomcloud 360, Inc filed Critical Boomcloud 360, Inc
Publication of BR112018014724A2 publication Critical patent/BR112018014724A2/pt
Publication of BR112018014724B1 publication Critical patent/BR112018014724B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/04Circuits for transducers, loudspeakers or microphones for correcting frequency response
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/12Circuits for transducers, loudspeakers or microphones for distributing signals to two or more loudspeakers
    • H04R3/14Cross-over networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • H04R5/033Headphones for stereophonic communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • H04S1/005For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/13Aspects of volume control, not necessarily automatic, in stereophonic sound systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/07Synergistic effects of band splitting and sub-band processing

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

As realizações no presente são principalmente descritas no contexto de um sistema, um método e uma mídia legível por computador não transitória para produzir um som com detectabilidade espacial aprimorada e uma simulação de fala cruzada. O sistema de processamento de áudio recebe um canal esquerdo e direito de entrada de um sinal de entrada de áudio, e realiza um processamento de áudio para gerar um sinal de áudio de saída. O sistema gera os sinais esquerdos e direitos espacialmente aprimorados por ajuste de ganho dos componentes de sub-banda lateral e componentes de sub-banda média dos canais esquerdos e direitos de entrada. O sistema de processamento de áudio gera os canais esquerdos e direitos de fala cruzada, tal como, ao aplicar um filtro e atraso de tempo aos canais esquerdos e direitos de entrada, e misturar os canais espacialmente aprimorados com os canais de fala cruzada. Em algumas realizações, o sistema inclui os canais de aprimoramento de alta/baixa frequência e canais de passagem derivados a partir dos canais de entrada, que podem ser misturados com o sinal de áudio de saída.

Description

Histórico 1. Campo da revelação
[0001] As realizações da presente revelação geralmente referem-se ao campo de processamento de sinal de áudio binaural e estereofônico e, mais particularmente, otimizar os sinais de áudio para reprodução em alto-falantes montados na cabeça, tais como, fones de ouvido estéreos.
2. Descrição da técnica relacionada
[0002] A reprodução de som estereofônico envolve codificar e reproduzir sinais contendo propriedades espaciais de um campo de som usando dois ou mais transdutores. O som estereofônico permite a um ouvinte perceber um sentido espacial no campo de som. Em um sistema tipico de reprodução de som estereofônico, dois alto-falantes "em campo" posicionados nos locais fixos no campo de audição convertem um sinal estéreo em ondas de som. As ondas de som de cada alto-falante em campo propagam- se através do espaço em direção a ambos os ouvidos de um ouvinte para criar uma impressão do som ouvido de diversas direções dentro do campo de som.
[0003] Os alto-falantes montados na cabeça, tais como, fontes de ouvido ou fontes de ouvido dentro do ouvido, tipicamente incluem um alto-falante esquerdo dedicado para emitir som no ouvido esquerdo, e um alto-falante direito dedicado para emitir som no ouvido direito. As ondas de som geradas por um alto-falante montado na cabeça operam diferentemente a partir das ondas de som geradas por um alto-falante em campo, e tais diferenças podem ser perceptíveis ao ouvinte. O mesmo sinal estéreo de entrada pode produzir experiências de audição diferentes, e por vezes menos preferiveis, quando produzido a partir dos alto-falantes montados na cabeça e quando produzido a partir dos alto-falantes em campo.
Sumário
[0004] Um sistema de processamento de áudio de modo adaptável produz dois ou mais canais de saida para reprodução ao criar sinais simulados de fala cruzada contralateral para cada um dos canais de saida, e combinar esses sinais simulados com sinais espacialmente aprimorados. O sistema de processamento de áudio pode aprimorar a experiência de audição sobre alto- falantes montados na cabeça, e funcionar efetivamente em uma ampla variedade de conteúdo, incluindo música, filmes e jogos. O sistema de processamento de áudio inclui as configurações flexiveis (p.ex., de filtros, ganhos e atrasos) que fornecem experiências satisfatórias acusticamente dramáticas que particularmente aprimorar o campo de som espacial experimentado pelo ouvinte. Por exemplo, o sistema de processamento de áudio pode fornecer aos alto-falantes montados na cabeça um campo de som comparável ao experimentado ao ouvir conteúdo estéreo sobre alto-falantes em campo.
[0005] Em algumas realizações, o sistema de processamento de áudio recebe um sinal de áudio de entrada incluindo um canal esquerdo de entrada e um canal direito de entrada. Usar os canais esquerdos e direitos de entrada, o sistema de processamento de áudio gera um canal esquerdo e direito espacialmente aprimorado, canais esquerdos e direitos de fala cruzada, canais de aprimoramento de baixa frequência e alta frequência, canais médios e canais de passagem. O sistema de processamento de áudio mistura os canais gerados, tais como, ao aplicar diferentes ganhos aos canais, para gerar os canais esquerdos e direitos de saída. Em um aspecto, o sistema de processamento de áudio melhora a experiência de audição do sinal de entrada de áudio quando produzido aos alto-falantes montados na cabeça, simulando os componentes de sinal contralateral que são característicos do comportamento de onda de som dos alto-falantes em campo. Os sinais contralaterais simulados representam tanto o atraso adicional que resultaria do alto-falante de canal oposto, bem como, o efeito de filtragem que resultaria da cabeça do ouvinte e ouvido. 0 efeito de filtragem é fornecido por uma função de filtro para um efeito de sombra de cabeça para o respectivo canal de áudio. Como tal, o sentido espacial do campo de som é melhorado e o campo de som é expandido, resultando em uma experiência de audição mais agradável para alto-falantes montados na cabeça.
[0006] Os canais espacialmente aprimorados ainda aprimoram o sentido espacial do campo de som ao ajuste de ganho dos componentes de sub-banda lateral e componentes de sub-banda média dos canais esquerdos e direitos de entrada. Os canais de alta e baixa frequência respectivamente reforçam os componentes de baixa e alta frequência dos canais de entrada. Os canais médios e de passagem controlam a contribuição do sinal de áudio de entrada (p.ex., não espacialmente aprimorado) aos canais de saída.
[0007] Algumas realizações incluem um método para gerar os canais de saída, incluindo: receber um sinal de áudio de entrada compreendendo um canal esquerdo de entrada e um canal direito de entrada; gerar um canal espacialmente aprimorado esquerdo e um canal espacialmente aprimorado direito por ajuste de ganho dos componentes de sub-banda lateral e componentes de sub-banda média dos canais esquerdos e direitos de entrada; gerar um canal esquerdo de fala cruzada por filtragem e atraso de tempo do canal esquerdo de entrada; gerar um canal direito de fala cruzada por filtragem e atraso de tempo do canal direito de entrada; gerar um canal esquerdo de saida ao misturar o canal espacialmente aprimorado esquerdo e canal direito de fala cruzada; e gerar um canal direito de saida ao misturar o canal espacialmente aprimorado direito e canal esquerdo de fala cruzada.
[0008] Algumas realizações incluem um sistema de processamento de áudio incluindo: um melhorador espacial de sub-banda configurado para gerar um canal espacialmente aprimorado esquerdo e um canal espacialmente aprimorado direito por ajuste de ganho dos componentes de sub-banda lateral e componentes de sub-banda média de um canal esquerdo de entrada e um canal direito de entrada; um simulador de fala cruzada configurado para: gerar um canal esquerdo de fala cruzada por filtragem e atraso de tempo do canal esquerdo de entrada; e gerar um canal direito de fala cruzada por filtragem e atraso de tempo do canal direito de entrada; e um misturador configurado para: gerar um canal esquerdo de saida ao misturar o canal espacialmente aprimorado esquerdo e canal direito de fala cruzada; e gerar um canal direito de saida ao misturar o canal espacialmente aprimorado direito e canal esquerdo de fala cruzada.
[0009] Algumas realizações podem incluir uma mídia legível por computador não transitória configurada para armazenar o código de programa, o código de programa compreendendo instruções que, quando executadas por um processador, fazem com que o processador: receba um sinal de áudio de entrada compreendendo um canal esquerdo de entrada e um canal direito de entrada; qere um canal espacialmente aprimorado esquerdo e um canal espacialmente aprimorado direito por ajuste de ganho dos componentes de sub-banda lateral e componentes de sub- banda média dos canais esquerdos e direitos de entrada; gere um canal esquerdo de fala cruzada por filtragem e atraso de tempo do canal esquerdo de entrada; gere um canal direito de fala cruzada por filtragem e atraso de tempo do canal direito de entrada; gere um canal esquerdo de saida ao misturar o canal espacialmente aprimorado esquerdo e canal direito de fala cruzada; e gere um canal direito de saida ao misturar o canal espacialmente aprimorado direito e canal esquerdo de fala cruzada.
Breve descrição dos desenhos
[0010] FIG. 1 ilustra um sistema de reprodução de áudio estéreo.
[0011] FIG. 2 ilustra um sistema exemplar de processamento de áudio, de acordo com uma realização.
[0012] FIG. 3A ilustra um divisor de banda de frequência de um melhorador espacial de sub-banda, em conformidade com uma realização.
[0013] FIG. 3B ilustra um melhorador de banda de frequência do melhorador espacial de sub-banda, em conformidade com uma realização.
[0014] FIG. 3C ilustra um combinador aprimorado de banda do melhorador espacial de sub-banda, em conformidade com uma realização.
[0015] FIG. 4 ilustra um combinador de sub-banda, em conformidade com uma realização.
[0016] FIG. 5 ilustra um simulador de fala cruzada, em conformidade com uma realização.
[0017] FIG. 6 ilustra uma passagem, em conformidade com uma realização.
[0018] FIG. 7 ilustra um reforçador de alta/baixa frequência, em conformidade com uma realização.
[0019] FIG. 8 ilustra um misturador, em conformidade com uma realização.
[0020] FIG. 9 ilustra um método exemplar de otimizar um sinal de áudio para alto-falantes montados na cabeça, em conformidade com uma realização.
[0021] FIG. 10 ilustra um método de gerar os canais espacialmente aprimorados a partir de um sinal de áudio de entrada, em conformidade com uma realização.
[0022] FIG. 11 ilustra um método de gerar os canais de fala cruzada a partir do sinal de entrada de áudio, em conformidade com uma realização.
[0023] FIG. 12 ilustra um método de gerar os canais esquerdos e direitos de passagem e canais médios a partir do sinal de entrada de áudio, em conformidade com uma realização.
[0024] FIG. 13 ilustra um método de gerar os canais de aprimoramento de baixa e alta frequência a partir do sinal de entrada de áudio, em conformidade com uma realização.
[0025] FIGS. 14 até 18 ilustram os exemplos dos gráficos de resposta de frequência dos sinais de canal gerados pelo sistema de processamento de áudio, em conformidade com uma realização.
Descrição detalhada
[0026] Os recursos e vantagens descritos na especificação não são todos inclusive e, particularmente, muitos recursos de vantagens adicionais serão aparentes para aquele com habilidade ordinária na técnica considerando os desenhos, especificação e reivindicações. Além disso, deve ser observado que a linguagem usada na especificação foi principalmente selecionada para fins de legibilidade e instrucionais, e pode não ter sido selecionada para delinear ou circunscrever o objeto inventivo.
[0027] As Figuras (FIG.) e a seguinte descrição referem-se às realizações preferidas por meio de ilustração apenas. Deve ser observado que, a partir da discussão a seguir, as realizações alternativas das estruturas e métodos aqui revelados serão prontamente reconhecidos como alternativas viáveis que podem ser empregadas sem desviar dos principles da presente invenção.
[0028] A referência será agora feita em detalhe a diversas realizações da(s) presente(s) invenção(ões), cujos exemplos são ilustrados nas figuras anexas. É observado que em qualquer momento os números semelhantes praticáveis ou semelhantes de referência podem ser usados nas figuras e podem indicar funcionalidade semelhante ou igual. As figuras ilustram as realizações para os fins de ilustração apenas. Aquele com habilidade na técnica prontamente reconhecerá a partir da descrição a seguir que as realizações alternativas das estruturas e métodos aqui ilustrados podem ser empregados sem desviar dos princípios aqui descritos.
Sistema exemplar de processamento de áudio
[0029] Com referência à FIG. 1, dois alto-falantes em campo 110A e 110B posicionados em locais fixos em um campo de audição convertem um sinal estéreo em ondas de som, que se propagam através do espaço em direção a um ouvinte 120 até criar uma impressão de som ouvido de diversas direções (p.ex., a fonte de som imaginária 160) dentro do campo de som.
[0030] Os alto-falantes montados na cabeça, tais como, fontes de ouvido ou fontes de ouvido dentro do ouvido, incluem um alto-falante esquerdo dedicado 130L para emitir som no ouvido esquerdo 125L e um alto-falante direito dedicado 130R para emitir som no ouvido direito 125R. Como tal, a reprodução de sinal pelos alto-falantes montados na cabeça opera diferentemente da reprodução de sinal nos alto-falantes em campo 110A e 110B de diversos modos.
[0031] Diferente dos alto-falantes montados na cabeça, por exemplo, os alto-falantes 110A e 110B posicionados em uma distância a partir do ouvinte, cada produz as ondas de som "transaural" que são recebidas em ambos os ouvidos esquerdos e direitos 125L, 125R do ouvinte 120. O ouvido direito 125R recebe o componente de sinal 112L a partir do alto-falante 110A com um leve atraso relativo a quando o ouvido esquerdo 125L recebe um componente de sinal 118L a partir do alto- falante 110A. O atraso de tempo do componente de sinal 112L relativo ao componente de sinal 118L é causado por uma distância maior entre o alto-falante 110A e o ouvido direito 125R conforme comparado à distância entre o alto-falante 110A e o ouvido esquerdo 125L. Semelhantemente, o ouvido esquerdo 125L recebe o componente de sinal 112R a partir do alto- falante 110B com leve atraso relativo de quando o ouvido direito 125R recebe um componente de sinal 118R a partir do alto-falante 110B.
[0032] Os alto falantes montados na cabeca emitem ondas de som próximas aos ouvidos do usuário, e, portanto, geram propagação de onda de som transaural inferior ou inexistente, e desse modo, sem componentes contralaterais. Cada ouvido do ouvinte 120 recebe um componente de som ipsilateral a partir de um alto-falante correspondente, e nenhum componente de som de fala cruzada contralateral a partir do outro alto-falante. De modo correspondente, o ouvinte 120 perceberá um campo de som diferente e tipicamente menor com alto-falantes montados na cabeça.
[0033] FIG. 2 ilustra um exemplo de um sistema de processamento de áudio 200 para processar um sinal de áudio para alto-falantes montados na cabeça, em conformidade com uma realização. O sistema de processamento de áudio 200 inclui um melhorador espacial de sub-banda 210, um simulador de fala cruzada 215, uma passagem 220, m reforçador de alta/baixa frequência 225, um misturador 230 e um combinador de sub-banda 255. Os componentes do sistema de processamento de áudio 200 podem ser implantados em circuitos eletrônicos. Por exemplo, um componente de hardware pode compreender o conjunto de circuito dedicado ou lógica que é configurada (p.ex., como um processamento de finalidade especial, tal como, um processador de sinal digital (DSP), arranjo de porta programável de campo (FPGA) ou um circuito integrado especifico de aplicação (ASIC)) para realizar determinadas operações aqui reveladas.
[0034] O sistema 200 recebe um sinal de áudio de entrada X compreendendo dois canais de entrada, um canal esquerdo de entrada XL e um canal direito de entrada XR. 0 sinal de áudio de entrada X pode ser um sinal de áudio estéreo com diferentes canais esquerdos e direitos de entrada. Usando o sinal de áudio de entrada X, o sistema gera um sinal de áudio de saida 0 compreendendo dois canais de saída 0L, OU. Conforme discutido em maiores detalhes abaixo, o sinal de áudio de saída O é uma mistura de um sinal de aprimoramento espacial, um sinal simulado de fala cruzada, sinal de aprimoramento de baixa/alta frequência e/ou outras saídas de processamento com base no sinal de áudio de entrada X. Quando produzido aos alto-falantes montados na cabeça 280L e 280R, o sinal de áudio de saída O fornece uma experiência de audição comparável àquela de sistemas maiores de alto-falante em campo, tais como, em termos de tamanho de campo de som, controle de som espacial e características tonais.
[0035] O melhorador espacial de sub-banda 210 recebe o sinal de áudio de entrada X e gera um sinal espacialmente aprimorado Y, incluindo um canal espacialmente aprimorado esquerdo YL e um canal espacialmente aprimorado direito YR. O melhorador espacial de sub-banda 210 inclui um divisor de banda de frequência 240, um melhorador de banda de frequência 245 e um combinador aprimorado de sub-banda 250. O divisor de banda de frequência 240 recebe o canal esquerdo de entrada XL e o canal direito de entrada XR, e divides o canal esquerdo de entrada XL nos componentes de sub-banda esquerda EL(1) através de EL(n) e o canal direito de entrada XR nos componentes de sub-banda direita ER(1) através de ER(n), onde n é o número das sub-bandas (p.ex., 4) . As n sub-bandas definem um grupo de of n bandas de frequência, com cada sub- banda correspondente a uma das bandas de frequência.
[0036] O melhorador de banda de frequência 245 aprimora os componentes espaciais do sinal de áudio de entrada X ao alterar as razões de intensidade entre os componentes médios e laterais de sub-banda dos componentes de sub-banda esquerda EL(1)até EL(n), e alterar as razões de intensidade entre os componentes médios e laterais de sub-banda dos componentes de sub-banda direita ER(1) até ER(n). Para cada banda de frequência, o melhorador de banda de frequência gera os componentes médios e laterais de sub-banda (p.ex., Em(l) e Es(l), para a banda de frequência n=l) a partir dos componentes correspondentes de sub-banda esquerda e de sub- banda direita (p.ex., EL(1) e ER(1), aplica diferentes ganhos aos componentes médios e laterais de sub-banda para gerar um componente aprimorado de sub-banda média e um componente aprimorado de sub-banda lateral (p.ex., Ym(l) e Ys(l)) , e então converte os componentes aprimorados médios e laterais de sub-banda nos canais de sub-banda aprimorados esquerdos e direitos (p.ex., YL(1) e YR(1)). Como tal, o melhorador de banda de frequência 245 gera os canais de sub-banda esquerdos aprimorados YL(1) até YL(n) e canais de sub-banda direitos aprimorados YR(1) até YR(n), onde n é o número dos componentes de sub-banda.
[0037] O combinador aprimorado de sub-banda 250 gera o canal espacialmente aprimorado esquerdo YL a partir dos canais de sub-banda esquerdos aprimorados YL(1) até YL(n), e gera o canal espacialmente aprimorado direito YR a partir dos canais de sub-banda direitos aprimorados YR(1) até YR(n).
[0038] O combinador de sub-banda 255 gera um canal esquerdo de mistura de sub-banda EL ao combinar os componentes de sub- banda esquerda EL(1) até EL(n), e gera um canal direito de mistura de sub-banda ER ao combinar os componentes de sub- banda direita ER(1) até ER(n). O canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER são usados como entradas para o simulador de fala cruzada 215, a passagem 220, e/ou o reforçador de alta/baixa frequência 225. Em algumas realizações, o combinador de banda de sub-banda 255 é integrado com um do melhorador espacial de sub-banda 210, simulador de fala cruzada 215, passagem 220 ou reforçador de alta/baixa frequência 225. Por exemplo, se o combinador de banda de sub-banda 255 for parte do simulador de fala cruzada 215, então o simulador de fala cruzada 215 pode fornecer o canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER à passagem 22 0 e/ou reforçador de alta/baixa frequência 225.
[0039] Em algumas realizações, o combinador de sub-banda 255 é omitido a partir do sistema 200. Por exemplo, o simulador de fala cruzada 215, passagem 220 e/ou reforçador de alta/baixa frequência 225 podem receber e processar os canais de entrada de áudio original XL e XR ao invés dos canais de mistura de sub-banda EL e ER.
[0040] O simulador de fala cruzada 215 gera um "efeito de sombra de cabeça" a partir do sinal de entrada de áudio X. O efeito de sombra de cabeça refere-se a uma transformação de uma onda de som causada por propagação de onda transaural em torno e através da cabeça de um ouvinte, tal como seria percebido pelo ouvinte se o sinal de entrada de áudio X tiver sido transmitido a partir dos alto-falantes 110A e 110B para cada um dos ouvidos esquerdos e direitos 125L e 125R do ouvinte 120 conforme mostrado na FIG. 1. Por exemplo, o simulador de fala cruzada 215 gera um canal esquerdo de fala cruzada CL a partir do canal esquerdo EL e um canal direito de fala cruzada CR a partir do canal direito ER. O canal esquerdo de fala cruzada CL pode ser gerado ao aplicar um filtro de passagem inferior, atraso e ganho ao canal esquerdo de mistura de sub-banda EL. O canal direito de fala cruzada CR pode ser gerado ao aplicar um filtro de passagem inferior, atraso e ganho ao canal direito de mistura de sub-banda ER. Em algumas realizações, os filtros de plataforma baixa ou filtros de entalhe podem ser usados, ao invés dos filtros de passagem inferior para gerar o canal esquerdo de fala cruzada CL e canal direito de fala cruzada CR
[0041] A passagem 220 gera um canal médio (L+R) ao adicionar o canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER. O canal médio representa os dados de áudio que são comuns para ambos o canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub- banda ER. O canal médio pode ser separado em um canal médio esquerdo ML e um canal médio direito MR. A passagem 220 gera um canal esquerdo de passagem PL e um canal direito de passagem PR. Os canais de passagem representam os sinais de entrada de áudio esquerdos e direitos originais XL e XR, ou o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER gerados a partir dos sinais de entrada de áudio XL e XR pelo divisor de banda de frequência 245.
[0042] O reforçador de alta/baixa frequência 225 gera os canais de baixa frequência LFL e LFR, e canais de alta frequência HFL e HFR a partir do sinal de entrada de áudio X. Os canais de alta e baixa frequência representam os aprimoramentos dependentes de frequência ao sinal de entrada de áudio X. Em algumas realizações, o tipo ou qualidade dos aprimoramentos dependentes de frequência pode ser definido pelo usuário.
[0043] O misturador 230 combina a saida do melhorador espacial de sub-banda 210, o simulador de fala cruzada 215, a passagem 220 e o reforçador de alta/baixa frequência 225 para gerar um sinal de saida de áudio O que inclui o sinal esquerdo de saida OL e sinal direito de saida OU. O sinal esquerdo de saida OL é fornecido ao alto-falante esquerdo 235L e sinal direito de saida OU é fornecido ao alto-falante direito 235R.
[0044] O sinal de saida O gerado pelo misturador 230 é uma combinação ponderada das saidas a partir do melhorador espacial de sub-banda 210, simulador de fala cruzada 215, passagem 220 e reforçador de alta/baixa frequência 225. Por exemplo, o canal esquerdo de saida OL inclui uma combinação do canal espacialmente aprimorado esquerdo YL, canal direito de fala cruzada CR (p.ex., representando o sinal contralateral a partir de um alto-falante direito que seria ouvido pelo ouvido esquerdo via propagação de som transaural), e preferivelmente ainda incluir uma combinação do canal médio esquerdo ML, canal esquerdo de passagem PL, e canais esquerdos de alta e baixa frequência LFL e HFL. 0 canal direito de saida OU inclui uma combinação do canal espacialmente aprimorado direito YR, canal esquerdo de fala cruzada CL (p.ex., representando o sinal contralateral a partir de um alto-falante esquerdo que seria ouvido pelo ouvido direito via a propagação de som transaural), e preferivelmente ainda inclui uma combinação do canal médio direito MR, canal direito de passagem PR, e canais direitos de alta e baixa frequência LFR e HFR. Os pesos relativos da entrada de sinais ao misturador 230 podem ser controlados pelos ganhos aplicados a cada uma das entradas.
[0045] As realizações exemplares detalhadas do melhorador espacial de sub-banda 210, combinador de banda de sub-banda 255, simulador de fala cruzada 215, passagem 220, reforçador de alta/baixa frequência 225 e misturador 230 são mostrados nas FIGS. 3A até 8, e discutidas em maiores detalhes abaixo.
[0046] FIG. 3A ilustra o divisor de banda de frequência 240 do melhorador espacial de sub-banda 210, em conformidade com uma realização. O divisor de banda de frequência 240 dividiu o canal esquerdo de entrada XL em componentes de sub-banda esquerda EL(k) e divide o canal direito de entrada XR nos componentes de sub-banda direita ER(k) para n sub-bandas definidas de frequência k. 0 divisor de banda de frequência 240 inclui um ganho de entrada 302 e uma rede de cruzamento 304. O ganho de entrada 302 recebe o canal esquerdo de entrada XL e o canal direito de entrada XR, e aplica um ganho pré-definido para cada um do canal esquerdo de entrada XL e canal direito de entrada XR. Em algumas realizações, o mesmo ganho é aplicado a cada um dos canais esquerdos e direitos de entrada XL e XR. Em algumas realizações, o ganho de entrada 302 aplica um ganho de -2 dB ao sinal de áudio de entrada X. Em algumas realizações, o ganho de entrada 302 é separado do divisor de banda de frequência 240, ou omitido do sistema 200 de modo que nenhum ganho é aplicado ao sinal de áudio de entrada X.
[0047] A rede de cruzamento 304 recebe o sinal de áudio de entrada X a partir do ganho de entrada 302, e divide o sinal de áudio de entrada X em sinais de sub-banda E (K) . A rede de cruzamento 304 pode usar diversos tipos de filtros dispostos em quaisquer de diversas topologias de circuito, tais como, serial, paralela ou derivada, enquanto as saidas resultants formarem um conjunto de sinais para sub-bandas contiguas. Os tipos exemplares de filtro incluidos na rede de cruzamento 304 podem incluir a resposta de impulso infinito (IIR) ou resposta de impulso finito (FIR) filtros de faixa de passagem, filtros de pico e inclinação de IIR, Linkwitz-Riley ou semelhantes. Os filtros dividem o canal esquerdo de entrada XL nos componentes de sub-banda esquerda EL(k) e dividem o canal direito de entrada XR nos componentes de sub- banda direita ER(k) para cada sub-banda de frequência k. Em uma abordagem, um número de filtros de faixa de passagem, ou quaisquer combinações do filtro de passagem inferior, filtro de faixa de passagem e um filtro de passagem superior, são empregadas para aproximar combinações das bandas criticas do ouvido humano. Uma banda critica corresponde à largura de banda dentro da qual um segundo tom é capaz de mascarar um tom primário existente. Por exemplo, cada uma das sub-bandas de frequência pode corresponder a um grupo de bandas criticas de escala Bark consolidado. Por exemplo, a rede de cruzamento 304 divide o canal esquerdo de entrada XL em quatros componentes de sub-banda esquerda EL(1) até EL(4), correspondente a 0 até 300 Hz (correspondente às bandas de escala Bark 1-3), 300 até 510 Hz (p.ex., bandas de escala Bark 4-5), 510 até 2700 Hz (p.ex., bandas de escala Bark 6- 15), e 2700 Hz até frequência Nyquist (p.ex., escala Bark 7- 24) respectivamente, e semelhantemente divide o canal direito de entrada XR nos componentes de sub-banda direita ER(1) até ER(4), para bandas de frequência correspondentes. O processo de determinar um conjunto consolidado de bandas criticas inclui o uso de um corpus das amostras de áudio a partir de uma ampla variedade de gêneros musicais, e determinar a partir das amostras uma razão de energia de média de longo prazo dos componentes médios para laterais sobre as 24 bandas criticas de escala Bark. As bandas contiguas de frequência com razões semelhantes de média de longo prazo são então agrupadas juntas para formar o conjunto de bandas criticas. Em outras implantações, os filtros separam os canais esquerdos e direitos de entrada em menos ou mais do que quatro sub-bandas. A faixa das bandas de frequência pode ser ajustável. A rede de cruzamento 304 produz um par de componentes de sub-banda esquerda EL(k) e componentes de sub- banda direita ER(k), para k = 1 para n, onde n é o número de sub-bandas (p.ex., n = 4 na FIG. 3A).
[0048] A rede de cruzamento 304 fornece os componentes de sub-banda esquerda EL(1) até EL(n) e componentes de sub-banda direita EL(1) até EL(n) ao melhorador de banda de frequência 245 do melhorador espacial de sub-banda 210. Conforme discutido em maiores detalhes abaixo, os componentes de sub- banda esquerda EL(1) até EL(n) e componentes de sub-banda direita EL(1) até EL(n) também podem ser fornecidos ao simulador de fala cruzada 215, passagem 220 e reforçador de alta/baixa frequência 225.
[0049] FIG. 3B ilustra o melhorador de banda de frequência 245 do melhorador espacial de sub-banda 210, em conformidade com uma realização. O melhorador de banda de frequência 245 gera os componentes espacialmente aprimorados de sub-banda esquerda YL(1) até YL(n) e componentes espacialmente aprimorados de sub-banda direita YR(1) até YR(n) a partir dos componentes de sub-banda esquerda EL(1) até EL(n) e componentes de sub-banda direita EL(1) até EL(n).
[0050] O melhorador de banda de frequência 245 inclui, para cada sub-banda k (onde k = 1 até n), um conversor de L/R para M/S 320(k), um processador médio/lateral 330(k) e um conversor de M/S para L/R 340 (k) . Cada conversor de L/R para M/S 320 (k) recebe um par de componentes aprimorados de sub- banda EL(k) e ER(k), e converte essas entradas em um componente de sub-banda média Em(k) e um componente de sub- banda lateral Es(k). O componente de sub-banda média Em(k) é um componente de sub-banda não espacial que corresponde a uma porção correlacionada entre o componente de sub-banda esquerda EL(k) e o componente de sub-banda direita ER(k), consequentemente, inclui as informações não espaciais. Em algumas realizações, o componente de sub-banda média Em(k) é computado como uma soma dos componentes de sub-banda EL(k) e ER(k). O componente de sub-banda lateral Es (k) é um componente de sub-banda não espacial que corresponde a uma porção não correlacionada entre o componente de sub-banda esquerda EL(k) e o componente de sub-banda direita ER(k), consequentemente, inclui as informações espaciais. Em algumas realizações, o componente de sub-banda lateral Es (k) é computado como uma diferença entre o componente de sub-banda esquerda EL(k) e o componente de sub-banda direita ER(k). Em um exemplo, o conversor de L/R para M/S 320 obtém o componente de sub-banda não espacial Em(k) e o componente de sub-banda espacial Es (k) e da sub-banda de frequência k de acordo com as seguintes equações: Em(k)= EL(k) + ER(k) Eq. (1) Es(k)= EL(k) - ER(k) Eq. (2)
[0051] Para cada sub-banda k, um processador médio/lateral 330 (k) ajusta o componente recebido de sub-banda lateral Es (k) para gerar um componente de sub-banda lateral especial aprimorado Ys (k), e ajusta o componente recebido de sub-banda média Em(k) para gerar o componente aprimorado de sub-banda média Ym(k). Em uma realização, o processador médio/lateral 330 (k) ajusta o componente de sub-banda média Em(k) por um coeficiente de ganho correspondente Gm(k), e atrasa o componente amplificado de sub-banda não espacial Gm(k)*Em(k) por uma função de atraso correspondente Dm para gerar um componente aprimorado de sub-banda média Ym(k) . Semelhantemente, o processador médio/lateral 330(k) ajusta o componente recebido de sub-banda lateral Es (k) por um coeficiente de ganho correspondente Gs (k), e atrasa o componente amplificado de sub-banda espacial Gs (k)*XS (k) por uma função de atraso correspondente Ds para gerar um componente aprimorado de sub-banda lateral Ys(k). Os coeficientes de ganho e quantia de atraso podem ser ajustáveis. Os coeficientes de ganho e quantia de atraso podem ser determinados de acordo com os parâmetros de alto- falante ou podem ser fixados para um conjunto presumido dos valores de parâmetro. O processador médio/lateral 430(k) de uma sub-banda de frequência k gera o componente aprimorado de sub-banda média Ym(k) e componente aprimorado de sub-banda lateral Ym(k) de acordo com as seguintes equações: Ym(k)= Gm(k)*Dm(Em(k), k) Eq. (3) Ys(k)= Gs(k)*Ds(Es(k) , k) Eq. (4)
[0052] Cada processador médio/lateral 330 (k) produz o componente de sub-banda médio (não espacial) Ym(k) e o componente de sub-banda lateral (espacial) Ys (k) a um conversor de M/S para L/R correspondente 340(k) da respectiva sub-banda de frequência k. Os exemplos dos coeficientes de ganho e atraso estão listados na seguinte Tabela 1. Tabela 1- Configurações exemplares dos processadores médios/laterais.
Figure img0001
[0053] Em algumas realizações, o processador médio/lateral 330 (1) para a sub-banda de 0 até 300 Hz aplica um ganho de 0,5 dB ao componente de sub-banda média Em(l) e um ganho de 4.5 dB ao componente de sub-banda lateral Es(l). O processador médio/lateral 330(2) para a sub-banda de 300 até 510 Hz aplica um ganho de 0 dB ao componente de sub-banda média Em(2) e um ganho de 4 dB ao componente de sub-banda lateral Es(2). O processador médio/lateral 330(3) para a sub- banda de 510 até 2700 Hz aplica um ganho de 0,5 dB ao componente de sub-banda média Em(3) e um ganho de 4,5 dB ao componente de sub-banda lateral Es(3). O processador médio/lateral 330(4) para a sub-banda de frequência de 2700 Hz até Nyquist aplica um ganho de 0 dB ao componente de sub- banda média Em(4) e um ganho de 4 dB ao componente de sub- banda lateral Es(3).
[0054] Cada conversor de M/S para L/R 340(k) recebe um componente aprimorado de sub-banda médio Ym(k) e um componente aprimorado de sub-banda lateral Ys(k) , e converte- os a um componente aprimorado de sub-banda esquerda YL(k) e um componente aprimorado de sub-banda direita YR(k). Se o conversor de L/R para M/S 320 (k) gerar o componente de sub- banda média Em(k) e o componente de sub-banda lateral Es(k) de acordo com a Eq. (1) e Eq. (2) acima, o conversor de M/S para L/R 340(k) gera o componente aprimorado de sub-banda esquerda YL(k) e componente aprimorado de sub-banda direita YR(k) da sub-banda de frequência k de acordo com as seguintes equações: Y L(k)=(Ym(k)+YS(k))/2 Eq. (5) Y R(k)= (Ym(k)-Ys(k) ) /2 Eq. (6)
[0055] Em alguma realização, EL(k) e ER(k) na Eq. (1) e Eq. (2) podem ser trocados, caso em que YL(k) e YR(k) na Eq. (5) e Eq. (6) também são trocados.
[0056] FIG. 3C ilustra o combinador aprimorado de sub-banda 250 do melhorador espacial de sub-banda 210, em conformidade com uma realização. O combinador aprimorado de sub-banda 250 combina os componentes aprimorados de sub-banda esquerda YL(1) até YL(n) (das bandas de frequência k = 1 até n) a partir do conversores de M/S para L/R 340(1) até 340 (n) para gerar o canal de áudio espacialmente aprimorado esquerdo YL, e combinar os componentes aprimorados de sub-banda direita YR(1) até YL(n) (das bandas de frequência k = 1 até n) a partir do conversores de M/S para L/R 340(1) até 340 (n) para gerar o canal direito de áudio espacialmente aprimorado YR. O combinador aprimorado de sub-banda 250 pode incluir uma soma esquerda 352 que combina os componentes aprimorados de sub- banda esquerda YL(k), uma soma direita 354 que combina os componentes aprimorados de sub-banda direita YR(k), e um ganho de sub-banda 34 6 que aplica os ganhos à saida da soma esquerda 352 e soma direita 354. Em algumas realizações, o ganho de sub-banda 35 6 aplica um ganho de 0 dB. Em algumas realizações, a soma esquerda combina os componentes aprimorados de sub-banda esquerda YL(k) e soma direita 354 combina os componentes aprimorados de sub-banda direita YR(k) de acordo com as seguintes equações: Y L=ZYL(k), para k = 1 até n Eq. (7) Y R= £YR(k), para k = 1 até n Eq. (8)
[0057] Em algumas realizações, o combinador aprimorado de sub-banda 250 combina os componentes de componente de sub- banda de sub-banda médias Ym(k) e os componentes de sub-banda lateral Ys(k) para gerar um componente combinado de sub-banda média Ym e um componente combinado de sub-banda lateral Ys, e então uma única conversão de M/S para L/R é aplicada por canal para gerar YL e YR a partir de Ym e Ys. Os ganhos médios/laterais são aplicados por sub-banda, e podem ser recombinados de diversos modos.
[0058] FIG. 4 ilustra o combinador de sub-banda 255 do sistema de processamento de áudio 200, em conformidade com uma realização. O combinador de sub-banda 255 inclui uma soma esquerda 402 e uma soma direita 404. A soma esquerda 402 converte os componentes de sub-banda esquerda EL(1) até EL(n) saida a partir do divisor de banda de frequência 240 em um canal esquerdo de mistura de sub-banda EL. A soma direita 404 combina os componentes de sub-banda direita ER(1) até ER(n) saida a partir do divisor de banda de frequência 240 em um canal direito de mistura de sub-banda ER. O combinador de sub-banda 255 fornece o canal esquerdo de mistura de sub- banda EL e o canal direito de mistura de sub-banda ER ao simulador de fala cruzada 215, passagem 220 e reforçador de alta/baixa frequência 225. Em algumas realizações, os canais de entrada de áudio original XL e XR são fornecidos ao simulador de fala cruzada 215, passagem 220 e reforçador de alta/baixa frequência 225 ao invés dos canais de mistura de sub-banda esquerdos e direitos EL e ER. Aqui, o combinador de sub-banda 255 pode ser omitido a partir do sistema 200. Em outro exemplo, o combinador de sub-banda 255 pode decodificar o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ERa partir do divisor de banda de frequência 240 nos canais originais de entrada XL e XR. Em algumas realizações, o combinador de sub-banda 255 é integrado ao simulador de fala cruzada 215, ou algum outro componente do sistema 200.
[0059] FIG. 5 ilustra o simulador de fala cruzada 215 do sistema de processamento de áudio 200, em conformidade com uma realização. 0 simulador de fala cruzada gera um canal esquerdo de fala cruzada CL e um canal direito de fala cruzada CR a partir do canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER. O canal esquerdo de fala cruzada CL e canal direito de fala cruzada CR, quando misturados com o sinal de saida final O, incorporam a propagação de onda de som transaural simulada através da cabeça do ouvinte no sinal de saida O. Por exemplo, o canal esquerdo de fala cruzada CL representa um componente de som contralateral que pode ser misturado (p.ex., pelo misturador 230) com um componente direito de som ipsilateral (p.ex., o canal espacialmente aprimorado direito YR) para gerar o canal direito de saida OU. O canal direito de fala cruzada CR representa um componente de som contralateral que pode ser misturado com um componente esquerdo de som ipsilateral (p.ex., o canal espacialmente aprimorado direito YL) para gerar o canal esquerdo de saida OL.
[0060] O simulador de fala cruzada 215 gera os componentes de som contralateral para saída aos alto-falantes montados na cabeça 235L e 235R, assim fornecendo uma experiência de audição semelhante ao alto-falante nos alto-falantes montados na cabeça 235L e 235R. Com referência à FIG. 5, o simulador de fala cruzada 215 inclui um filtro de passagem inferior de sombra de cabeça 502 e um atraso de fala cruzada 504 para processar o canal esquerdo de mistura de sub-banda EL, um filtro de passagem inferior de sombra de cabeça 506 e um atraso de fala cruzada 508 para processar o canal direito de mistura de sub-banda ER, e um ganho de sombra de cabeça 510 até aplicar os ganhos à saída do atraso de fala cruzada 504 e atraso de fala cruzada 508. O filtro de passagem inferior de sombra de cabeça 502 recebe o canal esquerdo de mistura de sub-banda EL e aplica uma modulação que modela a resposta de frequência do sinal após passar através da cabeça do ouvinte. A saída do filtro de passagem inferior de sombra de cabeça 502 é fornecida ao atraso de fala cruzada 504, que aplica um atraso de tempo à saída do filtro de passagem inferior de sombra de cabeça 502. O atraso de tempo representa a distância transaural que é atravessada por um componente de som contralateral relativo a um componente de som ipsilateral. A resposta de frequência pode ser gerada com base em experimentos empíricos para determinar as características dependentes de frequência da modulação de onda de som pela cabeça do ouvinte. Ver, p.ex., J. F. Yu, Y. S. Chen, "The Head Shadow Phenomenon Affected by Sound Source: In Vitro Measurement", Applied Mechanics and Materials, Vols. 284-287, pp. 1715-1720, 2013; Areti Andreopoulou, Agnieszka Roginska, Hariharan Mohanraj, "Analysis of the Spectral Variations in Repeated Head-Related Transfer Function Measurements," Proceedings of the 19th International Conference on Auditory Display (ICAD2013). Lodz, Poland. 6-9 July 2013. International Community for Auditory Display, 2013. Por exemplo, e com referência à FIG. 1, o componente de som contralateral 112Lque se propaga ao ouvido direito 125Rpode ser derivado a partir do componente de som ipsilateral 118L que se propaga ao ouvido esquerdo 125L por filtragem do componente de som ipsilateral 118L com uma resposta de frequência que representa a modulação de onda de som a partir da propagação transaural, e um atraso de tempo que modela a distância que o componente de som contralateral 112L percorre (relativa ao componente de som ipsilateral 118R) para atingir o ouvido direito 125R. Em algumas realizações, o atraso de fala cruzada 504 é aplicado antes do filtro de passagem inferior de sombra de cabeça 502.
[0061] Semelhantemente para o canal direito de mistura de sub-banda ER, o filtro de passagem inferior de sombra de cabeça 506 recebe o canal direito de mistura de sub-banda ER e aplica uma modulação que modela a resposta de frequência da cabeça do ouvinte. A saida do filtro de passagem inferior de sombra de cabeça 506 é fornecida ao atraso de fala cruzada 508, que aplica um atraso de tempo à saída do filtro de passagem inferior de sombra de cabeça 504. Em algumas realizações, o atraso de fala cruzada 508 é aplicado antes do filtro de passagem inferior de sombra de cabeça 506.
[0062] O ganho de sombra de cabeça 510 aplica um ganho à saida do atraso de fala cruzada 504 para gerar o canal esquerdo de fala cruzada CL, e aplica um ganho à saída do atraso de fala cruzada 506 para gerar o canal direito de fala cruzada CR.
[0063] Em algumas realizações, os filtros de passagem inferior de sombra de cabeça 502 e 506 têm uma frequência de corte de 2.023 Hz. Os atrasos de fala cruzada 504 e 508 aplicam um atraso de 0,792 milissegundo. O ganho de sombra de cabeça 510 aplica um ganho de -14,4 dB.
[0064] FIG. 6 ilustra a passagem 220 do sistema de processamento de áudio 200, em conformidade com uma realização. A passagem 220 gera um canal médio (L+R) M e um canal de passagem P a partir do sinal de entrada de áudio X. Por exemplo, a passagem 220 gera um canal médio esquerdo ML e um canal médio direito MR a partir do canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub- banda ER, e gera um canal esquerdo de passagem PL e um canal direito de passagem PR a partir do canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER.
[0065] A passagem 220 inclui um combinador de L+R 602, um ganho de passagem de L+R 604 e um ganho de passagem de L/R 606. O combinador de L+R 602 recebe o canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub- banda ER, e adiciona o canal esquerdo de mistura de sub-banda EL com o canal direito de mistura de sub-banda ER para gerar os dados de áudio que são comuns para ambos o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER. O ganho de passagem de L+R 604 adiciona um ganho à saida do combinador de L+R 602 para gerar o canal médio esquerdo ML e canal médio direito MR. Os canais médios ML e MR representam os dados de áudio que são comuns para ambos o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER. Em algumas realizações, o canal médio esquerdo ML é o mesmo que o canal médio direito MR. Em outro exemplo, o ganho de passagem de L+R 604 aplica diferentes ganhos ao canal médio para gerar um diferente canal médio esquerdo ML e canal médio direito MR.
[0066] O ganho de passagem de L/R 606 recebe o canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub- banda ER,e adiciona um ganho ao canal esquerdo de mistura de sub-banda EL para gerar o canal esquerdo de passagem PL, e adiciona um ganho ao canal direito de mistura de sub-banda ER para gerar o canal direito de passagem PR. Em algumas realizações, um primeiro ganho é aplicado ao canal esquerdo de mistura de sub-banda EL para gerar o canal esquerdo de passagem PL e um segundo ganho é aplicado ao canal direito de mistura de sub-banda ER para gerar o canal direito de passagem PR, onde os primeiros e segundos ganhos são diferentes. Em algumas realizações, os primeiros e segundos ganhos são iguais.
[0067] Em algumas realizações, a passagem 220 recebe e processa os sinais originais de entrada de áudio XL e XR. Aqui, o canal médio M representa os dados de áudio que são comuns para ambos o sinal esquerdo e direito de entrada XL e XR, e o canal de passagem P representa o sinal original de áudio X (p.ex., sem codificar em sub-bandas de frequência pelo divisor de banda de frequência 240, e recombinação pelo combinador de banda de sub-banda 255 no canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub- banda ER) .
[0068] Em algumas realizações, o ganho de passagem de L+R 604 aplica um ganho de -18 dB à saida do combinador de L+R 602. 0 ganho de passagem de L/R 606 aplica um ganho de -infinito dB ao canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER.
[0069] FIG. 7 ilustra o reforçador de alta/baixa frequência 225 do sistema de processamento de áudio 200, em conformidade com uma realização. O reforçador de alta/baixa frequência 225 gera os canais de baixa frequência LFL e LFR, e canais de alta frequência HFL e HFRa partir do canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub- banda ER. OScanais de alta e baixa frequência representam os aprimoramentos dependentes de frequência ao sinal de entrada de áudio X.
[0070] O reforçador de alta/baixa frequência 225 inclui um primeiro filtro de passagem de banda de aprimoramento de baixa frequência (LF) 702, um segundo filtro de passagem de banda de aprimoramento de LF 704, um ganho de filtro de LF 705, um filtro de passagem alta de aprimoramento de alta frequência (HF) 708 e um ganho de filtro de HF 710. O filtro de passagem de banda de aprimoramento de LF 702 recebe o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER, e aplica uma modulação que atenua os componentes de sinal fora de uma banda ou dispersão de frequências, assim permitindo a passagem dos componentes de sinal (p.ex., baixa frequência) dentro da banda de frequências. O filtro de passagem de banda de aprimoramento de LF 7 04 recebe a saida do filtro de passagem de banda de aprimoramento de LF 704, e aplica outra modulação que atenua os componentes de sinal fora da banda de frequências.
[0071] O filtro de passagem de banda de aprimoramento de LF 702 e filtro de passagem de banda de aprimoramento de LF 704 fornecem um ressonador em cascata para aprimoramento de baixa frequência. Em algumas realizações, os filtros de passagem de banda de aprimoramento de LF 702 e 704 têm uma frequência de centro de 58.175 Hz com um fator ajustável de qualidade (Q) . O fator Q pode ser ajustado com base no ajuste de usuário ou configuração programática. Por exemplo, um ajuste padrão pode incluir um fator Q de 2,5, enquanto um ajuste mais agressivo pode incluir um fator Q de 1,3. Os ressonadores são configurados para exibir uma resposta com menos amortecimento (Q>0,5) para aprimorar o envelope temporal do conteúdo de baixa frequência.
[0072] O ganho de filtro de LF 706 aplica um ganho à saida do filtro de passagem de banda de aprimoramento de LF 7 04 para gerar o canal de LF esquerdo LFL e canal de LF direito LFR. Em algumas realizações, o ganho de filtro de LF 706 aplica um ganho de 12 dB à saida do filtro de passagem de banda de aprimoramento de LF 704.
[0073] O filtro de passagem alta de aprimoramento de HF 708 recebe o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER, e aplica uma modulação que atenua os componentes de sinal com frequências inferiores do que uma frequência de corte, assim permitindo a passagem dos componentes de sinal com frequências superiores à frequência de corte. Em algumas realizações, o filtro de passagem alta de aprimoramento de HF 708 é um filtro de passagem alta de Butterworth de segunda ordem com uma frequência de corte de 4573 Hz.
[0074] O ganho de filtro de HF 710 aplica um ganho à saída do filtro de passagem alta de aprimoramento de HF 704 para gerar o canal de HF esquerdo HFL e canal de HF direito HFR. Em algumas realizações, o ganho de filtro de HF 710 aplica um ganho de 0 dB à saída do filtro de passagem alta de aprimoramento de HF 708.
[0075] FIG. 8 ilustra o misturador 230 do sistema de processamento de áudio 200, em conformidade com uma realização. O misturador 230 gera os canais de saida OL e OU com base nas combinações ponderadas das saidas a partir do melhorador espacial de sub-banda 210, simulador de fala cruzada 215, passagem 220 e reforçador de alta/baixa frequência 225. O misturador 230 fornece o canal esquerdo de saida OL ao alto-falante esquerdo 235L e sinal direito de saida OU ao alto-falante direito 235R
[0076] O misturador 230 inclui uma soma esquerda 802, uma soma direita 804 e um ganho de saida 806. A soma esquerda 802 recebe o canal espacialmente aprimorado esquerdo YL a partir do melhorador espacial de sub-banda 210, o canal direito de fala cruzada CR a partir do simulador de fala cruzada 215, o canal médio esquerdo ML e o canal esquerdo de passagem PL a partir da passagem 220, e os canais esquerdos de alta e baixa frequência LFL e HFL a partir do reforçador de alta/baixa frequência 225, e a soma esquerda 802 combina esses canais. Semelhantemente, a soma direita 804 recebe o canal espacialmente aprimorado esquerdo YRa partir do melhorador espacial de sub-banda 210, o canal esquerdo de fala cruzada CL a partir do simulador de fala cruzada 215, o canal médio direito MR e o canal direito de passagem PR a partir da passagem 220, e os canais direitos de alta e baixa frequência LFR e HFR a partir do reforçador de alta/baixa frequência 225, e a soma direita 804 combina esses canais.
[0077] O ganho de saida 806 aplica um ganho à saida da soma esquerda 802 para gerar o canal esquerdo de saida OL, θ aplica um ganho à saida da soma direita 804 para gerar o canal direito de saida OU. Em algumas realizações, o ganho de saida 806 aplica um ganho de 0 dB à saida da soma esquerda 802 e soma direita 804. Em algumas realizações, o ganho de sub-banda 356, o ganho de sombra de cabeça 510, o ganho de passagem de L+R 604, o ganho de passagem de L/R 606, o ganho de filtro de LF 706 e/ou o ganho de filtro de HF 710 são integrados com o misturador 230. Aqui, o misturador 230 controla as pesagens relativas da contribuição do canal de entrada aos canais de saida OL e OU.
[0078] FIG. 9 ilustra um método 900 de otimizar um sinal de áudio para alto-falantes montados na cabeça, em conformidade com uma realização. O sistema de processamento de áudio 200 pode realizar as etapas em paralelo, realizar as etapas em ordens diferentes ou realizar diferentes etapas.
[0079] O sistema 200 recebe 905 um sinal de áudio de entrada X compreendendo um canal esquerdo de entrada XL e um canal direito de entrada XR. O sinal de entrada de áudio X pode ser um sinal estéreo onde os canais esquerdos e direitos de entrada XL e XR são diferentes entre si.
[0080] O sistema 200, tal como, o melhorador espacial de sub- banda 210, gera 910 um canal espacialmente aprimorado esquerdo YL e um canal espacialmente aprimorado direito YR a partir do ajuste de ganho dos componentes de sub-banda lateral e componentes de sub-banda média dos canais esquerdos e direitos de entrada XL e XR. Os canais espacialmente aprimorados esquerdos e direitos YL e YR melhoram o sentido espacial no campo de som ao alterar as razões de intensidade entre os componentes médios e laterais de sub-banda derivados a partir dos canais esquerdos e direitos de entrada XL e XR, conforme discutido em maiores detalhes abaixo com relação à FIG. 10.
[0081] O sistema 200, tal como, o simulador de fala cruzada 215, gera 915 um canal esquerdo de fala cruzada CL a partir da filtragem e atraso de tempo do canal esquerdo de entrada XL, e um canal direito de fala cruzada CR a partir da filtragem e atraso de tempo do canal direito de entrada XR. Os canais de fala cruzada CL e CR simulam a fala cruzada contralateral transaural para o canal esquerdo de entrada XL e o canal direito de entrada XR que atingiriam o ouvinte se o canal esquerdo de entrada XL e o canal direito de entrada XR fossem produzidos a partir dos alto-falantes, tal como mostrado na FIG. 1. Gerar os canais de fala cruzada é discutido em maiores detalhes abaixo com relação à FIG. 11.
[0082] O sistema 200, tal como, a passagem 220, gera 920 um canal esquerdo de passagem PL a partir do canal esquerdo de entrada XL, um canal direito de passagem PR a partir do canal direito de entrada XR. O sistema 200, tal como, a passagem 220, gera 925 canais esquerdos e direitos médios ML e MR de combinar o canal esquerdo de entrada XL e o canal direito de entrada XR. Os canais de passagem podem ser usados para controlar as contribuições relativas do canal de entrada não processado X ao canal de saida O, e os canais médios podem ser usados para controlar a contribuição relativa dos dados comuns de áudio do canal esquerdo de entrada XL e canal direito de entrada XR. Gerar a passagem e canais médios é discutido em maiores detalhes abaixo com relação à FIG. 12.
[0083] O sistema 200, tal como, o reforçador de alta/baixa frequência 225 gera 930 os canais esquerdos e direitos de baixa frequência LFL e LFR de aplicar um ressonador em cascata ao canal esquerdo de entrada XL e canal direito de entrada XR. The canais de baixa frequência LFL e LFR controlam o aprimoramento relativo dos componentes de áudio de baixa frequência do canal de entrada X ao canal de saida O.
[0084] O sistema 200, tal como, o reforçador de alta/baixa frequência 255 gera 935 canais esquerdos e direitos de alta frequência HFL e HFR de aplicar um filtro de passagem alta ao canal esquerdo de entrada XL e canal direito de entrada XR. Os canais de alta frequência HFL e HFR controlam o aprimoramento relativo dos componentes de áudio de alta frequência do canal de entrada X ao canal de saida O. Gerar os canais de LF e HF é discutido em maiores detalhes abaixo com relação à FIG. 13.
[0085] O sistema 200, tal como, o misturador 230, gera 940 o canal de saida OL e o canal de saida OU. O canal de saida OL pode ser fornecido a um alto-falante montado na cabeça esquerdo 235L e o canal direito de saida OU é fornecido a um alto-falante direito 235R. O canal de saida OL é gerado a partir de uma combinação ponderada do canal espacialmente aprimorado esquerdo YL a partir do melhorador espacial de sub-banda 210, o canal direito de fala cruzada CR a partir do simulador de fala cruzada 215, o canal médio esquerdo ML e o canal esquerdo de passagem PL a partir da passagem 220, e os canais esquerdos de alta e baixa frequência LFL e HFL a partir do reforçador de alta/baixa frequência 225. O canal de saida OU é gerado a partir de uma combinação ponderada, o canal espacialmente aprimorado esquerdo YR a partir do melhorador espacial de sub-banda 210, o canal esquerdo de fala cruzada CL a partir do simulador de fala cruzada 215, o canal médio direito MR e o canal direito de passagem PR a partir da passagem 220, e os canais direitos de alta e baixa frequência LFR e HFRa partir do reforçador de alta/baixa frequência 225.
[0086] As pesagens relativas das entradas ao misturador 230 podem ser controladas pelos filtros de ganho nas fontes de canal conforme acima discutido, tal como, o ganho de entrada 302, o ganho de sub-banda 356, o ganho de sombra de cabeça 510, o ganho de passagem de L+R 604, o ganho de passagem de L/R 606, o ganho de filtro de LF 706 e o ganho de filtro de HF 710. Por exemplo, um filtro de ganho pode reduzir uma amplitude de sinal de um canal para reduzir a contribuição do canal ao canal de saida O, ou aumentar a amplitude de sinal para aumentar a contribuição do canal ao canal de saida 0. Em algumas realizações, as amplitudes de sinal de um ou mais canais podem ser definidas para 0 ou substancialmente 0, resultando em nenhuma contribuição de um ou mais canais ao canal de saida O.
[0087] Em algumas realizações, o ganho de sub-banda 356 aplica entre um ganho de -12 até 6 dB, o ganho de sombra de cabeça 510 aplica um ganho de -infinito até 0 dB, o ganho de filtro de LF 706 aplica um ganho de 0 até 20 dB, o ganho de filtro de HF 710 aplica um ganho de 0 até 20 dB, o ganho de passagem de L/R 606 aplica um ganho de -infinito até 0 dB, e o ganho de passagem de L+R 604 aplica um ganho de -infinito até 0 dB. Os valores relativos dos ganhos podem ser ajustáveis para fornecer diferentes afinações. Em algumas realizações, o sistema de processamento de áudio usa conjuntos pré-definidos dos valores de ganho. Por exemplo, o ganho de sub-banda 35 6 aplica o ganho de 0 dB, o ganho de sombra de cabeça 510 aplica um ganho de -14,4 dB, o ganho de filtro de LF 70 6 aplica entre um ganho de 12 dB, o ganho de filtro de HF 710 aplica um ganho de 0 dB, o ganho de passagem de L/R 606 aplica o ganho de -infinito dB, e o ganho de passagem de L+R 604 aplica um ganho de -18 dB.
[0088] Conforme acima discutido, as etapas no método 900 podem ser realizadas em diferentes ordens. Em um exemplo, as etapas 910 até 935 são realizadas em paralelo, de modo que os canais de entrada Y, C, M, LF e HF estão disponíveis ao misturador 230 substancialmente no mesmo tempo para combinação.
[0089] FIG. 10 ilustra um método 1000 de gerar os canais espacialmente aprimorados YL e YR a partir de um sinal de áudio de entrada X, em conformidade com uma realização. 0 método 1000 pode ser realizado em 910 do método 900, tal como, pelo melhorador espacial de sub-banda 210 do sistema 200.
[0090] O melhorador espacial de sub-banda 210, tal como, a rede de cruzamento 304 do divisor de banda de frequência 240, separa 1010 o canal de entrada XL nos canais de sub-banda de mistura de sub-banda EL(1) até EL(n), e separa o canal de entrada XR nos canais de sub-banda de mistura de sub-banda ER(1) até ER(n). N é um número pré-definido dos canais de sub-banda, e, em algumas realizações, é quatro canais de sub- banda correspondentes a 0 até 300 Hz, 300 até 510 Hz, 510 até 2700 Hz, e 2700 Hz até Frequência Nyquist, respectivamente. Conforme acima discutido, os n canais de sub-banda aproximam as bandas criticas do ouvido humano. Os n canais de sub-banda são um conjunto de bandas críticas consolidadas determinadas ao usar um corpus das amostras de áudio a partir de uma ampla variedade of gêneros musicais, e determinar a partir das amostras uma razão de energia de média de longo prazo dos componentes médios para laterais sobre 24 bandas criticas de escala Bark. As bandas contiguas de frequência com razões semelhantes de média de longo prazo são então agrupadas juntas para formar o conjunto de n bandas criticas.
[0091] O melhorador espacial de sub-banda 210, tal como, os conversores de L/R para M/S 320 (k) do melhorador de banda de frequência 245, gera 1020 componente de sub-banda espacial Es(k) e componente de sub-banda não espacial Em(k) para cada sub-banda k (onde k = 1 até n) . Por exemplo, cada conversor de L/R para M/S 320 (k) recebe um par de componentes de sub- banda de mistura de sub-banda EL(k) e ER(k), e converte essas entradas em um componente de sub-banda média Em(k) e um componente de sub-banda lateral Es(k) de acordo com as Eqs. (1) e (2) acima discutidas. Para n = 4, os conversores de L/R para M/S 320(1) até 320(4) geram os componentes de sub-banda espacial Es(l), Es(2), Es(3) e Es(4), e componente de sub- banda não espacial Em(l), Em(2), Em(3), e Em(4).
[0092] O melhorador espacial de sub-banda 210, tal como, os processadores médios/laterais 330 (k) do melhorador de banda de frequência 245, gera 1030 um componente aprimorado de sub- banda espacial Ys(k) e um componente aprimorado de sub-banda não espacial Ym(k) para cada sub-banda k. Por exemplo, cada um dos processadores médios/laterais 330(k) converte um componente de sub-banda média Em(k) em um componente aprimorado de sub-banda espacial Ym(k) ao aplicar um ganho Gm(k) e uma função de atraso D de acordo com a Eq. (3). Cada um dos processadores médios/laterais 330 (k) converte um componente de sub-banda lateral Es (k) em um componente aprimorado de sub-banda espacial Ys(k) ao aplicar um ganho Gs(k) e uma função de atraso D de acordo com a Eq. (4).
[0093] Em algumas realizações, os valores dos ganhos Gm(k) e Gs(k) para cada sub-banda k são inicialmente determinados com base na razão de energia de média de longo prazo de amostragem dos componentes médios para laterais sobre a sub- banda k a partir de um corpus das amostras de áudio, tal como, a partir de uma ampla variedade de gêneros musicais. Em algumas realizações, as amostras de áudio podem incluir diferentes tipos de conteúdo de áudio, ais como, filmes, filmes e jogos. Em outro exemplo, a amostragem pode ser realizada usando as amostras de áudio conhecidas por incluir as propriedades espaciais desejadas. Essas razões de energia média para lateral são usadas como um ponto de partida ao calcular os ganhos de Gm e Gs para o componente de sub-banda média Ym(k) e componente aprimorado de sub-banda lateral Ys (k). Os ganhos finais de sub-banda são então definidos por meio de testes de audição subjetivos de perito em um amplo corpo de amostras de áudio, conforme acima descrito. Em algumas realizações, os ganhos Gm e Gs, e atrasos Dm e Ds, podem ser determinados de acordo com os parâmetros de alto- falante ou podem ser fixados para um conjunto presumido dos valores de parâmetro.
[0094] O melhorador espacial de sub-banda 210, tal como, os conversores de M/S para L/R 340 (k) do melhorador de banda de frequência 245, gera 1040 um componente espacialmente aprimorado de sub-banda esquerda YL(k) e um componente espacialmente aprimorado de sub-banda direita YR(k) para cada sub-banda k. Cada conversor de M/S para L/R 340 (k) recebe um componente aprimorado médio Ym(k) e um componente aprimorado lateral Ys (k), e converte-os ao componente espacialmente aprimorado de sub-banda esquerda YL(k) e component espacialmente aprimorado de sub-banda direita YR(k), tal como, de acordo com as Eqs. (5) e (6) . Aqui, o component espacialmente aprimorado de sub-banda esquerda YL(k) é gerado com base em adicionar o componente aprimorado médio Ym(k) e o componente aprimorado lateral Ys (k), e o componente espacialmente aprimorado de sub-banda direita YR(k) é gerado com base em subtrair o componente aprimorado lateral Ys (k) do componente aprimorado médio Ym(k). Para n = 4 sub-bandas, os conversores de M/S para L/R 340 (1) até 340 (4) geram os componentes aprimorados de sub-banda esquerda YL(1) até YL(4), e componente aprimorado de sub-banda direita YR (1) até YR(4) .
[0095] O melhorador espacial de sub-banda 210, tal como, o combinador aprimorado de sub-banda 250, gera 1050 um canal espacialmente aprimorado esquerdo YL ao combinar os componentes aprimorados de sub-banda esquerda YL(1) até YL(n), e um canal espacialmente aprimorado direito YR ao combinar os componentes aprimorados de sub-banda direita YR(1) até YR(n). As combinações podem ser realizadas com base nas Eqs. 5 e 6 conforme acima discutido. Em algumas realizações, o combinador aprimorado de sub-banda 250 pode ainda aplicar um ganho de sub-banda ao canal espacialmente aprimorado esquerdo YL e canal espacialmente aprimorado esquerdo YR que controlam a contribuição do canal espacialmente aprimorado esquerdo YL ao canal esquerdo de saida OL, e a contribuição do canal espacialmente aprimorado direito YR ao canal direito de saida OU. Em algumas realizações, o ganho de sub-banda é um ganho de 0 dB para servir como um nivel basal, com os outros ganhos aqui discutidos sendo definidos relativos ao ganho de 0 dB. Em algumas realizações, tal como, quando o ganho de entrada 302 é diferente do ganho de -2 dB, o ganho de sub-banda pode ser ajustado de modo correspondente (p.ex., para atingir um nivel basal desejado para o canal espacialmente aprimorado esquerdo YL e canal espacialmente aprimorado esquerdo YR) .
[0096] Em diversas realizações, as etapas no método 1000 podem ser realizadas em diferentes ordens. Por exemplo, os componentes aprimorados de sub-banda espacial Ys(k) para as sub-bandas k=l até n podem ser combinados para gerar Ys, e o componente aprimorado de sub-banda não espacial Ym(k) para as sub-bandas k=l até n pode ser combinado para gerar Ym. Ys e Ym podem ser convertidos nos canais espacialmente aprimorados YL e YR usando a conversão de M/S para L/R.
[0097] FIG. 11 ilustra um método 1100 de gerar os canais de fala cruzada a partir do sinal de entrada de áudio, em conformidade com uma realização. O método 1100 pode ser realizado em 915 do método 900. Os canais de fala cruzada CL e CR, que representam os sinais contralaterais de fala cruzada, são gerados com base em aplicar um filtro e um atraso de tempo aos canais ipsilaterais de entrada XL e XR.
[0098] O combinador de banda de sub-banda 255 do sistema 200 gera 1110 um canal esquerdo de mistura de sub-banda EL ao combinar os canais de sub-banda de mistura de sub-banda EL(1) até EL(n), e um canal direito de mistura de sub-banda ER ao combinar os canais de sub-banda de mistura de sub-banda ER(1) até ER(n) . O canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER são usados como entradas para o simulador de fala cruzada 215, passagem 220 e/ou reforçador de alta/baixa frequência 225. Em algumas realizações, o simulador de fala cruzada 215, a passagem 220 e/ou o reforçador de alta/baixa frequência 225 podem receber e processar os canais de entrada de áudio original XL e XR ao invés dos canais de mistura de sub-banda EL e ER. Aqui, a etapa 1100 não é realizada, e as etapas subsequentes de processamento do método 1100 são realizadas usando os canais de entrada de áudio XL e XR. Em algumas realizações, o combinador de banda de sub-banda 255 decodifica os canais de sub-banda esquerdos de mistura de sub-banda EL(1) até EL(n) no canal esquerdo de entrada XL, e decodifica os canais de sub-banda direitos de mistura de sub-banda ER(1) até ER(n) no canal direito de entrada XR.
[0099] O simulador de fala cruzada 215 do sistema 200 aplica 1120 um primeiro filtro de passagem inferior ao canal esquerdo de mistura de sub-banda EL. O primeiro filtro de passagem inferior pode ser o filtro de passagem inferior de sombra de cabeça 502 do simulador de fala cruzada 215, que aplica uma modulação que modela a resposta de frequência do sinal após passar através da cabeça do ouvinte. Conforme acima discutido, o filtro de passagem inferior de sombra de cabeça 502 pode ter uma frequência de corte de 2.023 Hz, onde os componentes de frequência do canal esquerdo de mistura de sub-banda EL que excedem a frequência de corte são atenuados. Outras realizações do simulador de fala cruzada 215 do sistema 200 podem empregar um filtro de plataforma baixa ou entalhe para o filtro de passagem inferior de sombra de cabeça. Esse filtro pode ter uma frequência de corte/centro de 2023 Hz, com um Q entre 0,5 e 1,0 e um ganho entre -6 e - 24 dB.
[00100] O simulador de fala cruzada 215 aplica 1130 um primeiro atraso de fala cruzada à saida do primeiro filtro de passagem inferior. Por exemplo, o atraso cruzado 504 fornece um atraso de tempo que modela a distância transaural aumentada (e, assim, tempo de viagem aumentado) que um componente de som contralateral 112L a partir do alto-falante esquerdo 110A percorre relativo ao componente de som ipsilateral 118R a partir do alto-falante direito 110B para atingir o ouvido direito 125R do ouvinte 120, conforme mostrado na FIG. 1. Em algumas realizações, o atraso cruzado 504 aplica um atraso de 0,792 milissegundos de fala cruzada ao canal filtrado esquerdo de mistura de sub-banda EL. Em algumas realizações, as etapas 1120 e 1130 são invertidas de modo que o primeiro atraso de fala cruzada é aplicado antes do primeiro filtro de passagem inferior.
[00101] O simulador de fala cruzada 215 aplica 1140 um segundo filtro de passagem inferior ao canal direito de mistura de sub-banda ER. O segundo filtro de passagem inferior pode ser o filtro de passagem inferior de sombra de cabeça 506 do simulador de fala cruzada 215, que aplica uma modulação que modela a resposta de frequência do sinal após passar através da cabeça do ouvinte. Em algumas realizações, o filtro de passagem inferior de sombra de cabeça 506 pode ter uma frequência de corte de 2.023 Hz, onde os componentes de frequência do canal direito de mistura de sub-banda ER que excedem a frequência de corte são atenuados. Outras realizações do simulador de fala cruzada 215 do sistema 200 podem empregar um filtro de plataforma baixa ou entalhe para o filtro de passagem inferior de sombra de cabeça. Esse filtro pode ter uma frequência de corte de 2023 Hz, com um Q entre 0,5 e 1,0 e um ganho entre -6 e -24 dB.
[00102] O simulador de fala cruzada 215 aplica 1150 um segundo atraso de fala cruzada à saída do segundo filtro de passagem inferior. O segundo atraso de tempo modela a distância transaural aumentada que um componente de som contralateral 112R a partir do alto-falante direito 110B percorre relativo ao componente de som ipsilateral 118L a partir do alto-falante esquerdo 110B para atingir o ouvido esquerdo 125L do ouvinte 120, conforme mostrado na FIG. 1. Em algumas realizações, o atraso cruzado 508 aplica um atraso de 0.792 milissegundos de fala cruzada ao canal filtrado esquerdo de mistura de sub-banda ER. Em algumas realizações, as etapas 1140 e 1150 são invertidas de modo que o segundo atraso de fala cruzada é aplicado antes do segundo filtro de passagem inferior.
[00103] O simulador de fala cruzada 215 aplica 1160 um primeiro ganho à saída do primeiro atraso de fala cruzada para gerar um canal esquerdo de fala cruzada CL. O simulador de fala cruzada 215 aplica 1170 um segundo ganho à saída do segundo atraso de fala cruzada para gerar um canal direito de fala cruzada CR. Em algumas realizações, o ganho de sombra de cabeça 510 aplica um ganho de -14,4 dB para gerar o canal esquerdo de fala cruzada CL e canal direito de fala cruzada CR.
[00104] Em diversas realizações, as etapas no método 1100 podem ser realizadas em diferentes ordens. Por exemplo, as etapas 1120 e 1130 podem ser realizadas em paralelo com as etapas 1140 e 1150 até processar os canais esquerdos e direitos em paralelo, e gerar o canal esquerdo de fala cruzada CL e canal direito de fala cruzada CR em paralelo.
[00105] FIG. 12 ilustra um método 1200 de gerar os canais esquerdos e direitos de passagem e canais médios a partir do sinal de entrada de áudio, em conformidade com uma realização. 0 método 1200 pode ser realizado em 920 e 925 do método 900. 0 canal de passagem controla a contribuição do canal espacialmente não aprimorado de entrada X ao canal de saida 0, e o canal médio controla a contribuição dos dados comuns de áudio do canal espacialmente não aprimorado esquerdo de entrada XL e o canal não espacialmente direito de entrada XR ao canal de saida 0.
[00106] A passagem 220 do sistema de processamento de áudio 200 aplica 1210 um ganho ao canal esquerdo de mistura de sub- banda EL para gerar um canal de passagem PL, e um ganho ao canal direito de mistura de sub-banda ER para gerar um canal de passagem PR. Em algumas realizações, o ganho de passagem de L/R 606 da passagem 220 aplica um ganho de -infinito dB ao canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub-banda ER. Aqui, os canais de passagem PL e PR são totalmente atenuados e não contribuem com o sinal de saida O. O nivel do ganho pode ser ajustado para controlar a quantia do sinal espacialmente não aprimorado de entrada que contribui com o sinal de saida 0.
[00107] A passagem 220 combina 1230 o canal esquerdo de mistura de sub-banda EL e o canal direito de mistura de sub- banda ER para gerar um canal médio (L+R). Por exemplo, o combinador de L+R 602 da passagem 22 0 adiciona o canal esquerdo de mistura de sub-banda EL com o canal direito de mistura de sub-banda ER a um canal com os dados de áudio que são comuns para ambos o canal esquerdo de mistura de sub- banda EL e o canal direito de mistura de sub-banda ER.
[00108] A passagem 220 aplica 1240 um ganho ao canal médio para gerar um canal médio esquerdo ML, e um ganho ao canal médio para gerar um canal médio direito MR. Em algumas realizações, o ganho de passagem de L+R 604 aplica um ganho de -18 dB à saida do combinador de L+R 602 para gerar os canais esquerdos e direitos médios ML e MR. O nivel de ganho pode ser ajustado para controlar a quantia do sinal médio não espacialmente aprimorado de entrada que contribui com o sinal de saida O. Em algumas realizações, um único ganho é aplicado ao canal médio, e o canal médio aplicado por ganho é usado para os canais esquerdos e direitos médios ML e MR.
[00109] Em diversas realizações, as etapas no método 1200 podem ser realizadas em diferentes ordens. Por exemplo, as etapas 1210 e 1230 podem ser realizadas em paralelo para gerar os canais de passagem e canal médio em paralelo.
[00110] FIG. 13 ilustra um método 1300 de gerar os canais de aprimoramento de baixa e alta frequência a partir do sinal de entrada de áudio, em conformidade com uma realização. O método 1300 pode ser realizado em 930 e 935 do método 900. Os canais de aprimoramento de LF controlam a contribuição dos componentes de baixa frequência do canal espacialmente não aprimorado de entrada X ao canal de saida 0. Os canais de aprimoramento de HF controlam a contribuição dos componentes de alta frequência do canal espacialmente não aprimorado de entrada X ao canal de saida O.
[00111] O reforçador de alta/baixa frequência 225 do sistema de processamento de áudio 200 aplica 1310 um primeiro filtro de passagem de banda ao canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER, e um segundo filtro de passagem de banda à saida do primeiro filtro de passagem de banda. Por exemplo, o filtro de passagem de banda de aprimoramento de LF 702 e filtro de passagem de banda de aprimoramento de LF 704 fornecem um ressonador em cascata para aprimoramento de baixa frequência. As características dos primeiros e segundos filtros de passagem de banda podem ser ajustáveis, tais como, diferentes ajustes com fator pré-definido Q e/ou frequência de centro dos filtros de passagem de banda. Em algumas realizações, a frequência de centro é definida para um nível pré-definido (p.ex., 58,175 Hz), e o fator Q é ajustável. Em algumas realizações, um usuário pode selecionar a partir de um conjunto pré-definido de ajustes para os filtros de passagem de banda. O sistema de filtro de passagem de banda em cascata seletivamente aprimora a energia no sinal que seria tipicamente manuseado via um subwooferseparado em um sistema de alto-falante em campo, porém que é frequentemente não representado suficientemente quando produzido em alto- falantes montados na cabeça (i.e., fontes de ouvido). O design de filtro de quarta ordem (i.e., dois filtros de passagem de banda de segunda ordem em cascata) exibe uma resposta temporal clara quando excitado, adicionando um "vigor" para elementos de baixa frequência chave dentro da mistura, tal como, ataques de bumbo e baixo, enquanto evita uma "obscuridade" geral que pode ocorrer se simplesmente aumentar a energia de baixa frequência sobre uma banda mais ampla no espectro de baixa frequência usando um filtro de passagem de banda de segunda ordem, plataforma baixa ou de pico.
[00112] O reforçador de alta/baixa frequência 225 aplica 1320 um ganho à saída do segundo filtro de passagem de banda para gerar os canais de baixa frequência LFL e LFR. Por exemplo, o ganho de filtro de LF 706 aplica um ganho à saída do filtro de passagem de banda de aprimoramento de LF 704 para gerar o canal de LF esquerdo LFL e o canal de LF direito LFR.O ganho de filtro de LF 706 controla a contribuição dos canais de baixa frequência LFL e LFRaos canais de saida de áudio OL e OU.
[00113] O reforçador de alta/baixa frequência 225 aplica 1330 um filtro de passagem alta ao canal esquerdo de mistura de sub-banda EL e canal direito de mistura de sub-banda ER. Por exemplo, o filtro de passagem alta de aprimoramento de HF 708 aplica uma modulação que atenua os componentes de sinal com frequências inferiores do que uma frequência de corte do filtro de passagem alta de aprimoramento de HF 708. Conforme acima discutido, o filtro de passagem alta de aprimoramento de HF 708 pode ser um filtro de Butterworth de segunda ordem com uma frequência de corte de 4573 Hz. Em algumas realizações, as características do filtro de passagem alta são ajustáveis, tais como, diferentes ajustes da frequência de corte e ganho são aplicados à saida do filtro de passagem alta. A amplificação de alta frequência geral atingida através da adição desse filtro de passagem alta serve para acentuar informações impactantes timbricas, espectrais e temporais dentro dos sinais musicais tipicos (p.ex., percussão de alta frequência, tal como, cimbalos, elementos de alta frequência das respostas de quarto acústico, etc.). Além do mais, o referido aprimoramento serve para aumentar a eficácia percebida do aprimoramento de sinal espacial, enquanto evita a coloração indevida nos elementos de sinal não espacial de frequência baixa e média (comumente vocais e baixo).
[00114] O reforcador de alta/baiXa frequencia 225 aplica 1340 um ganho à saída do filtro de passagem alta para gerar os canais de alta frequência HFL e HFR. 0 nível de ganho pode ser ajustado para controlar a contribuição dos canais de alta frequência HFL e HFR aos canais de saída de áudio 0L e OU. Em algumas realizações, o ganho de filtro de HF 710 aplica um ganho de 0 dB à saída do filtro de passagem alta de aprimoramento de HF 708.
[00115] Em diversas realizações, as etapas no método 1300 podem ser realizadas em diferentes ordens. Por exemplo, as etapas 1310 e 1330 podem ser realizadas em paralelo com as etapas 1330 e 1340 para gerar os canais de alta e baixa frequência em paralelo.
[00116] FIG. 14 ilustra um gráfico de frequência 1400 dos canais de áudio, em conformidade com uma realização. No gráfico 1400, o sistema de processamento de áudio 200 opera em um ajuste padrão onde os ressonadores em cascata (p.ex., filtro de passagem de banda de aprimoramento de LF 702 e filtro de passagem de banda de aprimoramento de LF 7 04) do reforçador de alta/baixa frequência 225 têm uma frequência de centro de 58.175 Hz e um fator Q de 2,5. A linha 1410 é uma resposta de frequência de um sinal de entrada de áudio X de ruído branco nos canais esquerdos de entrada XL. A linha 1420 é uma resposta de frequência de um melhorador espacial de sub-banda 210 que gera o canal espacialmente aprimorado Y, considerando o mesmo XL sinal de entrada de ruído branco. A linha 1430 é uma resposta de frequência de um simulador de fala cruzada 215 que gera um canal de fala cruzada C, considerando o mesmo XL sinal de entrada de ruído branco. A linha 1440 é uma resposta de frequência do reforçador de alta/baixa frequência 225 que gera os canais de alta e baixa frequência LF e HF, considerando o mesmo XL sinal de entrada de ruido branco. O ganho de passagem de L/R 606 é definido para -infinito dB no ajuste padrão, eliminando a contribuição do canal de passagem P ao sinal de saída O.
[00117] FIG. 15 ilustra um gráfico de frequência 1500 dos canais de áudio, em conformidade com uma realização. A linha 1510 é uma resposta de frequência de um sinal de entrada de áudio X de ruído branco nos canais esquerdos de entrada XL. Como no gráfico 1400, os ressonadores em cascata (p.ex., filtro de passagem de banda de aprimoramento de LF 702 e filtro de passagem de banda de aprimoramento de LF 7 04) do reforçador de alta/baixa frequência 225 operam no ajuste padrão onde os filtros de passagem de banda têm uma frequência de centro de 58, 175 Hz e um fator Q de 2,5. A linha 1520 é uma resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando o mesmo XL sinal de entrada de ruído branco. A linha 1530 é uma resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando um sinal de entrada de ruído branco estéreo correlacionado (i.e., sinais esquerdos e direitos são idênticos) . A linha 1540 é uma resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando um sinal de entrada de ruído branco não correlacionado (i.e., canal direito é uma versão invertida do canal esquerdo)
[00118] FIG. 16 ilustra um gráfico de frequência 1600 dos sinais de canal, em conformidade com uma realização. O sistema de processamento de áudio 200 opera em um ajuste reforçado, onde os ressonadores em cascata (p.ex., filtro de passagem de banda de aprimoramento de LF 702 e filtro de passagem de banda de aprimoramento de LF 704) do reforçador de alta/baixa frequência 225 têm uma frequência de centro de 58,175 Hz e um fator Q de 1,3. A linha 1610 é uma resposta de frequência de um sinal de entrada de áudio X de ruído branco nos canais esquerdos de entrada XL- A linha 162 0 é uma resposta de frequência de um melhorador espacial de sub-banda 210 que gera o canal espacialmente aprimorado Y, considerando o mesmo XL sinal de entrada de ruído branco. A linha 1630 é uma resposta de frequência de um simulador de fala cruzada 215 que gera o canal de fala cruzada C, considerando o mesmo XL sinal de entrada de ruído branco. A linha 164 0 é uma resposta de frequência combinada do reforçador de alta/baixa frequência 225 e passagem 230 no ajuste reforçado, considerando o mesmo XL sinal de entrada de ruído branco.
[00119] FIG. 17 ilustra os componentes individuais da linha 1640 acima. A linha 1710 é uma resposta de frequência do aprimoramento de baixa frequência acima. A linha 1720 é uma resposta de frequência do aprimoramento de filtro de alta frequência acima. A linha 1730 é uma resposta de frequência da passagem acima 220. As linhas 1710, 1720 e 1730 representam os componentes da resposta combinada de filtro da linha 1640 mostrada na FIG. 16 para o sistema de processamento de áudio 200 operando no ajuste reforçado.
[00120] FIG. 18 ilustra um gráfico de frequência 1800 dos canais de áudio, em conformidade com uma realização. 0 sistema de processamento de áudio 200 opera no ajuste reforçado. A linha 1810 é uma resposta de frequência de um sinal de entrada de áudio X de ruído branco nos canais esquerdos de entrada XL- A linha 1820 é uma resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando o mesmo XL sinal de entrada de ruido branco. A linha 1830 é um gráfico de resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando um sinal de entrada de ruido branco estéreo correlacionado (i.e., sinais esquerdos e direitos são idênticos) . A linha 1840 é uma resposta de frequência do misturador 230 que gera o canal esquerdo de saída OL, considerando um sinal de entrada de ruído branco não correlacionado (i.e., canal direito é uma versão invertida do canal esquerdo).
[00121] Ao ler esta revelação, aqueles com habilidade na técnica apreciarão ainda realizações alternativas adicionais através dos princípios aqui revelados. Desse modo, enquanto as realizações particulares e aplicações foram ilustradas e descritas, fica entendido que as realizações reveladas não são limitadas à construção precisa e componentes aqui revelados. Diversas modificações, alterações e variações, as quais serão aparentes para aqueles com habilidade na técnica, podem ser feitas no arranjo, operação e detalhes do método e mecanismo aqui revelados sem desviar do escopo aqui descrito. Quaisquer das etapas, operações ou processos aqui descritos podem ser realizados ou implantados com um ou mais módulos de hardware ou software, sozinhos ou em combinação com outros dispositivos. Em uma realização, um módulo de software é implantado com um produto de programa de computador compreendendo uma midia legível por computador (p.ex., midia legivel por computador não transitória) contendo código de programa de computador, o qual pode ser executado por um processador de computador para realizar todas ou quaisquer das etapas, operações ou processos descritos.

Claims (20)

1. Método, caracterizado pelo fato de compreender as etapas de: - receber um sinal de áudio de entrada (X) compreendendo um canal esquerdo de entrada (XL) e um canal direito de entrada (XR) ; - gerar um canal espacialmente aprimorado esquerdo (YL) e um canal espacialmente aprimorado direito (YR) por ajuste de ganho dos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) dos canais esquerdos e direitos de entrada (XL, XR) ; - gerar um canal esquerdo de fala cruzada (CL) por filtragem e atraso de tempo do canal esquerdo de entrada (XL) ; - gerar um canal direito de fala cruzada (CR) por filtragem e atraso de tempo do canal direito de entrada (XR); - gerar um canal esquerdo de saida (0L) ao misturar o canal espacialmente aprimorado esquerdo (YL) e o canal direito de fala cruzada (CR) ; e - gerar um canal direito de saida (0R) ao misturar o canal espacialmente aprimorado direito (YR) e o canal esquerdo de fala cruzada (CL) .
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o método ainda incluir gerar um canal de baixa frequência esquerdo (LFL) e um canal de baixa frequência direito (LFR) ao: - aplicar um primeiro filtro de passagem de banda (702) ao canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; - aplicar um segundo filtro de passagem de banda (704) à saída do primeiro filtro de passagem de banda (702); e - aplicar um ganho à saída do segundo filtro de passagem de banda (704); e - gerar o canal esquerdo de saída (0L) inclui misturar o canal espacialmente aprimorado esquerdo (YL) , o canal direito de fala cruzada (CR) e o canal de baixa frequência esquerdo (LFL); e - gerar o canal direito de saída (OR) inclui misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal de baixa frequência direito (LFR) .
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de os primeiros e segundo filtros de passagem de banda (702, 704) cada ter uma frequência de centro e fator de qualidade ajustável (Q).
4. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o método ainda incluir gerar um canal esquerdo de alta frequência (HFL) e um canal direito de alta frequência (HFR) ao: - aplicar um filtro de passagem alta (708) ao canal esquerdo de entrada (XL) e o canal direito de entrada (XR); e - aplicar um ganho à saída do filtro de passagem alta (708); e - gerar o canal esquerdo de saída (OL) inclui misturar o canal espacialmente aprimorado esquerdo (YL) , o canal direito de fala cruzada (CR) e canal esquerdo de alta frequência (HFL); e - gerar o canal direito de saída (OR) inclui misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal direito de alta frequência (HFR) .
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de o filtro de passagem alta (708) ser um filtro de passagem alta de Butterworth de segunda ordem.
6. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o método ainda incluir gerar um canal esquerdo de passagem (PL) e um canal direito de passagem (PR) ao aplicar um ganho aos canais esquerdos e direitos de entrada (XL, XR) ; - gerar o canal esquerdo de saida (OL) inclui misturar o canal espacialmente aprimorado esquerdo (YL) , o canal direito de fala cruzada (CR) e o canal esquerdo de passagem (PL) ; e - gerar o canal direito de saida (OR) inclui misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal direito de passagem (PR) .
7. Método, de acordo com a reivindicação 1, caracterizado pelo fato de o método ainda incluir gerar um canal médio (M) ao: - adicionar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; e - aplicar um ganho aos canais adicionados esquerdos e direitos de entrada (XL, XR) ; - gerar o canal esquerdo de saida (0L) inclui misturar o canal espacialmente aprimorado esquerdo (YL), o canal direito de fala cruzada (CR) e o canal médio (M); e - gerar o canal direito de saida (OR) inclui misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal médio (M).
8. Método, de acordo com a reivindicação 1, caracterizado pelo fato de gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) por ajuste de ganho dos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) dos canais esquerdos e direitos de entrada (XL, XR) incluir: - separar o canal esquerdo de entrada (XL) nos componentes de sub-banda esquerda (EL) , cada um dos componentes de sub-banda esquerda (EL) correspondente a uma banda de frequência a partir de um grupo de bandas de frequência; - separar um canal direito de entrada (XR) nos componentes de sub-banda direita (ER) , cada um dos componentes de sub-banda direita (ER) correspondente a uma banda de frequência a partir do grupo das bandas de frequência; - gerar a sub-banda média e os componentes de sub-banda lateral (Em, Es) a partir dos componentes esquerdos e direitos de sub-banda (EL, ER) ; - ajustar um ganho dos componentes de sub-banda lateral (Es) relativo aos componentes de sub-banda média (Em); e recombinar o ganho ajustado da sub-banda média e componentes de sub-banda lateral (Em, Es) para gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) ;
9. Método, de acordo com a reivindicação 1, caracterizado pelo fato de: - gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) incluir aplicar um primeiro ganho aos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) dos canais esquerdos e direitos de entrada (XL, XR) ; - gerar o canal esquerdo de fala cruzada (CL) inclui aplicar um segundo ganho ao canal esquerdo de entrada (XL) filtrado e atrasado de tempo; - gerar o canal direito de fala cruzada (CR) inclui aplicar o segundo ganho ao canal direito de entrada (XR) filtrado e atrasado de tempo; o método ainda inclui: - gerar um canal de baixa frequência esquerdo (LFL) e um canal de baixa frequência direito (LFR) ao: - aplicar um primeiro filtro de passagem de banda (702) ao canal esquerdo de entrada (XL) e ao canal direito de entrada (XR); e - aplicar um segundo filtro de passagem de banda (704) à saida do primeiro filtro de passagem de banda (702); e - aplicar um terceiro ganho à saida do segundo filtro de passagem de banda (704); - gerar um canal esquerdo de alta frequência (HFL) e um canal direito de alta frequência (HFR) ao: - aplicar um filtro de passagem alta (708) ao canal esquerdo de entrada (XL) e o canal direito de entrada (XR); e - aplicar um quarto ganho à saida do filtro de passagem alta (708); - gerar um canal esquerdo de passagem (PL) e um canal direito de passagem (PR) ao aplicar um quinto ganho aos canais esquerdos e direitos de entrada (XL, XR) ; e - gerar um canal médio (M) ao: - adicionar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; e - aplicar um sexto ganho aos canais adicionados esquerdos e direitos de entrada (XL, XR) ; - gerar o canal esquerdo de saida (OL) inclui misturar o canal espacialmente aprimorado esquerdo (YL), o canal direito de fala cruzada (CR), o canal de baixa frequência esquerdo (LFL) , o canal esquerdo de alta frequência (HFL) , o canal esquerdo de passagem (PL) e o canal médio (M); e - gerar o canal direito de saida (0R) inclui misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) , o canal de baixa frequência direito (LFR) , o canal direito de alta frequência (HFR), o canal direito de passagem (PR) e o canal médio (M) .
10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de - o primeiro ganho ser um ganho de -12 até 6 dB; - o segundo ganho ser um ganho de -infinito até 0 dB; - o terceiro ganho ser um ganho de 0 até 20 dB; - o quarto ganho ser um ganho de 0 até 20 dB; - o quinto ganho ser um ganho de -infinito até 0 dB; -o sexto ganho ser um ganho de -infinito até 0 dB.
11. Sistema de processamento de áudio, caracterizadopelo fato de compreender: - um melhorador espacial de sub-banda (210) configurado para gerar um canal espacialmente aprimorado esquerdo (YL) e um canal espacialmente aprimorado direito (YR) por ajuste de ganho dos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) de um canal esquerdo de entrada (XL) e um canal direito de entrada (XR) ; - um simulador de fala cruzada (215) configurado para: - gerar um canal esquerdo de fala cruzada (CL) por filtragem e atraso de tempo do canal esquerdo de entrada (XL) ; e - gerar um canal direito de fala cruzada (CR) por filtragem e atraso de tempo do canal direito de entrada (XR) ; e - um misturador (230) configurado para: - gerar um canal esquerdo de saída (OL) ao misturar o canal espacialmente aprimorado esquerdo (YL) e o canal direito de fala cruzada (CR) ; e - gerar um canal direito de saida (0R) ao misturar o canal espacialmente aprimorado direito (YR) e o canal esquerdo de fala cruzada (CL) .
12. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o sistema (200) ainda incluir um reforçador de frequência (225) configurado para gerar um canal de baixa frequência esquerdo (LFL) e um canal de baixa frequência direito (LFR) , o reforçador de frequência (225) incluindo: - um primeiro filtro de passagem de banda (702) configurado para filtrar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; e - um segundo filtro de passagem de banda (704) configurado para filtrar a saida do primeiro filtro de passagem de banda (702); e - um ganho de filtro de baixa frequência (706) para aplicar um ganho à saida do segundo filtro de passagem de banda (704); - o misturador (230) configurado para gerar o canal esquerdo de saida (0L) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado esquerdo (YL) , o canal direito de fala cruzada (CR) e o canal de baixa frequência esquerdo (LFL) ; e - o misturador (230) configurado para gerar o canal direito de saida (OR) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal de baixa frequência direito (LFR) .
13. Sistema, de acordo com a reivindicação 12, caracterizado pelo fato de os primeiros e segundos filtros de passagem de banda (702, 704) cada ter uma frequência de centro e fator de qualidade ajustável (Q).
14. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o sistema (200) incluir ainda um reforçador de frequência (225) configurado para gerar um canal esquerdo de alta frequência (HFL) e um canal direito de alta frequência (HFR) , o reforçador de frequência (225) incluindo: - um filtro de passagem alta (708) configurado para filtrar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR); e - um ganho de filtro de alta frequência (710) para aplicar um ganho à saida do filtro de passagem alta (708); - o misturador (230) configurado para gerar o canal esquerdo de saida (OL) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado esquerdo (YL), o canal direito de fala cruzada (CR) e o canal esquerdo de alta frequência (HFL) ; e - o misturador (230) configurado para gerar o canal direito de saida (OR) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado direito (YR), o canal esquerdo de fala cruzada (CL) e o canal direito de alta frequência (HFR) .
15. Sistema, de acordo com a reivindicação 14, caracterizado pelo fato de o filtro de passagem alta (708) ser um filtro de passagem alta de Butterworth de segunda ordem.
16. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o sistema (200) ainda incluir uma passagem (220) configurada para gerar um canal esquerdo de passagem (PL) e um canal direito de passagem (PR), a passagem (220) incluindo um ganho de passagem (604) configurado para aplicar um ganho aos canais esquerdos e direitos de entrada (XL, XR) ; - o misturador (230) configurado para gerar o canal esquerdo de saída (OL) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado esquerdo (YL) , o canal direito de fala cruzada (CR) e o canal esquerdo de passagem (PL) ; e - o misturador (230) configurado para gerar o canal direito de saída (OR) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal direito de passagem (PR) .
17. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o sistema (200) ainda incluir uma passagem (220) configurada para gerar um canal médio (M) , a passagem (220) incluindo: - um combinador (602) configurado para adicionar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; e - um ganho médio configurado para aplicar um ganho aos canais adicionados esquerdos e direitos de entrada (XL, XR) ; - o misturador (230) configurado para gerar o canal esquerdo de saída (0L) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado esquerdo (YL), o canal direito de fala cruzada (CR) e o canal médio esquerdo (ML) ; e - o misturador (230) configurado para gerar o canal direito de saída (OR) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) e o canal médio direito (MR) .
18. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o melhorador espacial de sub-banda (210) configurado para gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) por ajuste de ganho dos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) do canal esquerdo de entrada (XL) e o canal direito de entrada (XR) incluir o melhorador espacial de sub-banda (210) sendo configurado para: - separar o canal esquerdo de entrada (XL) nos componentes de sub-banda esquerda (EL) , cada um dos componentes de sub-banda esquerda (EL) correspondente a uma banda de frequência a partir de um grupo das bandas de frequência; - separar um canal direito de entrada (XR) nos componentes de sub-banda direita (ER) , cada um dos componentes de sub-banda direita (ER) correspondente a uma banda de frequência a partir do grupo das bandas de frequência; - gerar a sub-banda média e os componentes de sub-banda lateral (Em, Es) a partir dos componentes esquerdos e direitos de sub-banda (EL, ER) ; - ajustar um ganho dos componentes de sub-banda lateral (Es) relativos aos componentes de sub-banda média (Em); e - recombinar o ganho ajustado da sub-banda média e componentes de sub-banda lateral (Em, Es) para gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) .
19. Sistema, de acordo com a reivindicação 11, caracterizado pelo fato de o melhorador espacial de sub-banda (210) configurado para gerar o canal espacialmente aprimorado esquerdo (YL) e o canal espacialmente aprimorado direito (YR) incluir o melhorador espacial de sub-banda (210) sendo configurado para aplicar um primeiro ganho aos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) dos canais esquerdos e direitos de entrada (XL, XR) ; - o simulador de fala cruzada (215) configurado para gerar o canal esquerdo de fala cruzada (CL) inclui o simulador de fala cruzada (215) sendo configurado para aplicar um segundo ganho ao canal esquerdo de entrada (XL) filtrado e atrasado de tempo; - o simulador de fala cruzada (215) configurado para gerar o canal direito de fala cruzada (CR) inclui o simulador de fala cruzada (215) sendo configurado para aplicar o segundo ganho ao canal direito de entrada (XR) filtrado e atrasado de tempo; o sistema (200) ainda inclui: - um reforçador de frequência (225) configurado para gerar um canal de baixa frequência esquerdo (LFL) , um canal de baixa frequência direito (LFR) , um canal esquerdo de alta frequência (HFL) e um canal direito de alta frequência (HFR) , o reforçador de frequência (225) incluindo: - um primeiro filtro de passagem de banda (702) configurado para filtrar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR) ; e - um segundo filtro de passagem de banda (704) configurado para filtrar a saida do primeiro filtro de passagem de banda (702); - um ganho de filtro de baixa frequência (705) configurado para aplicar um terceiro ganho à saida do segundo filtro de passagem de banda (704) para gerar o canal de baixa frequência esquerdo (LFL) e canal de baixa frequência direito (LFR) ; - um filtro de passagem alta (708) configurado para filtrar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR); e - um ganho de filtro de alta frequência (710) configurado para aplicar um quarto ganho à saida do filtro de passagem alta (708) para gerar o canal esquerdo de alta frequência (HFL) e o canal direito de alta frequência (HFR); - uma passagem (220) configurada para gerar um canal esquerdo de passagem (PL) , um canal direito de passagem (PR) e um canal médio (M), a passagem (220) incluindo: - um ganho de passagem (604) configurado para aplicar um quinto ganho aos sinais esquerdos e direitos de entrada (XL, XR) para gerar o canal esquerdo de passagem (PL) e o canal direito de passagem (PR) ; - um combinador (602) configurado para adicionar o canal esquerdo de entrada (XL) e o canal direito de entrada (XR); e - um ganho médio configurado para aplicar um sexto ganho aos canais adicionados esquerdos e direitos de entrada (XL, XR) para gerar o canal médio esquerdo (ML) e o canal médio direito (MR) ; - o misturador (230) configurado para gerar o canal esquerdo de saida (OL) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado esquerdo (YL), o canal direito de fala cruzada (CR) , o canal de baixa frequência esquerdo (LFL) , o canal esquerdo de alta frequência (HFL) , o canal esquerdo de passagem (PL) e o canal médio (M); e - o misturador (230) configurado para gerar o canal direito de saida (OR) inclui o misturador (230) sendo configurado para misturar o canal espacialmente aprimorado direito (YR) , o canal esquerdo de fala cruzada (CL) , o canal de baixa frequência direito (LFR) , o canal direito de alta frequência (HFR) , o canal direito de passagem (PR) e o canal médio (M) .
20. Midia legivel por computador não transitória configurada para armazenar o método, caracterizada pelo fato de realizar as etapas do método em um processador, fazendo com que o processador: - receba um sinal de áudio de entrada (X) compreendendo um canal esquerdo de entrada (XL) e um canal direito de entrada (XR) ; - gere um canal espacialmente aprimorado esquerdo (YL) e um canal espacialmente aprimorado direito (YR) por ajuste de ganho dos componentes de sub-banda lateral (Es) e componentes de sub-banda média (Em) dos canais esquerdos e direitos de entrada (XL, XR); - gere um canal esquerdo de fala cruzada (CL) por filtragem e atraso de tempo do canal esquerdo de entrada (XL) ; - gere um canal direito de fala cruzada (CR) por filtragem e atraso de tempo do canal direito de entrada (XR); - gere um canal esquerdo de saida (OL) ao misturar o canal espacialmente aprimorado esquerdo (YL) e o canal direito de fala cruzada (CR) ; e gere um canal direito de saida (OR) ao misturar o canal espacialmente aprimorado direito (YR) e o canal esquerdo de fala cruzada (CL) .
BR112018014724-9A 2016-01-19 2017-01-12 Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo BR112018014724B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662280121P 2016-01-19 2016-01-19
US62/280,121 2016-01-19
US201662388367P 2016-01-29 2016-01-29
US62/388,367 2016-01-29
PCT/US2017/013249 WO2017127286A1 (en) 2016-01-19 2017-01-12 Audio enhancement for head-mounted speakers

Publications (2)

Publication Number Publication Date
BR112018014724A2 BR112018014724A2 (pt) 2018-12-11
BR112018014724B1 true BR112018014724B1 (pt) 2020-11-24

Family

ID=59362451

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112018014724-9A BR112018014724B1 (pt) 2016-01-19 2017-01-12 Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo

Country Status (11)

Country Link
US (1) US10009705B2 (pt)
EP (2) EP4307718A3 (pt)
JP (3) JP6546351B2 (pt)
KR (1) KR101858918B1 (pt)
CN (1) CN108781331B (pt)
AU (1) AU2017208916B2 (pt)
BR (1) BR112018014724B1 (pt)
CA (1) CA3011694C (pt)
NZ (1) NZ745422A (pt)
TW (1) TWI620171B (pt)
WO (1) WO2017127286A1 (pt)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10225657B2 (en) 2016-01-18 2019-03-05 Boomcloud 360, Inc. Subband spatial and crosstalk cancellation for audio reproduction
EP3530006B1 (en) * 2016-11-11 2020-11-04 Huawei Technologies Co., Ltd. Apparatus and method for weighting stereo audio signals
US10524078B2 (en) * 2017-11-29 2019-12-31 Boomcloud 360, Inc. Crosstalk cancellation b-chain
US10499153B1 (en) 2017-11-29 2019-12-03 Boomcloud 360, Inc. Enhanced virtual stereo reproduction for unmatched transaural loudspeaker systems
US10674266B2 (en) * 2017-12-15 2020-06-02 Boomcloud 360, Inc. Subband spatial processing and crosstalk processing system for conferencing
US10764704B2 (en) * 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
CN112470218A (zh) * 2018-06-12 2021-03-09 奇跃公司 低频信道间相干性控制
US10575116B2 (en) * 2018-06-20 2020-02-25 Lg Display Co., Ltd. Spectral defect compensation for crosstalk processing of spatial audio signals
US10715915B2 (en) 2018-09-28 2020-07-14 Boomcloud 360, Inc. Spatial crosstalk processing for stereo signal
CN113316941B (zh) * 2019-01-11 2022-07-26 博姆云360公司 声场保存音频通道求和
EP3928315A4 (en) * 2019-03-14 2022-11-30 Boomcloud 360, Inc. SPATIALLY SENSITIVE MULTIBAND COMPRESSION SYSTEM WITH PRIORITY
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
US11032644B2 (en) 2019-10-10 2021-06-08 Boomcloud 360, Inc. Subband spatial and crosstalk processing using spectrally orthogonal audio components
CN111065020B (zh) * 2019-11-07 2021-09-07 华为终端有限公司 音频数据处理的方法和装置
KR102465792B1 (ko) * 2020-10-24 2022-11-09 엑스멤스 랩스 인코포레이티드 사운드 생성 디바이스
CN112351379B (zh) * 2020-10-28 2021-07-30 歌尔光学科技有限公司 音频组件的控制方法以及智能头戴设备

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2244162C3 (de) * 1972-09-08 1981-02-26 Eugen Beyer Elektrotechnische Fabrik, 7100 Heilbronn «system
US4748669A (en) * 1986-03-27 1988-05-31 Hughes Aircraft Company Stereo enhancement system
FI113147B (fi) * 2000-09-29 2004-02-27 Nokia Corp Menetelmä ja signaalinkäsittelylaite stereosignaalien muuntamiseksi kuulokekuuntelua varten
US7003467B1 (en) * 2000-10-06 2006-02-21 Digital Theater Systems, Inc. Method of decoding two-channel matrix encoded audio to reconstruct multichannel audio
US8676361B2 (en) 2002-06-05 2014-03-18 Synopsys, Inc. Acoustical virtual reality engine and advanced techniques for enhancing delivered sound
JP2004023486A (ja) 2002-06-17 2004-01-22 Arnis Sound Technologies Co Ltd ヘッドホンによる再生音聴取における音像頭外定位方法、及び、そのための装置
FI118370B (fi) * 2002-11-22 2007-10-15 Nokia Corp Stereolaajennusverkon ulostulon ekvalisointi
US7634092B2 (en) * 2004-10-14 2009-12-15 Dolby Laboratories Licensing Corporation Head related transfer functions for panned stereo audio content
KR100636248B1 (ko) * 2005-09-26 2006-10-19 삼성전자주식회사 보컬 제거 장치 및 방법
DE602007007457D1 (de) 2006-03-13 2010-08-12 Dolby Lab Licensing Corp Ableitung von mittelkanalton
US8619998B2 (en) * 2006-08-07 2013-12-31 Creative Technology Ltd Spatial audio enhancement processing method and apparatus
JP2010515290A (ja) 2006-09-14 2010-05-06 エルジー エレクトロニクス インコーポレイティド ダイアログエンハンスメント技術のコントローラ及びユーザインタフェース
US8612237B2 (en) 2007-04-04 2013-12-17 Apple Inc. Method and apparatus for determining audio spatial quality
US8705748B2 (en) 2007-05-04 2014-04-22 Creative Technology Ltd Method for spatially processing multichannel signals, processing module, and virtual surround-sound systems
CN101884065B (zh) 2007-10-03 2013-07-10 创新科技有限公司 用于双耳再现和格式转换的空间音频分析和合成的方法
US8295498B2 (en) * 2008-04-16 2012-10-23 Telefonaktiebolaget Lm Ericsson (Publ) Apparatus and method for producing 3D audio in systems with closely spaced speakers
US9247369B2 (en) 2008-10-06 2016-01-26 Creative Technology Ltd Method for enlarging a location with optimal three-dimensional audio perception
TWI449442B (zh) * 2009-01-14 2014-08-11 Dolby Lab Licensing Corp 用於無回授之頻域主動矩陣解碼的方法與系統
US8705769B2 (en) * 2009-05-20 2014-04-22 Stmicroelectronics, Inc. Two-to-three channel upmix for center channel derivation
CN102598715B (zh) * 2009-06-22 2015-08-05 伊尔莱茵斯公司 光耦合骨传导设备、系统及方法
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9107021B2 (en) 2010-04-30 2015-08-11 Microsoft Technology Licensing, Llc Audio spatialization using reflective room model
US20110288860A1 (en) 2010-05-20 2011-11-24 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for processing of speech signals using head-mounted microphone pair
JP5964311B2 (ja) 2010-10-20 2016-08-03 ディーティーエス・エルエルシーDts Llc ステレオイメージ拡張システム
KR101785379B1 (ko) 2010-12-31 2017-10-16 삼성전자주식회사 공간 음향에너지 분포 제어장치 및 방법
JP2013013042A (ja) 2011-06-02 2013-01-17 Denso Corp 立体音響装置
JP5772356B2 (ja) * 2011-08-02 2015-09-02 ヤマハ株式会社 音響特性制御装置及び電子楽器
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
WO2013181172A1 (en) * 2012-05-29 2013-12-05 Creative Technology Ltd Stereo widening over arbitrarily-configured loudspeakers
US20150036826A1 (en) * 2013-05-08 2015-02-05 Max Sound Corporation Stereo expander method
US9338570B2 (en) * 2013-10-07 2016-05-10 Nuvoton Technology Corporation Method and apparatus for an integrated headset switch with reduced crosstalk noise
TW201532035A (zh) 2014-02-05 2015-08-16 Dolby Int Ab 預測式fm立體聲無線電雜訊降低

Also Published As

Publication number Publication date
EP3406085A4 (en) 2019-12-04
CN108781331B (zh) 2020-11-06
EP4307718A2 (en) 2024-01-17
EP3406085A1 (en) 2018-11-28
WO2017127286A1 (en) 2017-07-27
AU2017208916A1 (en) 2018-09-06
TW201732782A (zh) 2017-09-16
CN108781331A (zh) 2018-11-09
TWI620171B (zh) 2018-04-01
NZ745422A (en) 2019-09-27
EP4307718A3 (en) 2024-04-10
US20170230777A1 (en) 2017-08-10
JP6546351B2 (ja) 2019-07-17
KR20170127570A (ko) 2017-11-21
CA3011694A1 (en) 2017-07-27
JP7378515B2 (ja) 2023-11-13
JP2019193291A (ja) 2019-10-31
EP3406085B1 (en) 2024-05-01
JP2019506803A (ja) 2019-03-07
JP2022058913A (ja) 2022-04-12
CA3011694C (en) 2019-04-02
AU2017208916B2 (en) 2019-01-31
US10009705B2 (en) 2018-06-26
KR101858918B1 (ko) 2018-05-16
BR112018014724A2 (pt) 2018-12-11

Similar Documents

Publication Publication Date Title
BR112018014724B1 (pt) Metodo, sistema de processamento de audio e midia legivel por computador nao transitoria configurada para armazenar o metodo
JP4286510B2 (ja) 音響信号処理装置及びその方法
JP5298199B2 (ja) モノフォニック対応およびラウドスピーカ対応のバイノーラルフィルタ
JP5524237B2 (ja) 空間キューパラメータを用いてマルチチャンネルオーディオ信号に反響を適用する方法と装置
ES2709248T3 (es) Generación de audio binaural en respuesta a un audio multicanal que usa al menos una red de retardo de retroalimentación
CN114401481B (zh) 响应于多通道音频通过使用至少一个反馈延迟网络产生双耳音频
RU2666316C2 (ru) Аппарат и способ улучшения аудиосигнала, система улучшения звука
MX2007010636A (es) Dispositivo y metodo para generar una senal estereofonica codificada de una pieza de audio o corriente de datos de audio.
BR112018014632B1 (pt) método para produzir dois canais de áudio e sistema
JP2022101630A (ja) 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償
TWI692256B (zh) 次頻帶空間音訊增強
JP6643778B2 (ja) 音響装置、電子鍵盤楽器およびプログラム
US20230085013A1 (en) Multi-channel decomposition and harmonic synthesis
Cecchi et al. Crossover Networks: A Review
CN117678014A (zh) 使用全通滤波器网络的仰角感知线索的无色生成

Legal Events

Date Code Title Description
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 12/01/2017, OBSERVADAS AS CONDICOES LEGAIS.