BRPI0923440B1 - método de virtualização de som surround e sistema de virtualização de som surround - Google Patents

método de virtualização de som surround e sistema de virtualização de som surround Download PDF

Info

Publication number
BRPI0923440B1
BRPI0923440B1 BRPI0923440-3A BRPI0923440A BRPI0923440B1 BR PI0923440 B1 BRPI0923440 B1 BR PI0923440B1 BR PI0923440 A BRPI0923440 A BR PI0923440A BR PI0923440 B1 BRPI0923440 B1 BR PI0923440B1
Authority
BR
Brazil
Prior art keywords
signals
sound
surround
input
locations
Prior art date
Application number
BRPI0923440-3A
Other languages
English (en)
Inventor
Charles Phillip Brown
Original Assignee
Dolby Laboratories Licensing Corporation
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation filed Critical Dolby Laboratories Licensing Corporation
Publication of BRPI0923440A2 publication Critical patent/BRPI0923440A2/pt
Publication of BRPI0923440A8 publication Critical patent/BRPI0923440A8/pt
Publication of BRPI0923440B1 publication Critical patent/BRPI0923440B1/pt

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/002Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/02Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Mathematical Physics (AREA)
  • Pure & Applied Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Stereophonic System (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

VIRTUALIZADOR E MÉTODO DE SOM SURROUND COM COMPRESSÃO DE FAIXA DINÂMICA. A invenção refere-se a um método e sistema para gerar sinais de saída para reprodução por dois alto-falantes físicos em resposta a sinais de áudio de entrada indicativos de som de múltiplas localizações de fonte que incluem pelo menos duas localizações traseiras. Tipicamente, os sinais de entrada são indicativos de som de três localizações dianteiras e duas localizações traseiras (fontes de surround esquerdo e direito). Um virtualizador gera as saídas de surround esquerda e direita úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes traseiras. Tipicamente, o virtualizador gera as saídas de surround esquerdo e direito transformando as entradas de fonte traseira de acordo com uma função de transferência relativa à cabeça. Para asse-gurar que os canais virtuais sejam bem ouvidos na presença de outros canais, o virtu-alizador executa uma compressão de faixa dinâmica sobre as entradas de fonte traseira. A compressão de faixa dinâmica é de preferência executada amplificando as entradas de fonte traseira ou suas versões parcialmente processadas em um modo não linear em relação às entradas de fonte dianteira.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] Este pedido reivindica prioridade do Pedido de Patente Provisório dos Estados Unidos Número 61/122.647 depositado em 15 de dezembro de 2008, por meio disto incorporado por referência na sua totalidade.
CAMPO DA INVENÇÃO
[0002] A invenção refere-se a sistemas e métodos de virtualizador de som surround para gerar sinais de saída para reprodução por um par de alto-falantes físicos (fones de ouvido ou alto-falantes) posicionados em localizações de saída, em resposta a pelo menos dois sinais de áudio de entrada indicativos de som de localizações de múltiplas fontes que inclui pelo menos duas localizações traseiras. Tipicamente, os sinais de saída são gerados em resposta a um conjunto de cinco sinais de entrada indicativos de som de três localizações dianteiras (fontes dianteiras esquerda, central, e direita) e duas localizações traseiras (fontes traseiras de surround esquerdo e surround direito).
ANTECEDENTES DA INVENÇÃO
[0003] Através de toda esta descrição incluindo as reivindicações, o termo "virtualizador" (ou "sistema virtualizador") denota um sistema acoplado e configurado para receber N sinais de áudio de entrada (indicativos de som de um conjunto de localizações de fonte) e gerar M sinais de áudio de saída para reprodução por um conjunto de M alto- falantes físicos (por exemplo, fones de ouvido ou alto-falantes) posicionados em localizações de saída diferentes das localizações de fonte, onde cada um de N e M é um número maior do que um. N pode ser igual a ou diferente de M. Um virtualizador gera (ou tenta gerar) os sinais de áudio de saída de modo que quando reproduzidos, o ouvinte percebe os sinais reproduzidos como sendo emitidos das localizações de fonte ao invés das localizações de saída dos alto-falantes físicos (as localizações de fonte e as localizações de saída são relativas ao ouvinte). Por exemplo, no caso em que M = 2 e N > 3, um virtualizador downmixa os N sinais de entrada para reprodução estéreo. Em outro exemplo no qual N = M = 2, os sinais de entrada são indicativos de som de duas localizações de fonte traseira (atrás da cabeça do ouvinte), e um virtualizador gera dois sinais de áudio de saída para reprodução por alto-falantes estéreos posicionados na frente do ouvinte de modo que o ouvinte percebe os sinais reproduzidos como emitindo das localizações de fonte (atrás da cabeça do ouvinte) ao invés das localizações de alto-falante (na frente da cabeça do ouvinte).
[0004] Através de toda esta descrição incluindo nas reivindicações, a expressão localização "traseira" (por exemplo, "localização de fonte traseira") denota uma localização atrás da cabeça de um ouvinte, e a expressão localização "dianteira" (por exemplo, "localização de saída dianteira") denota uma localização na frente da cabeça de um ouvinte. Similarmente, alto-falantes "dianteiros" denotam alto-falantes localizados na frente da cabeça de um ouvinte e alto-falantes "traseiros" denotam alto-falantes localizados atrás da cabeça de um ouvinte.
[0005] Através de toda esta descrição incluindo nas reivindicações, a expressão "sistema" é utilizada em um sentido amplo para denotar um dispositivo, um sistema, ou um subsistema. Por exemplo, um subsistema que implementa um virtualizador pode ser referido como um sistema virtualizador, e um sistema que inclui tal subsistema (por exemplo, um sistema que gera M sinais de saída em resposta a X + Y entradas, no qual o subsistema gera X das entradas e as outras Y entradas são recebidas de uma fonte externa) pode também ser referido como um sistema virtualizador.
[0006] Através de toda esta descrição incluindo nas reivindicações, a expressão "reprodução" de sinais por alto-falantes denota fazer com que os alto-falantes produzam um som em resposta aos sinais, incluindo executando qualquer amplificação requerida e/ou outro processamento dos sinais. O som surround virtual pode ajudar a criar a percepção que existem mais fontes de som do que existem alto-falantes físicos (por exemplo, fones de ouvido ou alto-falantes) tipicamente, pelo menos dois alto-falantes são requeridos para um ouvinte normal perceber o som reproduzido como se este estivesse emitindo de múltiplas fontes de som. Por exemplo, considere um virtualizador de som surround simples acoplado e configurado para receber um áudio de entrada de três fontes (esquerda, central e direita) e gerar um áudio de saída para dois alto- falantes físicos (posicionados simetricamente na frente de um ouvinte) em resposta ao áudio de entrada. Tal virtualizador aplica a entrada da fonte esquerda para o alto-falante esquerdo, aplica a entrada da fonte direita para o alto-falante direito, e divide a entrada da fonte central igualmente entre os alto-falantes esquerdo e direito. A saída do virtualizador que é indicativa da entrada da fonte central é comumente referida como um canal central "fantasma". Um ouvinte percebe o áudio de saída reproduzido como se este incluísse um canal central emitindo de um alto-falante central entre os alto-falantes esquerdo e direito, assim como canais esquerdo e direito emitindo dos alto-falantes esquerdo e direito.
[0007] Outro virtualizador de som surround convencional (mostrado na figura 1) é conhecido como um virtualizador de downmix "LoRo" esquerdo somente, direito somente. Este virtualizador está acoplado para receber cinco sinais de áudio de entrada: canais dianteiros esquerdo ("L"), central ("C") e direito ("R"), e canais traseiros surround esquerdo ("LS") e surround direito ("RS"). O virtualizador da figura 1 combina os sinais de entrada como indicado, para reprodução nos alto- falantes físicos esquerdo e direito (a serem posicionados na frente do ouvinte): o sinal central de entrada C é amplificado no amplificador G, e a saída amplificada do amplificador G é somada com os sinais de entrada L e LS para gerar a saída esquerda ("Lo") aplicada no alto- falante esquerdo e é somada com os sinais de entrada R e RS para gerar a saída direita ("Ro") aplicada no alto-falante direito.
[0008] Outro virtualizador de som surround convencional está mostrado na figura 2. Este virtualizador está acoplado para receber cinco sinais de áudio (canais dianteiros esquerdo ("L"), central ("C"), e direito ("R") que representam as fontes dianteiras L, C, e R, e canais traseiros surround esquerdo ("LS") e surround direito ("RS") que representam as fontes traseiras LS e RS) e configurado para gerar um canal central fantasma dividindo a entrada do canal central C igualmente entre os sinais esquerdo e direito para acionar um par de alto-falantes dianteiros físicos (posicionados na frente de um ouvinte). O virtualizador da figura 2 está também configurado para utilizar um subsistema virtualizador 10 em um esforço para gerar as saídas esquerda e direita LS' e RS' úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como um som traseiro de entrada reproduzido (surround) que emite de fontes RS e LS atrás do ouvinte. Mais especificamente, o subsistema virtualizador 10 está configurado para gerar os sinais de áudio de saída LS' e RS' em resposta a entradas de canal traseiro (LS e RS) incluídos transformando as entradas de acordo com uma função de transferência relativa à cabeça (HRTF). Implementando uma HRTF apropriada, o subsistema virtualizador 10 pode gerar um par de sinais de saída que podem ser reproduzidos por dois alto-falantes físicos localizados na frente de um ouvinte de modo que o ouvinte perceba a saída dos alto-falantes como sendo emitida de um par de fontes posicionadas em qualquer uma de uma ampla variedade de posições (por exemplo, posições atrás da cabeça do ouvinte. O virtualizador da figura 2 também amplifica o sinal central de entrada C no amplificador G e, a saída amplificada do amplificador G é somada com o sinal L de entrada e LS' emitidos do subsistema 10 para gerar a saída esquerda ("L' ") para aplicação no alto-falante esquerdo, e é somada com o sinal R de entrada e RS' emitidos do subsistema 10 para gerar a saída direita ("R' ") para aplicação no alto-falante direito.
[0009] É convencional que os sistemas de surround virtual utilizem funções de transferência relativas à cabeça (HRTFs) para gerar os sinais de áudio que, quando reproduzidos por um par de alto-falantes físicos posicionados na frente de um ouvinte são percebidos nos tímpanos do ouvinte como um som de alto-falantes em qualquer uma de uma ampla variedade de posições (incluindo posições atrás do ouvinte). Uma desvantagem da utilização convencional de uma HRTF padrão (ou um conjunto de HRTFs padrão) para gerar os sinais de áudio para utilização por muitos ouvintes (por exemplo, o público geral) é que uma HRTF precisa para cada ouvinte específico deveria depender das características da cabeça do ouvinte. Assim, as HRTFs deveriam variar grandemente entre os ouvintes e uma única HRTF geralmente não será adequada para todos ou muitos ouvintes.
[00010] Se dois alto-falantes físicos (em oposição a fones de ouvido) forem utilizados para apresentar uma saída de áudio de virtualizador, um esforço deve ser feito para isolar o som do alto-falante esquerdo para o ouvido esquerdo, e do alto-falante direito para o ouvido direito. É convencional utilizar um cancelador de interferência cruzada para conseguir este isolamento. De modo a implementar o cancelamento de interferência cruzada é convencional que um virtualizador implemente um par de HRTFs (para cada fonte de som) para gerar saídas que, quando reproduzidas, são percebidas como emitindo da localização de fonte. Uma desvantagem do cancelamento de interferência cruzada tradicional é que o ouvinte deve permanecer em uma localização de "sweet spot" fixa para obter os benefícios do cancelamento. Usualmente, o sweet spot é uma posição na qual os alto-falantes estão em localizações simétricas com relação ao ouvinte, apesar de posições assimétricas também poderem ser possíveis.
[00011] Os virtualizadores podem ser implementados em uma ampla variedade de dispositivos de multimídia que contêm alto-falantes estéreos (televisões, PCs, docas de iPod), ou estão destinados para utilização com alto-falantes ou fones de ouvido estéreos.
[00012] Existe uma necessidade para um virtualizador com requisitos de baixa velocidade (por exemplo, baixo MIPS) e baixos requisitos de memória, e com desempenho sônico aperfeiçoado. As modalidades típicas da presente invenção obtêm um desempenho sônico aperfeiçoado com requisitos computacionais reduzidos pela utilização de uma topologia de filtro nova, simplificada.
[00013] Existe também uma necessidade para um virtualizador de som surround o qual enfatize as fontes virtualizadas (por exemplo, os canais traseiros de som surround virtualizados) na mistura determinada pela saída do virtualizador quando apropriado (por exemplo, quando as fontes virtualizadas são geradas em resposta a entradas de fonte traseira de baixo nível), enquanto evitando uma ênfase excessiva dos canais virtuais (por exemplo, evitando que os alto-falantes traseiros virtuais sejam percebidos como excessivamente altos). As modalidades da presente invenção aplicam uma compressão de faixa dinâmica durante a geração de canais de som surround virtualizados (por exemplo, canais traseiros virtualizados) para obter tal desempenho sônico aperfeiçoado durante a reprodução da saída de virtualizador. As modalidades típicas da presente invenção também aplicam uma decorrelação e um cancelamento de interferência cruzada para as fontes virtualizadas para prover um desempenho sônico aperfeiçoado (incluindo uma localização aperfeiçoada) durante a reprodução da saída de virtualizador.
BREVE DESCRIÇÃO DA INVENÇÃO
[00014] Em algumas modalidades, a invenção é um método e sistema de virtualização de som surround para gerar sinais de saída para reprodução por um par de alto-falantes físicos (por exemplo, fones de ouvido ou alto-falantes posicionados em localizações de saída) em resposta a um conjunto de N sinais de áudio de entrada (onde N é um número não menor do que dois), onde os sinais de áudio de entrada são indicativos de um som de múltiplas localizações de fonte que incluem pelo menos duas localizações traseiras. Tipicamente, N = 5 e os sinais de entrada são indicativos de som de três localizações dianteiras (fontes dianteiras esquerda, central, e direita) e duas localizações traseiras (fontes traseiras surround esquerdo e surround direito).
[00015] Em modalidades típicas, o virtualizador inventivo gera sinais de saída esquerdo e direito (L' e R') para acionar um par de alto-falantes dianteiros em resposta a cinco sinais de áudio de entrada: um canal esquerdo ("L") indicativo de som de uma fonte dianteira esquerda, um canal central ("C") indicativo de som de uma fonte dianteira central, um canal direito ("R") indicativo de som de uma fonte dianteira direita, um canal surround esquerdo ("LS") indicativo de som de uma fonte traseira esquerda, e um canal surround direito ("RS") indicativo de som de uma fonte dianteira direita. O virtualizador gera um canal central fantasma dividindo a entrada de canal central entre os sinais de saída esquerdo e direito. O virtualizador inclui um subsistema virtualizador de canal traseiro (surround) configurado para gerar as saídas surround esquerda e direita (LS' e RS') úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes RS e LS atrás do ouvinte. O subsistema virtualizador de surround está configurado para gerar as saídas LS' e RS' em resposta às entradas de canal traseiro (LS e RS) transformando as entradas de canal traseiro de acordo com a função de transferência relativa à cabeça (HRTF). O virtualizador combina as saídas LS' e RS' com as entradas de canal dianteiro L, C, e R para gerar os sinais de saída esquerdo e direito (L' e R'). Quando as saídas L' e R' são reproduzidas pelos alto-falantes dianteiros, o ouvinte percebe o som resultante como emitindo de fontes traseiras RS e LS assim como de fontes dianteiras L, C, e R.
[00016] Em uma classe de modalidades, o método e sistema inventivo implementam um modelo de HRTF que é simples de implementar e personalizável para qualquer localização de fonte e localização de alto-falante físico em relação a cada ouvido do ouvinte. De preferência, o modelo de HRTF é utilizado para calcular uma HRTF generalizada empregada para gerar as saídas surround esquerda e direita (LS' e RS') em resposta a entradas de canal traseiro (LS e RS), e também calcular as HRTFs que são empregadas para executar o cancelamento de interferência cruzada sobre as saídas de surround esquerdo e direito (LS' e RS') para um dado conjunto de localizações de alto-falantes físicos.
[00017] Para assegurar que os canais virtuais (por exemplo, os canais traseiros virtuais de surround esquerdo e surround direito) sejam bem ouvidos na presença de outros canais por alguém que escuta a saída de virtualizador reproduzida, o virtualizador executa uma compressão de faixa dinâmica sobre as entradas de fonte traseira (durante a geração em resposta a entradas de fonte traseira de sinais de surround úteis para acionar os alto-falantes dianteiros para emitir som que um ouvinte percebe como emitindo de localizações de fonte traseira) para ajudar a normalizar a intensidade percebida dos canais traseiros virtuais.
[00018] Aqui, a execução de compressão de faixa dinâmica "sobre" as entradas (durante a geração de sinais de surround) é utilizada em um sentido amplo para denotar executar uma compressão de faixa dinâmica diretamente sobre as entradas ou sobre versões processadas das entradas (por exemplo, sobre versões das entradas que sofreram uma decorrelação ou outra filtragem). Um processamento adicional sobre os sinais que sofreram uma compressão de faixa dinâmica pode ser requerido para gerar os sinais de surround, ou os sinais de surround podem ser a saída do meio de compressão de faixa dinâmica. Mais geralmente, a expressão executar uma operação (por exemplo, filtragem, decorrelação, ou transformação de acordo com uma HRTF) "sobre" as entradas (durante a geração de entradas de sinais de surround) é aqui utilizada, incluindo nas reivindicações, em um sentido amplo para denotar executar a operação diretamente sobre as entradas ou sobre as versões processadas das entradas.
[00019] A compressão de faixa dinâmica é de preferência executada por uma amplificação não linear das entradas de fonte traseira (surround) ou suas versões parcialmente processadas (por exemplo, uma amplificação das entradas de fonte traseira em um modo não linear em relação aos sinais de canal dianteiro). De preferência, em resposta a sinais de surround de entrada (indicativos de som de fontes traseiras de surround esquerdo e de surround direito) que estão abaixo de um limite predeterminado e em resposta a sinais dianteiros de entrada, os sinais de surround de entrada são amplificados em relação aos sinais dianteiros (mais ganho é aplicado aos sinais de surround do que aos sinais dianteiros) antes que estes sofram uma decorrelação e uma transformação de acordo com uma função de transferência relativa à cabeça. De preferência, os sinais de surround de entrada (ou as suas versões parcialmente processadas) são amplificados em um modo não linear dependendo da quantidade pela qual os sinais de surround de entrada estão abaixo do limite. Quando os sinais de surround de entrada estão acima do limite, estes tipicamente não são amplificados (opcionalmente os sinais dianteiros de entrada e os sinais de surround de entrada são amplificados pela mesma quantidade quando os sinais de surround de entrada estão acima do limite, por exemplo, por uma quantidade que depende de uma razão de compressão predeterminada). A compressão de faixa dinâmica de acordo com a invenção pode resultar em uma amplificação dos canais traseiros de entrada por uns poucos decibéis em relação aos canais dianteiros para ajudar a destacar os canais traseiros virtuais na mistura quando isto é desejável (isto é, quando os sinais de canal traseiro de entrada estão abaixo do limite) sem uma amplificação excessiva dos canais traseiros virtuais quando os sinais de canal traseiro de entrada estão acima do limite (para evitar que os alto-falantes traseiros virtuais sejam percebidos como excessivamente altos).
[00020] Em uma classe de modalidades, o método e sistema inventivo implementa a decorrelação de fontes virtualizadas para prover uma localização aperfeiçoada enquanto evitando problemas devido à simetria de alto-falantes físicos quando apresentando os alto-falantes virtuais. Sem tal decorrelação, se os alto-falantes físicos (por exemplo, os alto-falantes na frente do ouvinte) forem simétricos com relação ao ouvinte (por exemplo, quando o ouvinte está em um sweet spot), as localizações dos alto-falantes virtuais percebidos são também simétricas com relação ao ouvinte. Neste caso, se ambos os canais traseiros virtuais (indicativos de entradas de fonte traseira de surround esquerdo e de surround direito) forem idênticos então os sinais reproduzidos em ambos os ouvidos são também idênticos e as fontes traseiras não são mais virtualizadas (o ouvinte não percebe o som reproduzido como emitindo de trás do ouvinte). Também, sem a decorrelação e com uma colocação de alto-falantes físicos simétrica na frente do ouvinte, a saída reproduzida de um virtualizador em resposta a uma entrada de fonte traseira varrida (entrada indicativa de som varrido de uma fonte traseira de surround esquerdo para uma fonte traseira de surround direito) parecerá vir diretamente à frente durante o meio da varredura. A classe de modalidades notada evita estes problemas (comumente referidos como "colapso de imagem") implementando uma decorrelação de sinais de entrada de fonte traseira (surround). A decorrelação das entradas de fonte traseira quando estas são idênticas uma à outra elimina a semelhança entre estas e evita o colapso de imagem.
[00021] Em modalidades típicas, o sistema inventivo é ou inclui um processador de uso geral ou especial programado com um software (ou firmware) e/ou de outro modo configurado para executar uma modalidade do método inventivo. Em algumas modalidades, o sistema de virtualizador inventivo é um processador de uso geral, acoplado para receber os dados de entrada indicativos de múltiplos canais de entrada de áudio e programado (com um software apropriado) para gerar os dados de saída indicativos de sinais de saída (para reprodução por um par de alto-falantes físicos) em resposta aos dados de entrada executando uma modalidade do método inventivo. Em outras modalidades, o sistema virtualizador inventivo é implementado configurando apropriadamente (por exemplo, programando) um processador de sinal digital (DSP) de áudio configurável. O DSP de áudio pode ser um DSP de áudio convencional que é configurável (por exemplo, programável por um software ou firmware apropriado ou de outro modo configurável em resposta a dados de controle) para executar qualquer uma de uma variedade de operações sobre o áudio de entrada. Em operação, um DSP de áudio que foi configurado para executar uma virtualização de som surround de acordo com a invenção está acoplado para receber múltiplos sinais de entrada de áudio (indicativos de som de múltiplas localizações de fonte incluindo pelo menos duas localizações traseiras), e o DSP tipicamente executa uma variedade de operações sobre o áudio de entrada além de (assim como) virtualização. De acordo com várias modalidades da invenção, um DSP de áudio é operável para executar uma modalidade do método inventivo após ser configurado (por exemplo, programado) para gerar os sinais de áudio de saída (para reprodução por um par de alto-falantes físicos) em resposta aos sinais de áudio de entrada executando o método sobre os sinais de áudio de entrada.
[00022] Em algumas modalidades, a invenção é um método de virtualização de som para gerar sinais de saída para reprodução por um par de alto-falantes físicos em localizações físicas em relação a um ouvinte, onde nenhuma das localizações físicas é uma localização em um conjunto de pelo menos duas localizações de fonte traseira, o dito método incluindo as etapas de: (a) em resposta a sinais de áudio de entrada indicativos de som das localizações de fonte traseira, gerar os sinais de surround úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das ditas localizações de fonte traseira, incluindo executando uma compressão de faixa dinâmica sobre os sinais de áudio de entrada; e (b) gerar os sinais de saída em resposta aos sinais de surround e pelo menos um outro sinal de áudio de entrada, onde cada dito outro sinal de áudio de entrada é indicativo de som de uma respectiva localização de fonte dianteira, de modo que os sinais de saída são úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira e de cada dita localização de fonte dianteira.
[00023] Tipicamente, os alto-falantes físicos são alto-falantes dianteiros, as localizações físicas estão na frente do ouvinte, e a etapa (a) inclui a etapa de gerar os sinais de surround esquerdo e direito (LS' e RS') em resposta aos sinais de entrada traseiros esquerdo e direito (LS e RS), onde os sinais de surround esquerdo e direito (LS' e RS') são úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes traseira esquerda e traseira direita atrás do ouvinte. Os alto-falantes físicos alternativamente poderiam ser fones de ouvido, ou alto-falantes posicionados em outra do que nas localizações de fonte traseira (por exemplo, alto-falantes posicionados à esquerda e à direita do ouvinte). De preferência, os alto- falantes físicos são alto-falantes dianteiros, as localizações físicas estão na frente do ouvinte, a etapa (a) inclui a etapa de gerar os sinais de surround esquerdo e direito (LS' e RS') úteis para acionar os alto- falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes traseira esquerda e traseira direita atrás do ouvinte, e a etapa (b) inclui a etapa de gerar os sinais de saída em resposta a: os sinais de surround, um sinal de áudio de entrada esquerdo indicativo de som de uma localização de fonte dianteira esquerda, um sinal de áudio de entrada direito indicativo de som de uma localização de fonte dianteira direita, e um sinal de áudio de entrada central indicativo de som de uma localização de fonte dianteira central. De preferência, a etapa (b) inclui uma etapa de gerar um canal central fantasma em resposta ao sinal de áudio de entrada central.
[00024] De preferência, a compressão de faixa dinâmica ajuda a normalizar a intensidade percebida dos canais traseiros virtuais. Também de preferência, a compressão de faixa dinâmica é executada pela amplificação dos sinais de áudio de entrada em um modo não linear em relação a cada dito outro sinal de áudio de entrada. De preferência, a etapa (a) inclui uma etapa de executar a compressão de faixa dinâmica incluindo amplificar cada um dos sinais de áudio de entrada que tem um nível (por exemplo, um nível médio sobre uma janela de tempo) abaixo de um limite predeterminado em um modo não linear dependendo da quantidade pela qual o nível está abaixo do limite.
[00025] De preferência, a etapa (a) inclui uma etapa de gerar os sinais de surround incluindo transformando os sinais de áudio de entrada de acordo com uma função de transferência relativa à cabeça (HRTF), e/ou executando uma decorrelação sobre os sinais de áudio de entrada, e/ou executando um cancelamento de interferência cruzada sobre os sinais de áudio de entrada. Aqui, a expressão "executando" uma operação (por exemplo, uma transformação de acordo com uma HRTF, ou compressão de faixa dinâmica, ou uma decorrelação) "sobre" os sinais de áudio de entrada é utilizada em um sentido amplo para denotar executar a operação sobre os sinais de áudio de entrada ou sobre versões processadas do sinal de áudio de entrada (por exemplo, sobre as versões dos sinais de áudio de entrada que sofreram uma decorrelação ou outra filtragem).
[00026] Os aspectos da invenção incluem um sistema virtualizador configurado (por exemplo, programado) para executar qualquer modalidade do método inventivo, e um meio legível por computador (por exemplo, um disco) o qual armazena um código para implementar qualquer modalidade do método inventivo.
BREVE DESCRIÇÃO DOS DESENHOS
[00027] Figura 1 é um diagrama de blocos de um sistema virtualizador de som surround convencional.
[00028] Figura 2 é um diagrama de blocos de outro sistema virtualizador de som surround convencional.
[00029] Figura 3 é um diagrama de blocos de uma modalidade do sistema virtualizador de som surround inventivo.
[00030] Figura 4 é um diagrama de blocos de uma implementação do estágio 41 do subsistema virtualizador 40 da figura 3.
[00031] Figura 5 é um diagrama de blocos de uma implementação do estágio 42 do subsistema virtualizador 40 da figura 3.
[00032] Figura 6 é um diagrama de blocos de uma implementação de um circuito de HRTF do estágio 43 do subsistema virtualizador 40.
[00033] Figura 7 é um diagrama de blocos de uma implementação do estágio 44 do subsistema virtualizador 40.
[00034] Figura 8 é um diagrama de blocos detalhado de uma implementação de limitador 32 do sistema virtualizador da figura 3.
[00035] Figura 9 é um diagrama de blocos de um processador de sinal digital (DSP) de áudio que é uma modalidade do sistema virtualizador de som surround.
DESCRIÇÃO DETALHADA DAS MODALIDADES PREFERIDAS
[00036] Muitas modalidades da presente invenção são tecnologicamente possíveis. Será aparente para aqueles versados na técnica da presente descrição como implementá-las. As modalidades do sistema, método, e meio inventivo serão descritas com referência às figuras 3-9.
[00037] Em algumas modalidades, a invenção é um método de virtualização de som para gerar sinais de saída (por exemplo, os sinais L' e R' da figura 3) para reprodução por um par de alto-falantes físicos em localizações físicas relativas a um ouvinte, onde nenhuma das localizações físicas é uma localização em um conjunto de pelo menos duas localizações de fonte traseira, o dito método incluindo as etapas de: (a) em resposta a sinais de áudio de entrada (por exemplo, sinais de entrada traseira esquerdo e direito, LS e RS, da figura 3) indicativos de som das localizações de fonte traseira, gerar os sinais de surround (por exemplo, os sinais de surround LS' e RS', da figura 3) úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das ditas localizações de fonte traseira, incluindo executando uma compressão de faixa dinâmica sobre os sinais de áudio de entrada; e (b) gerar os sinais de saída em resposta aos sinais de surround (por exemplo, os sinais de surround LS' e RS', da figura 3) e pelo menos um outro sinal de áudio de entrada (por exemplo, sinais de entrada C, L, e R, da figura 3), onde cada dito outro sinal de áudio de entrada é indicativo de som de uma respectiva localização de fonte dianteira, de modo que os sinais de saída são úteis para acionar os alto- falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira e de cada dita localização de fonte dianteira.
[00038] Tipicamente, os alto-falantes físicos são alto-falantes dianteiros, as localizações físicas estão na frente do ouvinte, e a etapa (a) inclui a etapa de gerar os sinais de surround esquerdo e direito (por exemplo, os sinais LS' e RS' da figura 3) em resposta aos sinais de entrada traseiros esquerdo e direito (por exemplo, os sinais LS e RS da figura 3), onde os sinais de surround esquerdo e direito são úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes traseira esquerda e traseira direita atrás do ouvinte. Os alto-falantes físicos alternativamente poderiam ser fones de ouvido, ou alto-falantes posicionados em outra do que nas localizações de fonte traseira (por exemplo, alto-falantes posicionados à esquerda e à direita do ouvinte). De preferência, os alto-falantes físicos são alto-falantes dianteiros, e as localizações físicas estão na frente do ouvinte, a etapa (a) inclui a etapa de gerar os sinais de surround esquerdo e direito (por exemplo, os sinais LS' e RS' da figura 3) úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo de fontes traseira esquerda e traseira direita atrás do ouvinte, e etapa (b) inclui a etapa de gerar os sinais de saída em resposta a: os sinais de surround, um sinal de áudio de entrada esquerdo indicativo de som de uma localização de fonte dianteira esquerda, um sinal de áudio de entrada direito indicativo de som de uma localização de fonte dianteira direita, e um sinal de áudio de entrada central indicativo de som de uma localização de fonte dianteira central. De preferência, a etapa (b) inclui uma etapa de gerar um canal central fantasma em resposta ao sinal de áudio de entrada central.
[00039] Em algumas modalidades, a invenção é um método e sistema de virtualização de som surround para gerar sinais de saída para reprodução por um par de alto-falantes físicos (por exemplo, fones de ouvido ou alto-falantes posicionados em localizações de saída) em resposta a um conjunto de N sinais de áudio de entrada (onde N é um número não menor do que dois), onde os sinais de áudio de entrada são indicativos de um som de múltiplas localizações de fonte que incluem pelo menos duas localizações traseiras. Tipicamente, N = 5 e os sinais de entrada são indicativos de som de três localizações dianteiras (fontes dianteiras esquerda, central, e direita) e duas localizações traseiras (fontes traseiras surround esquerdo e surround direito).
[00040] A figura 3 é um diagrama de blocos de uma modalidade do sistema virtualizador inventivo. O virtualizador da figura 3 está configurado para gerar os sinais de saída esquerdo e direito (L' e R') para acionar um par de alto-falantes dianteiros (ou outros alto-falantes) em resposta a cinco sinais de áudio de entrada: um canal esquerdo ("L") indicativo de som de uma fonte dianteira esquerda, um canal central ("C") indicativo de som de uma fonte dianteira central, um canal direito ("R") indicativo de som de uma fonte dianteira direita, um canal surround esquerdo ("LS") indicativo de som de uma fonte traseira esquerda, e um canal surround direito ("RS") indicativo de som de uma fonte dianteira direita RS. O virtualizador gera um canal central fantasma (e combina-o com os canais dianteiros esquerdo e direito L e R e os canais traseiros virtual esquerdo e virtual direito) amplificando a entrada central C no amplificador G, somando a saída amplificada do amplificador G com a entrada L e o sinal de saída de surround esquerdo LS' (a ser abaixo descrito) no elemento de somatório 30 para gerar uma saída esquerda não limitada, e somar a saída amplificada do amplificador G com a entrada R e o sinal de saída de surround direito RS' (a ser abaixo descrito) no elemento de somatório 31 para gerar uma saída esquerda não limitada.
[00041] As saídas esquerda e direita não limitadas são processadas pelo limitador 32 para evitar a saturação. Em resposta à saída esquerda não limitada, o limitador 32 gera a saída esquerda (L') que é aplicada no alto-falante dianteiro esquerdo. Em resposta à saída direita não limitada, o limitador 32 gera a saída direita (R') que é aplicada no alto-falante dianteiro direito. Quando as saídas L' e R' são reproduzidas pelos alto- falantes dianteiros, o ouvinte percebe o som resultante como emitindo das fontes traseiras RS e LS assim como das fontes dianteiras L, C, e R.
[00042] O subsistema virtualizador de canal traseiro (surround) 40 do sistema da figura 3 gera os sinais de saída de surround esquerdo e direito LS' e RS' úteis para acionar os alto-falantes dianteiros para emitir um som que o ouvinte percebe como emitindo da fonte traseira direita RS e da fonte traseira esquerda LS atrás do ouvinte. O subsistema virtualizador 40 inclui um estágio de compressão de faixa dinâmica 41, um estágio de decorrelação 42, um estágio de modelo binaural (estágio de HRTF) 43, e um estágio de cancelamento de interferência cruzada 44 conectados como mostrado. O subsistema virtualizador 40 gera os sinais de saída LS' e RS' em resposta a entradas de canal traseiro (LS e RS) executando uma compressão de faixa dinâmica sobre as entradas LS e RS no estágio 41, decorrelacionando a saída do estágio 41 no estágio 42, transformando a saída do estágio 42 de acordo com uma função de transferência relativa à cabeça (HRTF) no estágio 43, e executando um cancelamento de interferência cruzada sobre a saída do estágio 43 no estágio 44 o qual emite os sinais LS' e RS'.
[00043] Em modalidades da invenção nas quais os alto-falantes físicos estão implementados como fones de ouvido, o cancelamento de interferência cruzada tipicamente não é requerido. Tais modalidades podem ser implementadas por variações no sistema da figura 3 nos quais o estágio 44 está omitido.
[00044] O estágio de HRTF 43 aplica uma HRTF que compreende duas funções de transferência HRTFipsi(t) e HRTFcontra(t) na saída do estágio 42 como segue. Em resposta à entrada traseira esquerda decorrelacionada L(t) do estágio 42 (identificada como "LS2" na figura 5), o estágio 43 gera os sinais de áudio XLL(t) e XLR(t) aplicando as funções de transferência como segue: HRTFipsi(t)L(t) = XLL(t), onde XLL(t) é o som ouvido no (incidente no) ouvido esquerdo do ouvinte em resposta à entrada L(t), e HRTFcontra(t)L(t) = XLR(t), onde XLR(t) é o som ouvido no (incidente no) ouvido direito do ouvinte em resposta à entrada L(t). Similarmente, em resposta à entrada traseira direita decorrelacionada R(t) do estágio 42 (identificada como "RS2" na figura 5), o estágio 43 gera os sinais de áudio XRL(t) e XRR(t) aplicando as funções de transferência como segue: HRTFipsi(t)R(t) = XRL(t), onde XRL(t) é o som ouvido no ouvido esquerdo do ouvinte em resposta à entrada R(t), e HRTFcontra(t)R(t) = XRR(t), onde XRR(t) é o som ouvido no ouvido direito do ouvinte em resposta à entrada R(t). Assim, HRTFipsi(t) é um filtro ipsilateral para o ouvido mais próximo do alto-falante (o qual no estágio 43 é um alto-falante virtual), e HRTFcontra(t) é um filtro contralateral para o ouvido mais distante do alto-falante (o qual no estágio 43 é também um alto-falante virtual). O estágio 43 aplica a HRTFipsi a L(t) para gerar um som a ser emitido do alto-falante dianteiro esquerdo e percebido como um áudio L(t) de um alto-falante traseiro esquerdo virtual no ouvido esquerdo, e aplica a HRTFcontra a L(t) para gerar um som a ser emitido do alto-falante dianteiro direito e percebido como um áudio L(t) do alto-falante traseiro esquerdo virtual no ouvido direito. O estágio 43 aplica a HRTFipsi a R(t) para gerar um som a ser emitido do alto-falante dianteiro direito e percebido como R(t) de um alto-falante traseiro direito virtual no ouvido direito, e aplica a HRTFcontra a R(t) para gerar um som a ser emitido do alto-falante dianteiro esquerdo e R(t) do alto-falante traseiro direito virtual no ouvido esquerdo.
[00045] De preferência, o estágio de HRTF 43 implementa um modelo de HRTF que é simples de implementar e personalizável para qualquer localização de fonte (e opcionalmente também qualquer localização de alto-falante físico) em relação a cada ouvido do ouvinte. Por exemplo, o estágio 43 pode implementar um modelo de HRTF do tipo descrito em Brown, P. e Duda, R., "A Structural Model for Binaural Sound Synthesis", IEEE Transactions on Speech and Audio Processing, Setembro 1998, Vol. 6, No 5, pp. 476-488. Apesar deste modelo não possuir algumas características sutis de uma HRTF realmente medida, este tem diversas vantagens importantes incluindo que é simples de implementar, e personalizável para qualquer localização e assim mais universal do que uma HRTF medida. Em implementações típicas o mesmo modelo de HRTF empregado para calcular as funções de transferência generalizadas HRTFipsi e HRTFcontra aplicadas pelo estágio 43 é também empregado para calcular as funções de transferência HRTFITF e HRTFEQF (a serem abaixo descritas) aplicadas pelo estágio 44 para executar o cancelamento de interferência cruzada nas saídas do estágio 43 para um dado conjunto de localizações de alto-falantes físicos. A HRTF aplicada pelo estágio 43 assume ângulos específicos dos alto-falantes traseiros virtuais; as HRTFs aplicadas pelo estágio 44 assumem ângulos específicos dos alto-falantes dianteiros físicos relativos ao ouvinte.
[00046] O estágio 41 implementa uma compressão de faixa dinâmica para assegurar que os canais traseiros surround esquerdo e surround direito sejam bem ouvidos na presença de outros canais por alguém que escuta a saída reproduzida do virtualizador da figura 3. O estágio 41 ajuda a destacar os canais virtuais de baixo nível que seriam normalmente mascarados pelos outros canais, de modo que o conteúdo de som surround traseiro é ouvido mais frequentemente e mais confiavelmente do que sem a compressão de faixa dinâmica. O estágio 41 ajuda a normalizar a intensidade percebida dos canais traseiros virtuais amplificando as entradas de fonte traseira (surround) LS e RS em um modo não linear em relação aos sinais de entrada de canal dianteiro L, R, e C. Mais especificamente, em resposta à determinação que um sinal de surround de entrada LS está abaixo de um limite predeterminado, o sinal de entrada LS é amplificado (não linearmente) em relação aos sinais de entrada de canal dianteiro (mais ganho é aplicado ao sinal LS do que aos sinais de entrada de canal dianteiro), e em resposta à determinação que a entrada RS está abaixo do limite predeterminado, a entrada RS é amplificada (não linearmente) em relação aos sinais de entrada de canal dianteiro (mais ganho é aplicado ao sinal RS do que aos sinais de entrada de canal dianteiro). De preferência, os sinais de entrada LS e RS abaixo do limite são amplificados em um modo não linear dependendo da quantidade (se existir) pela qual cada um está abaixo do limite. A saída do estágio 41 então sofre uma decorrelação no estágio 42.
[00047] Quando qualquer um dos sinais de entrada LS e RS está acima do limite, este não é amplificado mais do que são os sinais dianteiros de entrada. Ao invés, o estágio 41 amplifica cada um dos sinais LS e RS que está acima do limite por uma quantidade que depende de uma razão de compressão predeterminada a qual é tipicamente a mesma razão de compressão de acordo com a qual os sinais dianteiros de entrada são amplificados (pelo amplificador G e outros meios de amplificação não mostrados). Onde a razão de compressão é N:1, o nível de sinal amplificado em dB é N • I, onde I é o nível de sinal de entrada em dB. Uma implementação de banda larga do estágio 41 (para amplificar todos, ou uma ampla faixa, dos componentes de frequência de entradas LS e RS) é típica, mas implementações de múltiplas bandas (para amplificar somente os componentes de frequências das entradas em bandas de frequência específica, ou amplificar os componentes de frequência das entradas em diferentes bandas de frequência diferentemente) poderiam alternativamente ser empregadas. A razão de compressão e o limite são ajustados em um modo que será aparente para aqueles versados na técnica, de modo que o estágio 41 torna um conteúdo de som surround de baixo nível, típico, claramente audível (na mistura determinada pela saída do virtualizador da figura 3).
[00048] A figura 4 é um diagrama de blocos de uma implementação típica do estágio 41, que compreende um elemento de determinação de potência RMS 70, um elemento de determinação de uniformização 71, um elemento de cálculo de ganho 72, e elementos de amplificação 73 e 74, conectados como mostrado. Nesta implementação, o nível médio (média de potência RMS sobre um intervalo de tempo, isto é, sobre uma janela de tempo predeterminada) de cada LS e RS de entrada é determinado no elemento 70, e a uniformidade da resposta do estágio 41 (a rapidez com a qual o elemento de cálculo de ganho 72 muda o ganho a ser aplicado pelos amplificadores 73 e 74 a cada entrada em resposta a cada aumento ou diminuição mo nível médio de cada entrada) é determinada pelo elemento 71 em resposta aos níveis médios dos sinais de entrada e ao ganho a ser aplicado a cada entrada. Um tempo de ataque típico (uma constante de tempo para resposta para um aumento de nível de entrada) é de 1 ms, e um tempo de liberação típico (uma constante de tempo para resposta para uma diminuição de nível de entrada) é de 250 ms. O elemento de cálculo de ganho 72 determina a quantidade de ganho a ser aplicada pelo amplificador 73 no LS de entrada (para gerar a saída amplificada LS1) dependendo da quantidade pela qual o nível médio corrente de LS está acima ou abaixo do limite (e dos tempos de ataque e liberação correntes) e a quantidade de ganho a ser aplicada pelo amplificador 74 ao RS de entrada (para gerar a saída amplificada RS1) dependendo da quantidade pela qual o nível médio corrente de RS está acima ou abaixo do limite (e dos tempos de ataque e liberação correntes). Um limite típico é de 50% da escala total, e uma razão de compressão típica é de 2:1 para amplificação de cada entrada quanto o seu nível está acima do limite.
[00049] Em implementações típicas, a compressão de faixa dinâmica no estágio 41 amplifica os canais de entrada traseiros por uns poucos decibéis em relação aos canais de entrada dianteiros para ajudar a enfatizar os canais traseiros virtuais na mistura quando os seus níveis são suficientemente baixos para tornar tal ênfase desejável (isto é, quando os sinais de entrada traseiros estão abaixo do limite predeterminado) enquanto evitando uma amplificação excessiva dos canais traseiros virtuais quando os sinais de canal traseiro de entrada estão acima do limite (para evitar que os alto-falantes traseiro virtuais sejam percebidos como excessivamente altos).
[00050] O estágio 42 decorrelaciona as saídas esquerda e direita do estágio 41 para prover uma localização aperfeiçoada e evitar problemas que poderiam de outro modo ocorrer devido à simetria (com relação ao ouvinte) dos alto-falantes físicos que apresentam os canais virtuais determinados pela saída do virtualizador da figura 3. Sem tal decorrelação, se os alto-falantes físicos (na frente do ouvinte) estiverem posicionados simetricamente com relação ao ouvinte, as localizações de alto-falante virtual são também simétricas com relação ao ouvinte. Com tal simetria e sem decorrelação, se ambos os canais traseiros virtuais (indicativos de entradas traseiras LS e RS) forem idênticos, os sinais reproduzidos em ambos os ouvidos são também idênticos e as fontes traseiras não são mais virtualizadas (o ouvinte não percebe o som reproduzido como emitindo de trás do ouvinte). Também com tal simetria e sem decorrelação, a saída reproduzida de um virtualizador em resposta a uma entrada de fonte traseira varrida (entrada indicativa de som varrido de uma fonte traseira de surround esquerdo para uma fonte traseira de surround direito) parecerá vir diretamente à frente (entre os alto-falantes dianteiros físicos) durante o meio da varredura. O estágio 42 evita estes problemas (comumente referidos como "colapso de imagem") decorrelacionando as saídas esquerda e direita do estágio 41 quando estas são idênticas uma à outra, para eliminar a semelhança entre estas e por meio disto evitando o colapso de imagem.
[00051] No estágio de decorrelação 42, decorrelatores complementares são empregados para decorrelacionar as duas saídas do estágio 41 (um decorrelator para cada um dos sinais LS1 e RS1 do estágio 41). Cada decorrelator está de preferência implementado como um reverberador de passagem total de Schroeder do tipo descrito em Schroeder, M.R., "Natural Sounding Artificial Reverberation", Journal of the Audio Engineering Society, Julho 1962, Vol. 10, No 3, pp.219-223. Quando somente um canal de entrada está ativo, o estágio 42 introduz uma mudança de timbre notável à sua entrada. Quando ambos os canais estão ativos, e a fonte de cada canal é idêntica, o estágio 42 introduz uma mudança de timbre, mas o efeito é que a imagem estéreo é agora ampla, ao invés de varrida central.
[00052] A figura 5 é um diagrama de blocos de uma implementação típica do estágio 42 como um par de reverberadores de passagem total de Schroeder. Um reverberador da implementação da figura 5 do estágio 42 é um loop de retorno que inclui o elemento de somatório de entrada 80 que tem uma entrada acoplada para receber o sinal de entrada esquerdo LS1 do estágio 41 e cuja saída é aplicada ao elemento de retardo 83 o qual aplica um retardo T a este, e a um amplificador 81 o qual aplica um ganho G a este. A saída deste amplificador é aplicada no elemento de somatório de saída 82 (para o qual a saída do elemento de retardo 83 é também aplicada) o qual emite o sinal esquerdo LS2. A saída do elemento de retardo 83 é aplicada a outro amplificador 84 o qual aplica um ganho G - 1 a este, e a saída do amplificador 84 é aplicada na segunda entrada do elemento de somatório de entrada 80. O outro reverberador da implementação da figura 5 do estágio 42 é um loop de retorno que inclui o elemento de somatório de entrada 90 que tem uma entrada acoplada para receber o sinal de entrada direito RS1 do estágio 41 e cuja saída é aplicada ao elemento de retardo 93 o qual aplica um retardo T a este, e a um amplificador 91 o qual aplica um ganho -G a este. A saída do amplificador 91 é aplicada no elemento de somatório de saída 92 (para o qual a saída do elemento de retardo 93 é também aplicada) o qual emite o sinal direito RS2 (o sinal RS2 é decorrelacionado do sinal LS2). A saída do elemento de retardo 93 é aplicada a outro amplificador 94 o qual aplica um ganho 1 - G a este, e a saída do amplificador 94 é aplicada na segunda entrada do elemento de somatório de entrada 90. Um valor típico do parâmetro de ganho é G = 0,5 e um valor típico do tempo de retardo t é 2 ms.
[00053] Em outras implementações, o estágio 42 é um decorrelator de um tipo outro que descrito com referência à figura 5.
[00054] Em uma implementação típica, o estágio de modelo binaural 43 inclui dois circuitos de HRTF do tipo mostrado na figura 6: um acoplado para filtrar o sinal esquerdo LS2 do estágio 42; o outro para filtrar o sinal direito RS2 do estágio 42. Como é aparente da figura 6, cada circuito de HRTF implementa duas funções de transferência HRTFipsi(z) e HRTFcontra(z), na saída do estágio 42 como segue (onde "z" é um valor de domínio de tempo discreto do sinal que está sendo filtrado). Cada uma das funções de transferência HRTFipsi(z) e HRTFcontra(z) implementa um modelo de cabeça esférico de um polo, um zero simples de um tipo descrito no documento de Brown, et. al., acima citado, "A Structural Model for Binaural Sound Synthesis", IEEE Transactions on Speech and Audio Processing, Setembro 1998.
[00055] Mais especificamente, cada circuito de HRTF do estágio 43 (implementado como na figura 6) aplica duas funções de transferência HRTFipsi(z) ("Hipsi(z)") e HRTFcontra(z) ("Hcontra(z)"), a uma das saídas do estágio 42 (sinal rotulado "IN" na figura 6) no domínio de tempo discreto como segue. Em resposta à entrada traseira esquerda L2(z) do estágio 42, um circuito de HRTF gera os sinais de áudio XLL(z) ("OUTipsi" na figura 6) e XLR(z) ("OUTcontra" na figura 6) aplicando as funções de transferência como segue: HRTFipsi(z)L2(z) = XLL(z) onde XLL(z) é o som ouvido no ouvido esquerdo do ouvinte em resposta à entrada L2(z), e HRTFcontra(z)L2(z) = XLR(z), onde XLR(z) é o som ouvido no (ouvido direito do ouvinte em resposta à entrada L2(z). Em resposta à entrada traseira direita R2(z) do estágio 42, o outro circuito de HRTF do estágio 43 (implementado como na figura 6) gera os sinais de áudio XRL(z) e XRR(z) aplicando as funções de transferência como segue: HRTFcontra(z)R2(z) = XRL(z), onde XRL(z) é o som ouvido no ouvido esquerdo do ouvinte em resposta à entrada R2(z) e HRTFipsi(z)R2(z) = XRR(z), onde XRR(z) é o som ouvido no ouvido direito do ouvinte em resposta à entrada R2(z). HRTFipsi(z) é um filtro ipsilateral para o ouvido mais próximo do alto- falante (o qual no estágio 43 é um alto-falante virtual), e HRTFcontra(z) é um filtro contralateral para o ouvido mais distante do alto-falante (o qual no estágio 43 é também um alto-falante virtual). Os alto-falantes virtuais estão dispostos a aproximadamente ± 90°. Os retardos de tempo z-n (implementado por cada elemento de retardo da figura 6 rotulado z-n) também corresponde a 90°, como é convencional.
[00056] O circuito de HRTF do estágio 43 (implementado como na figura 6) para aplicar a função de transferência HRTFipsi(z) inclui um elemento de retardo 103, elementos de ganho 101, 104, e 105 (para aplicar os ganhos bi0, bi1, e ai1, respectivamente abaixo definidos) e elementos de somatório 100 e 102 conectados como mostrado. O circuito de HRTF do estágio 43 (implementado como na figura 6) para aplicar a função de transferência HRTFcontra(z) inclui os elementos de retardo 106 e 113, os elementos de ganho 111, 114, e 115 (para aplicar os ganhos bc0, bc1, e ac1, respectivamente abaixo definidos) e os elementos de somatório 110 e 112; conectados como mostrado.
[00057] O retardo de tempo interaural (ITD) implementado pelo estágio 43 (implementado como na figura 6) é o retardo introduzido por cada elemento rotulado "z-n". O retardo de tempo interaural é derivado para o plano horizontal como segue:
Figure img0001
[00058] onde θ = ângulo de azimute, Φ = ângulo de elevação, a é o raio da cabeça do ouvinte, e c é a velocidade do som. Note que os ângulos na equação (1) são expressos em radianos (ao invés de graus) para o cálculo de ITD. Note também que θ = 0 radianos (0°) é diretamente à frente, e θ = π/2 radianos (90°) é diretamente para a direita.
[00059] Para Φ = 0 (o plano horizontal): ITD = (a/í>(0 + si [i ff)
[00060] onde θ está na faixa de 0 a π/2 radianos inclusive.
[00061] No domínio de tempo contínuo, o modelo de HRTF implementado pelo filtro da figura 6 é:
Figure img0002
[00062] onde α(θ) = 1 + cos(θ), e com θ = ângulo de azimute, a = raio da cabeça do ouvinte, e c = velocidade do som, como acima, e s é o valor de domínio de tempo contínuo do sinal de entrada.
[00063] Para converter este modelo de HRTF para o domínio de tempo discreto (no qual z é o valor de domínio de tempo discreto do sinal de entrada), a transformada bilinear é utilizada como segue:
Figure img0003
[00064] Se o parâmetro beta da equação (3) for redefinido como
Figure img0004
onde fs é a taxa de amostra, segue que
Figure img0005
[00065] do ouvinte. Para os dois ouvidos (próximo e distante, em relação à fonte), os filtros ipsilateral e contralateral do filtro da figura 6 são determinados da equação (6) como segue:
Figure img0006
Figure img0007
Figure img0008
Figure img0009
[00066] Em modalidades alternativas, cada HRTF aplicado (ou cada um de um subconjunto de HRTFs aplicado) aplicado de acordo com a invenção é definido e aplicado no domínio de frequência (por exemplo, cada sinal a ser transformado de acordo com tal HRTF sofre uma transformação de domínio de tempo para domínio de frequência, a HRTF é então aplicada aos componentes de frequência resultantes, e os componentes transformados então sofrem uma transformação de domínio de frequência para domínio de tempo).
[00067] A saída filtrada do estágio 43 sofre um cancelamento de interferência cruzada no estágio 44. O cancelamento de interferência cruzada é uma operação convencional. Por exemplo, a implementação de cancelamento de interferência cruzada em um virtualizador de som surround está descrito na Patente US 6.449.368, cedida para Dolby Laboratories Licensing Corporation, com referência à figura 4A desta patente.
[00068] O estágio 44 de cancelamento de interferência cruzada da modalidade da figura 3 filtra a saída do estágio 43 pela aplicação de duas funções de transferência HITF (filtros 52 e 53, conectados como mostrado) e duas funções de transferência HEQF (filtros 50 e 51, conectados como mostrado) a este. Cada uma das funções de transferência HITF(z) e HEQF(z) implementa o mesmo modelo de cabeça esférica de um polo, um zero descrito tipo descrito no documento de Brown, et al.,("A Structural Model for Binaural Sound Synthesis", IEEE Transactions on Speech and Audio Processing, Setembro 1998) e implementado pelas funções de transferência HRTFipsi(z) e HRTFcontra(z) do estágio 43.
[00069] No estágio 44 da modalidade da figura 3 da invenção, um retardo de tempo z-m é aplicado na saída do filtro de HITF 52 pelo elemento de retardo 55 da figura 7 e combinado com as saídas xLL(z) e xRL(z) do estágio 43 em um elemento de somatório, e a saída deste elemento de somatório é transformada no filtro de HEQF 50. Também, o retardo de tempo z-m é aplicado na saída do filtro de HITF 53 pelo elemento de retardo 56 da figura 7 e combinado com as saídas xLR(z) e xRR(z) do estágio 43 em um segundo elemento de somatório, e a saída do segundo elemento de somatório é transformada no filtro de HEQF 51. A saída xLL(z) do estágio 43 é transformada no filtro de HITF 52 e a saída xRR(z) do estágio 43 é transformada no filtro de HITF 53. Nos filtros 50, 51, 52, e 53, os ângulos de alto-falante são ajustados para a posição dos alto-falantes físicos. Os retardos (z-m) são determinados para os ângulos correspondentes.
[00070] O filtro de interferência cruzada e os filtros de equalização HITF e HEQF têm a seguinte forma:
Figure img0010
com os parâmetros a e b como nas equações (9) - (16) acima.
[00071] Se a soma dos sinais inseridos no elemento 30 (ou 31) da figura 3 for maior do que um nível permitido máximo, um recorte poderia ocorrer. No entanto, o limitador 32 da figura 3 é utilizado para evitar tal recorte. A saída de surround esquerdo LS' do estágio 44 é combinada com a entrada de canal central amplificada C e a entrada dianteira esquerda L no elemento de somatório de canal esquerdo 30, e a saída do elemento 30 sofre uma limitação no limitador 32 como mostrado na figura 3. A saída de surround direito RS' do estágio 44 é combinada com a entrada de canal central amplificada C e a entrada dianteira direita R no elemento de somatório de canal direito 31, e a saída do elemento 31 também sofre uma limitação no limitador 32 como mostrado na figura 3. Em resposta à saída esquerda não limitada do elemento 30, o limitador 32 gera a saída esquerda (L') que é aplicada no alto-falante dianteiro esquerdo. Em resposta à saída direita não limitada do elemento 31, o limitador 32 gera a saída direita (R') que é aplicada no alto-falante dianteiro direito.
[00072] O limitador 32 da figura 3 pode ser implementado como mostrado na figura 8. O limitador 32 da figura 8 tem a mesma estrutura que a implementação da figura 4 do estágio de compressão de faixa dinâmica 41 e compreende um elemento de determinação de potência RMS 170, um elemento de determinação de uniformidade 171, um elemento de cálculo de ganho 172, e elementos de amplificação 173 e 174, conectados como mostrado. Ao invés de aumentar os níveis baixos das entradas, os elementos de amplificação 173 e 174 do limitador 32 diminuem os picos de sinal das entradas (quando o nível de qualquer uma das entradas está acima de um limite predeterminado). Os tempos de ataque e liberação típicos para o limitador 32 da figura 8 são 22 ms e 50 ms, respectivamente. Um valor típico do limite predeterminado empregado no limitador 32 é 25% da escala total, e uma razão de compressão típica é 2:1 para a amplificação de cada entrada quando o seu nível está acima do limite.
[00073] Em algumas modalidades, o sistema virtualizador inventivo é ou inclui um processador de uso geral acoplado para receber os dados de entrada indicativos de múltiplos canais de entrada de áudio, e programado com um software (ou firmware) e/ou de outro modo configurado (por exemplo, em resposta a dados de controle) para executar qualquer uma de uma variedade de operações sobre os dados de entrada, incluindo uma modalidade do método inventivo. Tal processador de uso geral tipicamente estaria acoplado a um dispositivo de entrada (por exemplo, um mouse e/ou um teclado), uma memória, e um dispositivo de display. Por exemplo, o sistema da figura 3 poderia ser implementado em um processador de uso geral, com as entradas C, L, R, LS, e RS sendo dados indicativos de canais de entrada de áudio central, dianteiro esquerdo, dianteiro direito, traseiro esquerdo e traseiro direito, e as saídas L' e R' sendo dados de saída indicativos de sinais de áudio de saída. Um conversor digital para analógico convencional (DAC) poderia operar sobre estes dados de saída para gerar as versões analógicas dos sinais de áudio de saída para reprodução pelo par de alto-falantes dianteiros físicos.
[00074] A figura 9 é um diagrama de blocos de um sistema virtualizador 20, o qual é um DSP de áudio programável que foi configurado para executar uma modalidade do método inventivo. O sistema 20 inclui um circuito de DSP programável 22 (um subsistema virtualizador do sistema 20) acoplado para receber os sinais de entrada de áudio indicativo de som de múltiplas localizações de fonte incluindo pelo menos duas localizações traseiras (por exemplo, cinco sinais de entrada C, L, LS, RS, e R como indicado na figura 3). O circuito 22 está configurado em resposta aos dados de controle da interface de controle 21 para executar uma modalidade do método inventivo, para gerar os sinais de áudio de saída de canal esquerdo e direito L' e R', para reprodução por um par de alto-falantes físicos, em resposta aos sinais de áudio de entrada. Para programar o sistema 20, um software apropriado é aplicado de um processador externo para controlar a interface 21, e a interface 21 aplica em resposta os dados de controle apropriados ao circuito 22 para configurar o circuito 22 para executar o método inventivo.
[00075] Em operação, um DSP de áudio que foi configurado para executar uma virtualização de som surround de acordo com a invenção (por exemplo, o sistema virtualizador 20 da figura 9) está acoplado para receber múltiplos sinais de entrada de áudio (indicativos de som de múltiplas localizações de fonte incluindo pelo menos duas localizações traseiras), e o DSP tipicamente executa uma variedade de operações sobre o áudio de entrada além de (assim como) virtualização. De acordo com várias modalidades da invenção, um DSP de áudio é operável para executar uma modalidade do método inventivo após ser configurado (por exemplo, programado) para gerar os sinais de áudio de saída (para reprodução por um par de alto-falantes físicos) em resposta aos sinais de áudio de entrada executando o método sobre os sinais de áudio de entrada.
[00076] Apesar de modalidades específicas da presente invenção e aplicações da invenção terem sido aqui descritas, será aparente para aqueles versados na técnica que muitas variações sobre as modalidades e aplicações aqui descritas são possíveis sem afastar do escopo da invenção aqui descrito e reivindicado. Deve ser compreendido que apesar de certas formas da invenção terem sido mostradas e descritas, a invenção não está limitada às modalidades específicas descritas e mostradas ou aos métodos específicos descritos.

Claims (13)

1. Método de virtualização de som surround para produzir sinais de saída para reprodução por um par de alto-falantes físicos em localizações físicas em relação a um ouvinte, onde nenhuma das localizações físicas é uma localização em um conjunto de localizações de fonte traseira, o método incluindo as etapas de: (a) em resposta a sinais de áudio de entrada indicativos de som das localizações de fonte traseira, gerar os sinais de surround úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira, incluindo executando uma compressão de faixa dinâmica sobre os sinais de áudio de entrada; e (b) gerar os sinais de saída em resposta aos sinais de surround e pelo menos um outro sinal de áudio de entrada, cada um do outro sinal de áudio de entrada indicativo de som de uma respectiva localização de fonte dianteira, de modo que os sinais de saída são úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira e de cada localização de fonte dianteira, caracterizado pelo fato de que a etapa de geração dos sinais surround inclui a execução de compressão de faixa dinâmica nos sinais de áudio de entrada, a etapa de geração dos sinais surround inclui uma etapa de gerar os sinais surround que inclui realizar decorrelação dos sinais de áudio de entrada, a compressão de faixa dinâmica é realizada por meio de amplificação não linear dos sinais de áudio de entrada, de modo a melhorar a audibilidade do som das localizações de fonte traseira em relação ao som a partir de cada localização frontal durante a reprodução dos sinais de saída pelos alto-falantes nas localizações físicas, e pelo menos um dentre a compressão de faixa dinâmica ou a decorrelação é realizada de modo a fornecer localização aprimorada do som a partir das localizações de fonte traseira em relação ao som de pelo menos uma dita localização de fonte frontal, durante a reprodução dos sinais de saída pelos alto-falantes nas localizações físicas.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa (a) inclui uma etapa de executar a compressão de faixa dinâmica incluindo amplificando cada um dos sinais de áudio de entrada que tem um nível abaixo de um limite predeterminado em um modo não linear dependendo da quantidade pela qual o nível está abaixo do limite.
3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o nível é um nível médio, sobre uma janela de tempo, dos cada um dos sinais de áudio de entrada.
4. Método, de acordo com qualquer uma das reivindicações 1 a 3, caracterizado pelo fato de que os alto-falantes físicos são alto- falantes dianteiros, as localizações físicas estão na frente do ouvinte, e a etapa (a) inclui a etapa de gerar os sinais de surround esquerdo e direito em resposta aos sinais de entrada traseiros esquerdo e direito.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que a etapa (b) inclui a etapa de gerar os sinais de saída em resposta aos sinais de surround, e em resposta a um sinal de áudio de entrada esquerdo indicativo de som de uma localização de fonte dianteira esquerda, um sinal de áudio de entrada direito indicativo de som de uma localização de fonte dianteira direita, e um sinal de áudio de entrada central indicativo de som de uma localização de fonte dianteira central.
6. Método, de acordo com a reivindicação 5, caracterizado pelo fato de que a etapa (b) inclui uma etapa de gerar um canal central fantasma em resposta ao sinal de áudio de entrada central.
7. Método, de acordo com qualquer uma das reivindicações 1 a 6, caracterizado pelo fato de que a etapa (a) inclui uma etapa de gerar os sinais de surround incluindo transformar os sinais de áudio de entrada de acordo com uma função de transferência relativa à cabeça.
8. Método, de acordo com a reivindicação 7, caracterizado pelo fato de que os sinais de áudio de entrada são um sinal de entrada traseiro esquerdo indicativo de som de uma fonte traseira esquerda e um sinal de entrada traseiro direito indicativo de som de uma fonte traseira direita, e a etapa (a) inclui as etapas de: transformar o sinal de entrada traseiro esquerdo de acordo com a função de transferência relativa à cabeça para gerar um primeiro sinal de áudio virtualizado indicativo de som da fonte traseira esquerda como incidente em um ouvido esquerdo do ouvinte e um segundo sinal de áudio virtualizado indicativo de som da fonte traseira esquerda como incidente em um ouvido direito do ouvinte, e transformar o sinal de entrada traseiro direito de acordo com a função de transferência relativa à cabeça para gerar um terceiro sinal de áudio virtualizado indicativo de som da fonte traseira direita como incidente no ouvido esquerdo do ouvinte e um quarto sinal de áudio virtualizado indicativo de som da fonte traseira direita como incidente no ouvido direito do ouvinte.
9. Método, de acordo com qualquer uma das reivindicações 1 a 8, caracterizado pelo fato de que a etapa (a) inclui uma etapa de gerar os sinais de surround incluindo executando um cancelamento de interferência cruzada sobre os sinais de áudio de entrada.
10. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os alto-falantes físicos são fones de ouvido e a etapa (a) é executada sem executar o cancelamento de interferência cruzada sobre os sinais de áudio de entrada.
11. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a etapa (a) inclui as etapas de: executar a compressão de faixa dinâmica sobre os sinais de áudio de entrada para gerar sinais de áudio comprimidos; executar uma decorrelação sobre os sinais de áudio comprimidos para gerar sinais de áudio decorrelacionados; transformar os sinais de áudio decorrelacionados de acordo com uma função de transferência relativa à cabeça para gerar sinais de áudio virtualizados; e executar um cancelamento de interferência cruzada sobre os sinais de áudio virtualizados para gerar os sinais de surround.
12. Sistema de virtualização de som surround configurado para produzir sinais de saída para reprodução por um par de alto- falantes físicos em localizações físicas em relação a um ouvinte, onde nenhuma das localizações físicas é uma localização em um conjunto de localizações de fonte traseira, que inclui: um subsistema de virtualizador de surround (40), acoplado e configurado para gerar os sinais de surround em resposta a sinais de áudio de entrada incluindo executando uma compressão de faixa dinâmica sobre os sinais de áudio de entrada, em que os sinais de áudio de entrada são indicativos de som das localizações de fonte traseira, e os sinais de surround são úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira; e um segundo subsistema (30, 31), acoplado e configurado para gerar os sinais de saída em resposta aos sinais de surround e pelo menos outro sinal de áudio de entrada, cada outro sinal de áudio de entrada indicativo de som de uma respectiva localização de fonte dianteira, de modo que os sinais de saída são úteis para acionar os alto-falantes nas localizações físicas para emitir um som que o ouvinte percebe como emitindo das localizações de fonte traseira e de cada localização de fonte dianteira, caracterizado pelo fato de que a geração dos sinais surround inclui a execução de compressão de faixa dinâmica nos sinais de áudio de entrada, o subsistema de virtualizador de surround (40) é configurado para gerar os sinais surround realizando decorrelação dos sinais de áudio de entrada, a compressão de faixa dinâmica é realizada por meio de amplificação não linear dos sinais de áudio de entrada, de modo a melhorar a audibilidade do som a partir das localizações de fonte traseira em relação ao som a partir de cada localização frontal durante a reprodução dos sinais de saída pelos alto-falantes nas localizações físicas, e pelo menos um dentre compressão de faixa dinâmica ou decorrelação é realizada de modo a fornecer localização aprimorada do som a partir das localizações de fonte traseira em relação ao som de pelo menos uma dita localização de fonte frontal, durante reprodução dos sinais de saída pelos alto-falantes nas localizações físicas.
13. Sistema, de acordo com a reivindicação 12, caracterizado pelo fato de que o subsistema virtualizador de surround está configurado para executar a compressão de faixa dinâmica amplificando não linearmente os sinais de áudio de entrada.
BRPI0923440-3A 2008-12-15 2009-12-01 método de virtualização de som surround e sistema de virtualização de som surround BRPI0923440B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US12264708P 2008-12-15 2008-12-15
US61/122,647 2008-12-15
PCT/US2009/066230 WO2010074893A1 (en) 2008-12-15 2009-12-01 Surround sound virtualizer and method with dynamic range compression

Publications (3)

Publication Number Publication Date
BRPI0923440A2 BRPI0923440A2 (pt) 2016-01-12
BRPI0923440A8 BRPI0923440A8 (pt) 2017-09-12
BRPI0923440B1 true BRPI0923440B1 (pt) 2021-02-02

Family

ID=41651132

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0923440-3A BRPI0923440B1 (pt) 2008-12-15 2009-12-01 método de virtualização de som surround e sistema de virtualização de som surround

Country Status (12)

Country Link
US (1) US8867750B2 (pt)
EP (1) EP2374288B1 (pt)
CN (1) CN102246544B (pt)
AU (1) AU2009330534B2 (pt)
BR (1) BRPI0923440B1 (pt)
CA (1) CA2744459C (pt)
IL (1) IL212895A0 (pt)
MY (1) MY180232A (pt)
RU (1) RU2491764C2 (pt)
SG (1) SG171324A1 (pt)
UA (1) UA101542C2 (pt)
WO (1) WO2010074893A1 (pt)

Families Citing this family (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8315398B2 (en) 2007-12-21 2012-11-20 Dts Llc System for adjusting perceived loudness of audio signals
JP5341919B2 (ja) * 2008-02-14 2013-11-13 ドルビー ラボラトリーズ ライセンシング コーポレイション ステレオ音響の拡幅
US8538042B2 (en) 2009-08-11 2013-09-17 Dts Llc System for increasing perceived loudness of speakers
KR20120004909A (ko) * 2010-07-07 2012-01-13 삼성전자주식회사 입체 음향 재생 방법 및 장치
TWI479905B (zh) * 2012-01-12 2015-04-01 Univ Nat Central Multi-channel down mixing device
FR2986932B1 (fr) * 2012-02-13 2014-03-07 Franck Rosset Procede de synthese transaurale pour la spatialisation sonore
US9312829B2 (en) * 2012-04-12 2016-04-12 Dts Llc System for adjusting loudness of audio signals in real time
JP5897219B2 (ja) 2012-08-31 2016-03-30 ドルビー ラボラトリーズ ライセンシング コーポレイション オブジェクト・ベースのオーディオの仮想レンダリング
JP6079119B2 (ja) 2012-10-10 2017-02-15 ティアック株式会社 録音装置
JP6056356B2 (ja) 2012-10-10 2017-01-11 ティアック株式会社 録音装置
CN104078050A (zh) 2013-03-26 2014-10-01 杜比实验室特许公司 用于音频分类和音频处理的设备和方法
CN104581610B (zh) * 2013-10-24 2018-04-27 华为技术有限公司 一种虚拟立体声合成方法及装置
EP3114859B1 (en) 2014-03-06 2018-05-09 Dolby Laboratories Licensing Corporation Structural modeling of the head related impulse response
CN106465027B (zh) * 2014-05-13 2019-06-04 弗劳恩霍夫应用研究促进协会 用于边缘衰落幅度平移的装置和方法
JP6558047B2 (ja) * 2015-04-24 2019-08-14 株式会社Jvcケンウッド 信号処理装置及び信号処理方法
US9860666B2 (en) 2015-06-18 2018-01-02 Nokia Technologies Oy Binaural audio reproduction
KR20180075610A (ko) * 2015-10-27 2018-07-04 앰비디오 인코포레이티드 사운드 스테이지 향상을 위한 장치 및 방법
US10306392B2 (en) 2015-11-03 2019-05-28 Dolby Laboratories Licensing Corporation Content-adaptive surround sound virtualization
CA3004962A1 (en) * 2015-11-10 2017-05-18 Lee F. Bender Digital audio processing systems and methods
WO2017192972A1 (en) 2016-05-06 2017-11-09 Dts, Inc. Immersive audio reproduction systems
WO2018132417A1 (en) 2017-01-13 2018-07-19 Dolby Laboratories Licensing Corporation Dynamic equalization for cross-talk cancellation
EP3583786A4 (en) * 2017-02-17 2020-12-23 Ambidio, Inc. DEVICE AND METHOD FOR DOWN MIXING OF MULTI-CHANNEL AUDIO SIGNALS
US10979844B2 (en) 2017-03-08 2021-04-13 Dts, Inc. Distributed audio virtualization systems
GB2569214B (en) * 2017-10-13 2021-11-24 Dolby Laboratories Licensing Corp Systems and methods for providing an immersive listening experience in a limited area using a rear sound bar
US10764704B2 (en) * 2018-03-22 2020-09-01 Boomcloud 360, Inc. Multi-channel subband spatial processing for loudspeakers
WO2019246457A1 (en) 2018-06-22 2019-12-26 Dolby Laboratories Licensing Corporation Multichannel audio enhancement, decoding, and rendering in response to feedback
US10841728B1 (en) 2019-10-10 2020-11-17 Boomcloud 360, Inc. Multi-channel crosstalk processing
US11533560B2 (en) 2019-11-15 2022-12-20 Boomcloud 360 Inc. Dynamic rendering device metadata-informed audio enhancement system

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1578854A (en) 1976-02-27 1980-11-12 Victor Company Of Japan Stereophonic sound reproduction system
SU1626410A1 (ru) * 1988-10-17 1991-02-07 Предприятие П/Я М-5653 Устройство приема сигналов с частотным разделением каналов
US5471651A (en) * 1991-03-20 1995-11-28 British Broadcasting Corporation Method and system for compressing the dynamic range of audio signals
US20030169886A1 (en) 1995-01-10 2003-09-11 Boyce Roger W. Method and apparatus for encoding mixed surround sound into a single stereo pair
US5912976A (en) 1996-11-07 1999-06-15 Srs Labs, Inc. Multi-channel audio enhancement system for use in recording and playback and methods for providing same
US6449368B1 (en) * 1997-03-14 2002-09-10 Dolby Laboratories Licensing Corporation Multidirectional audio decoding
US6175631B1 (en) 1999-07-09 2001-01-16 Stephen A. Davis Method and apparatus for decorrelating audio signals
TWI230024B (en) * 2001-12-18 2005-03-21 Dolby Lab Licensing Corp Method and audio apparatus for improving spatial perception of multiple sound channels when reproduced by two loudspeakers
US7551745B2 (en) 2003-04-24 2009-06-23 Dolby Laboratories Licensing Corporation Volume and compression control in movie theaters
DE602004005234T2 (de) 2003-07-07 2007-11-08 Koninklijke Philips Electronics N.V. System und verfahren zur signalverarbeitung
US6937737B2 (en) * 2003-10-27 2005-08-30 Britannia Investment Corporation Multi-channel audio surround sound from front located loudspeakers
KR100608024B1 (ko) 2004-11-26 2006-08-02 삼성전자주식회사 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체
US8175280B2 (en) * 2006-03-24 2012-05-08 Dolby International Ab Generation of spatial downmixes from parametric representations of multi channel signals

Also Published As

Publication number Publication date
CN102246544B (zh) 2015-05-13
MY180232A (en) 2020-11-25
AU2009330534A1 (en) 2011-10-27
EP2374288B1 (en) 2018-02-14
AU2009330534B2 (en) 2014-07-17
SG171324A1 (en) 2011-07-28
RU2491764C2 (ru) 2013-08-27
US8867750B2 (en) 2014-10-21
EP2374288A1 (en) 2011-10-12
UA101542C2 (ru) 2013-04-10
RU2011129155A (ru) 2013-01-20
CA2744459C (en) 2016-06-14
US20110243338A1 (en) 2011-10-06
WO2010074893A1 (en) 2010-07-01
CA2744459A1 (en) 2010-07-01
BRPI0923440A8 (pt) 2017-09-12
IL212895A0 (en) 2011-07-31
BRPI0923440A2 (pt) 2016-01-12
CN102246544A (zh) 2011-11-16

Similar Documents

Publication Publication Date Title
BRPI0923440B1 (pt) método de virtualização de som surround e sistema de virtualização de som surround
KR100591008B1 (ko) 다지향성 오디오 디코딩
AU2018203746B2 (en) Generating binaural audio in response to multi-channel audio using at least one feedback delay network
US9622006B2 (en) Method and system for head-related transfer function generation by linear mixing of head-related transfer functions
KR102235413B1 (ko) 다채널 오디오에 응답하여 적어도 하나의 피드백 지연 네트워크를 이용한 바이노럴 오디오의 생성
US9307338B2 (en) Upmixing method and system for multichannel audio reproduction
JP2022101630A (ja) 空間オーディオ信号のクロストーク処理のためのスペクトル欠陥補償
WO2014203496A1 (ja) 音声信号処理装置、および音声信号処理方法
WO2020045109A1 (ja) 信号処理装置、信号処理方法、及び、プログラム
King et al. LFE, Friend or Foe? The Pros and Cons of the Low Frequency Effect Channel
US20150006180A1 (en) Sound enhancement for movie theaters
JP4430105B2 (ja) 音響再生装置
Mickiewicz et al. Headphone processor based on individualized head related transfer functions measured in listening room
JPH04137999A (ja) ヘッドホン音場受聴装置
Yao et al. A dual-mode architecture for headphones delivering surround sound: Low-order IIR filter models approach
Aarts et al. NAG
KR20120021155A (ko) 프론트 서라운드 음향 재생 방법 및 장치

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B07A Application suspended after technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 10 (DEZ) ANOS CONTADOS A PARTIR DE 02/02/2021, OBSERVADAS AS CONDICOES LEGAIS.