BR112012019880B1 - método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método para codificar um sinal de entrada de áudio que representa estímulos auditivos, método para transcodificar um sinal de entrada codificado para gerar um sinal de saída codificado, aparelho e meio de armazenamento - Google Patents

método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método para codificar um sinal de entrada de áudio que representa estímulos auditivos, método para transcodificar um sinal de entrada codificado para gerar um sinal de saída codificado, aparelho e meio de armazenamento Download PDF

Info

Publication number
BR112012019880B1
BR112012019880B1 BR112012019880-7A BR112012019880A BR112012019880B1 BR 112012019880 B1 BR112012019880 B1 BR 112012019880B1 BR 112012019880 A BR112012019880 A BR 112012019880A BR 112012019880 B1 BR112012019880 B1 BR 112012019880B1
Authority
BR
Brazil
Prior art keywords
encoded
parameters
level
audio
input signal
Prior art date
Application number
BR112012019880-7A
Other languages
English (en)
Other versions
BR112012019880A2 (pt
Inventor
Jeffrey C. Riedmiller
Harald H. Mundt
Michael Schug
Martin Wolters
Original Assignee
Dolby Laboratories Licensing Corporation
Dolby International Ab
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corporation, Dolby International Ab filed Critical Dolby Laboratories Licensing Corporation
Priority to BR122019025627-6A priority Critical patent/BR122019025627B1/pt
Publication of BR112012019880A2 publication Critical patent/BR112012019880A2/pt
Publication of BR112012019880B1 publication Critical patent/BR112012019880B1/pt

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/3089Control of digital or coded signals
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/32Automatic control in amplifiers having semiconductor devices the control being dependent upon ambient noise level or sound level
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G7/00Volume compression or expansion in amplifiers
    • H03G7/007Volume compression or expansion in amplifiers of digital or coded signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Tone Control, Compression And Expansion, Limiting Amplitude (AREA)
  • Stereophonic System (AREA)
  • Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)

Abstract

SISTEMA E MÉTODO PARA NORMALIZAR DE MODO NÃO DESTRUTIVO RUÍDO DE SINAIS DE ÁUDIO EM DISPOSITIVOS PORTÁTEIS. A presente invenção refere-se a muitos dispositivos de reprodução portáteis que não podem decodificar e reproduzir o conteúdo de áudio encodificado que tem largura de banda ampla e extensão dinâmica ampla com inteligibilidade e intensidade consistentes, a menos que o conteúdo de áudio encodificado tenha sido preparado especificamente para esses dispositivos. Esse problema pode ser superado através da inclusão, no conteúdo encodificado, de alguns metadados que especificam um perfil de compressão de extensão dinâmica adequado através de valores absolutos ou valores diferenciais em relação a outro perfil de compressão. Um dispositivo de reprodução pode, ainda, aplicar ganho de modo adaptativo e limitar o áudio de reprodução. Implantações em encodificadores, em transcodificadores e em decodificadores são reveladas.

Description

REFERÊNCIA CRUZADA A PEDIDOS RELACIONADOS
[0001] Este pedido reivindica prioridade do Pedido Provisório de Patente n- U.S. 61/303.643, depositado em 11 de fevereiro de 2010, incorporado em sua totalidade no presente documento a título de referência.
CAMPO DA TÉCNICA
[0002] A presente invenção refere-se, geralmente, à codificação e decodificação de sinais de áudio e pertence, mais especificamente, a técnicas que podem ser usadas para codificar e decodificar sinais de áudio para uma extensão mais ampla de dispositivos de reprodução e ambientes de escuta.
TÉCNICA ANTECEDENTE
[0003] A crescente popularidade de dispositivos móveis e outros tipos de dispositivos portáteis tem criado novas oportunidades e desafios para os criadores e distribuidores de conteúdo de mídia para reprodução em tais dispositivos, bem como para os projetadores e fabricantes dos dispositivos. Muitos dispositivos portáteis podem reproduzir uma vasta extensão de tipos e formatos de conteúdos de mídia, incluindo aqueles frequentemente associados a conteúdo de áudio de largura de banda ampla e extensão dinâmica ampla de alta qualidade para HDTV, Blu-ray ou DVD. Dispositivos portáteis podem ser usados para reproduzir esse tipo de conteúdo de áudio em seus próprios transdutores acústicos internos ou em transdutores externos, tais como fones de ouvido; contudo, os mesmos geralmente não podem reproduzir esse conteúdo com inteligibilidade e intensidade consistentes através de tipos de conteúdo e formato de mídia variados.
DESCRIÇÃO DA INVENÇÃO
[0004] A presente invenção é direcionada a fornecer métodos aperfeiçoados para codificação e decodificação de sinais de áudio para reprodução em uma variedade de dispositivos, incluindo dispositivos móveis e outros tipos de dispositivos portáteis.
[0005] Vários aspectos da presente invenção são apresentados nas concretizações.
[0006] Os vários recursos da presente invenção e suas modalidades preferidas podem ser melhor compreendidos em referência à seguinte discussão e aos desenhos anexos nos quais numerais de referência similares se referem a elementos similares nas várias figuras. Os conteúdos da seguinte discussão e dos desenhos são apresentados como exemplos apenas e não devem ser entendidos como representantes de limitações mediante o escopo da presente invenção.
BREVE DESCRIÇÃO DOS DESENHOS
[0007] A Figura 1 é um diagrama de bloco esquemático de um dispositivo de reprodução.
[0008] A Figura 2 é um diagrama de bloco esquemático de um dispositivo de codificação.
[0009] As Figuras de 3 a 5 são diagramas de bloco esquemáticos de dispositivos transcodificadores.
[00010] A Figura 6 é um diagrama de bloco esquemático de um dispositivo que pode ser usado para implantar vários aspectos da presente invenção.
MODOS DE REALIZAÇÃO DA INVENÇÃO A.Introdução
[00011] A presente invenção é direcionada à codificação e decodificação de informações de áudio para reprodução em ambientes de escuta desafiadores tais como aqueles encontrados por usuários de dispositivos móveis e de outros tipos de dispositivos portáteis. Alguns exemplos de codificação e decodificação de áudio são descritos por padrões publicados tais como aqueles descritos no "Padrão de Compressão de Áudio Digital (AC-3, E-AC-3)," Revisão B, Documento A/52B, 14 de junho de 2005 publicado pelo Comitê de Sistemas de Televisão Avançados, Inc. (referido no presente documento como o "Padrão ATSC”), e no ISO/IEC 13818-7, Codificação de Áudio Avançada (AAC) (referido no presente documento como o "Padrão MPEG-2 AAC") e ISO/IEC 14496-3, subparte 4 (referido no presente documento como "Padrão de Áudio MPEG-4") publicado pela Organização De Padrões Internacionais (ISO). Os processos de codificação e decodificação que se conformam a esses padrões são mencionados apenas como exemplos. Princípios da presente invenção podem ser usados com sistemas de codificação que também se conformam a outros padrões.
[00012] Os inventores descobriram que os recursos disponíveis de dispositivos que se conformam a alguns padrões de codificação são frequentemente insuficientes para aplicações e ambientes de escuta que são típicos de dispositivos móveis e outros tipos de dispositivos portáteis. Quando esses tipos de dispositivos são usados para decodificar o conteúdo de áudio de sinais de entrada codificados que se conformam a esses padrões, o conteúdo de áudio codificado é frequentemente reproduzido em níveis de intensidade que são significativamente mais baixos que os níveis de intensidade para conteúdo de áudio obtido pela decodificação de sinais de entrada codificados que foram especialmente preparados para reprodução nesses dispositivos.
[00013] Sinais de entrada codificados que se conformam ao Padrão ATSC (referidos no presente documento como "sinais codificados compatíveis com o ATSC”), por exemplo, contém informações de áudio codificadas e metadados que descrevem como essas informações podem ser decodificadas. Alguns dos parâmetros de metadados identificam um perfil de compressão de extensão dinâmica que especifica como a extensão dinâmica das informações de áudio pode ser comprimida quando as informações de áudio codificadas são decodificadas. A extensão dinâmica completa do sinal decodificado pode ser retida ou pode ser comprimida em vários graus no momento da decodificação para satisfazer as demandas de diferentes aplicações e ambientes de escuta. Outros metadados identificam uma medida de intensidade das informações de áudio codificadas tal como um nível de diálogo ou nível de programa médio no sinal codificado. Esses metadados podem ser usados por um decodificador para ajustar amplitudes do sinal decodificado para alcançar uma intensidade ou nível de reprodução de referência especificadas durante a reprodução. Em algumas aplicações, um ou mais níveis de reprodução de referência podem ser especificados ou supostos, enquanto em outras aplicações o usuário pode ser dado controle sobre o ajuste do nível de reprodução de referência. Por exemplo, os processos de codificação usados para codificar e decodificar sinais codificados compatíveis com o ATSC assumem que diálogo deve ser reproduzido em um de dois níveis de reprodução de referência. Um nível é 31 dB abaixo de um nível de recorte, o que é o valor digital maior possível ou valor de escala completa (FS), denotado no presente documento como -31 dBps. O modo de decodificação que usa esse nível é às vezes referido como "Modo de Linha" e é destinado a ser usado em aplicações e ambientes em que extensões dinâmicas mais amplas são adequadas. O outro nível é estabelecido a -20 dBps. O modo de decodificação que usa esse segundo nível é às vezes referido como "Modo de RF," que é destinado a ser usado em aplicações e ambientes como aqueles encontrados em difusão através de modulação de sinais de frequência de rádio (RF) em que extensões dinâmicas mais estreitas são necessárias para evitar modulação em excesso.
[00014] Para outro exemplo, sinais codificados que são compatíveis com os padrões de áudio MPEG-2 AAC e MPEG-4 incluem metadados que identificam um nível de intensidade médio para as informações de áudio codificadas. Os processos que decodificam sinais codificados compatíveis com áudio MPEG-2 AAC e MPEG-4 podem permitir que o ouvinte especifique um nível de reprodução desejado. O decodificador usa o nível de reprodução desejado e os metadados de intensidade média para ajustar amplitudes do sinal decodificado de modo que o nível de reprodução desejado seja alcançado.
[00015] Quando dispositivos móveis e outros tipos de dispositivos portáteis são usados para decodificar e reproduzir o conteúdo de áudio de sinais codificados compatíveis com o ATSC, com o MPEG-2 AAC, e com o áudio MPEG-4 de acordo com esses parâmetros de metadados, a extensão dinâmica e nível de intensidade são frequentemente não adequados por causa de ambientes de escuta adversos que são encontrados com esses tipos de dispositivos ou por causa de limitações elétricas devido a voltagens de operações mais baixas usadas nesses dispositivos.
[00016] Sinais codificados que se conformam a outros padrões usam tipos similares de metadados e podem incluir uma provisão para especificar o nível de reprodução de intensidade pretendido. Os mesmos problemas são frequentemente encontrados com dispositivos portáteis que decodificam esses sinais.
[00017] A presente invenção pode ser usada para aperfeiçoar a experiência de escuta para usuários de dispositivos móveis e portáteis sem requerer conteúdo que tenha sido preparado especificamente para esses dispositivos. B. Visão Geral do Dispositivo
[00018] A Figura 1 é um diagrama de bloco esquemático de um tipo de um dispositivo receptor/decodificador 10 que incorpora vários aspectos da presente invenção. O dispositivo 10 recebe um sinal de entrada codificado da trajetória de sinal 11, aplica processos adequados no deformatador 12 para extrair informações de áudio codificadas e metadados associados do sinal de entrada, passa as informações de áudio codificadas para o decodificador 14 e passa os metadados ao longo da trajetória de sinal 13. As informações de áudio codificadas incluem sinais de sub-banda codificados que representam conteúdo espectral de estímulos auditivos e os metadados especificam valores para uma variedade de parâmetros que incluem um ou mais parâmetros de controle de decodificação e um ou mais parâmetros que especificam a compressão de extensão dinâmica de acordo com um perfil de compressão de extensão dinâmica. O termo "perfil de compressão de extensão dinâmica"refere-se a recursos tais como fatores de ganho, tempos de ataque de compressão e tempos de liberação de compressão que definem as características operacionais de um compressor de extensão dinâmica.
[00019] O decodificador 14 aplica um processo de decodificação às informações de áudio codificadas para obter sinais de sub-banda decodificados, que são passados para o controle de extensão dinâmica 16. A operação e funções do processo de decodificação podem ser adaptados em resposta a parâmetros de controle de decodificação recebidos da trajetória de sinal 13. Exemplos de parâmetros de controle de decodificação que podem ser usados para adaptar a operação e funções do processo de decodificação são parâmetros que identificam o número e a configuração dos canais de áudio representados pelas informações de áudio codificadas.
[00020] O controle de extensão dinâmica 16 opcionalmente ajusta a extensão dinâmica das informações de áudio decodificadas. Esse ajuste pode ser ligado ou desligado e adaptado em resposta a metadados recebidos da trajetória de sinal 13 e/ou dos sinais de controle que podem ser fornecidos em resposta à entrada de um ouvinte. Por exemplo, um sinal de controle pode ser fornecido em resposta a um ouvinte operando um comutador ou selecionando uma opção de operação para o dispositivo 10.
[00021] Em implantações que se conformam ao Padrão ATSC, ao padrão MPEG-2 AAC ou ao padrão de áudio MPEG-4, por exemplo, o sinal de entrada codificado inclui informações de áudio codificadas dispostas em uma sequência de segmentos ou quadros. Cada quadro contém sinais de sub-banda codificados que representam componentes espectrais de um sinal de áudio com sua extensão dinâmica completa. O controle de extensão dinâmica 16 pode não tomar nenhuma medida, o que permite que o sinal de áudio seja reproduzido com uma quantidade máxima de extensão dinâmica, ou isso pode modificar os sinais de sub-banda decodificados para comprimir a extensão dinâmica em vários graus.
[00022] O banco de filtro de síntese 18 aplica um banco de filtros de síntese aos sinais de sub-banda decodificados, que podem ter sido ajustados pelo controle de extensão dinâmica 16, e fornece na sua saída um sinal de áudio de domínio de tempo que pode ser um sinal digital ou analógico.
[00023] O limitador de ganho 20 é usado em algumas implantações da presente invenção para ajustar a amplitude do sinal de áudio de domínio de tempo. A saída do limitador de ganho 20 é passada ao longa da trajetória 21 para apresentação subsequente por um transdutor acústico.
[00024] A Figura 2 é um diagrama de bloco esquemático de um dispositivo codificador/transmissor 30 que incorpora vários aspectos da presente invenção. O dispositivo 30 recebe um sinal de entrada de áudio da trajetória de sinal 31 que representa estímulos auditivos. O dispositivo 30 aplica um banco de filtros de análise ao sinal de áudio para obter sinais de sub-banda em uma representação de domínio de frequência do sinal de áudio de entrada ou um conjunto de sinais de largura de banda limitada que representam o sinal de áudio de entrada. O calculador de metadados 34 analisa o sinal de entrada de áudio e/ou um ou mais sinais derivados do sinal de entrada de áudio tais como uma versão modificada do sinal de entrada de áudio ou os sinais de sub-banda do banco de filtro de análise 32 para calcular metadados que especificam valores para uma variedade de parâmetros incluindo parâmetros de controle de codificação, um ou mais parâmetros de controle de decodificação e um ou mais parâmetros que especificam a compressão de extensão dinâmica de acordo com um perfil de compressão de extensão dinâmica. O calculador de metadados 34 pode analisar sinais de domínio de tempo, sinais de domínio de frequência, ou uma combinação de sinais domínio de tempo e de domínio de frequência. Os cálculos executados pelo calculador de metadados 34 podem ser adaptados, ainda, em resposta a um ou mais parâmetros de metadados recebidos da trajetória 33. O codificador 36 aplica um processo de codificação à saída do banco de filtro de análise 32 para obter informações de áudio codificadas que incluem sinais de sub-banda codificados, que são passadas para o formatador 38. O processo de codificação pode ser adaptado em resposta aos parâmetros de controle de codificação recebidos da trajetória 33. O processo de codificação pode gerar, ainda, outros parâmetros de controle de decodificação ao longo da trajetória 33 para uso pelos processos executados no dispositivo 10 para decodificar as informações de áudio codificadas. O formatador 38 une as informações de áudio codificadas e pelo menos alguns dos metadados incluindo os um ou mais parâmetros de controle de decodificação e os um ou mais parâmetros que especificam a compressão de extensão dinâmica em um sinal de saída codificado que tem um formato que é adequado para transmissão ou armazenamento.
[00025] Em implantações que se conformam ao Padrão ATSC, ao padrão MPEG-2 AAC ou ao padrão de áudio MPEG-4, por exemplo, o sinal de saída codificado inclui informações de áudio codificadas dispostas em uma sequência de segmentos ou quadros. Cada quadro contém sinais de sub-banda codificados que representam componentes espectrais de um sinal de áudio com sua extensão dinâmica completa e que têm amplitudes para reprodução em um nível de reprodução de referência.
[00026] O deformatador 12, o decodificador 14, o banco de filtro de síntese 18, o banco de filtro de análise 32, o codificador 36 e o formatador 38 podem ser convencionais em projeto e operação. Alguns exemplos incluem os componentes correspondentes que se conformam aos padrões publicados mencionados acima. As implantações dos componentes especificados ou sugeridos nesses padrões são adequadas para uso com a presente invenção, mas não são requeridas. Nenhuma implantação particular desses componentes é crítica.
[00027] As Figuras de 3 a 5 são diagramas de bloco esquemáticos de diferentes implantações de um dispositivo transcodificador 40 que compreende alguns dos componentes no dispositivo 10 e no dispositivo 30, descritos acima. Esses componentes operam substancialmente da mesma forma que seus correspondentes. O dispositivo 40 mostrado na Figura 3 é capaz de transcodificar o sinal de entrada codificado recebido da trajetória 11 em uma versão modificada que se conforma ao mesmo padrão de codificação. Nessa implantação, o dispositivo 40 recebe um sinal de entrada codificado da trajetória de sinal 11, aplica processos adequados no deformatador 12 para extrair as primeiras informações de áudio codificadas e metadados associados do sinal de entrada codificado, passa as primeiras informações de áudio codificadas para o decodificador 14 e para o formatador 38, e passa os metadados ao longo da trajetória de sinal 43. As primeiras informações de áudio codificadas incluem sinais de sub-banda codificados que representam o conteúdo espectral de estímulos auditivos e os metadados especificam valores para uma variedade de parâmetros incluindo um ou mais parâmetros de controle de decodificação e um ou mais parâmetros que especificam a compressão de extensão dinâmica de acordo com um primeiro perfil de compressão de extensão dinâmica. O decodificador 14 aplica um processo de decodificação às primeiras informações de áudio codificadas para obter sinais de sub-banda decodificados. A operação e as funções do processo de decodificação podem ser adaptadas em resposta aos um ou mais parâmetros de controle de decodificação recebidos da trajetória de sinal 43. Os sinais de sub-banda podem ser uma representação de domínio de frequência dos estímulos auditivos ou um conjunto de sinais de largura de banda limitada que representam os estímulos auditivos.
[00028] O calculador de metadados 44 analisa os sinais de sub- banda decodificados e/ou um ou mais sinais derivados dos sinais de sub-banda decodificados para calcular um ou mais valores de parâmetro que especificam a compressão de extensão dinâmica de acordo com um segundo perfil de compressão de extensão dinâmica. Por exemplo, os um ou mais sinais podem ser derivados através da aplicação do banco de filtro de síntese 18 aos sinais de sub-banda decodificados. Os cálculos executados pelo calculador de metadados 44 podem ser adaptados em resposta a metadados recebidos da trajetória 43. O banco de filtro de síntese 18 pode ser omitido dessa implantação se sua saída não é necessária para o cálculo de metadados.
[00029] Outra implantação do dispositivo 40 é mostrada na Figura 4. Essa implantação é semelhante àquela mostrada na Figura 3, mas inclui o codificador 36. A inclusão do codificador 36 permite que o dispositivo 40 transcodifique o sinal de entrada codificado recebido da trajetória 11, que se conforma a um primeiro padrão de codificação, em um sinal de saída codificado que se conforma a um segundo padrão de codificação que pode ser igual a ou diferente do primeiro padrão de codificação contanto que os sinais de sub-banda dos dois padrões de codificação sejam compatíveis. Isso pode ser feito nessa implantação fazendo com que o codificador 36 aplique um processo de codificação aos sinais de sub-banda para obter segundas informações de áudio codificadas que se conformam ao segundo padrão de codificação. As segundas informações de áudio codificadas são passadas ao formatador 38. O processo de codificação pode ser adaptado em resposta a metadados recebidos da trajetória 43. O processo de codificação pode gerar, ainda, outros metadados ao longo da trajetória 43 para uso pelos processos executados no dispositivo 10 para decodificar as informações de áudio codificadas. O formatador 38 une os metadados recebidos da trajetória 43 e as informações de áudio codificadas que a mesma recebe em um sinal de saída codificado que tem um formato que é adequado para transmissão ou armazenamento.
[00030] Ainda outra implantação do dispositivo 40 é mostrada na Figura 5. Essa implantação inclui o banco de filtro de síntese 18, que é aplicado aos sinais de sub-banda decodificados para obter uma representação de domínio de tempo ou de banda larga das informações de áudio codificadas. A inclusão do banco de filtro de síntese 18 e do banco de filtro de análise 32 permite que o dispositivo 40 transcodifique entre essencialmente qualquer escolha de padrões de codificação. A saída do banco de filtro de síntese 18 é passada para o banco de filtro de análise 32, que gera sinais de sub-banda para codificação pelo codificador 36. O codificador 36 aplica um processo de codificação à saída do banco de filtro de análise 32 para obter segundas informações de áudio codificadas, que são passadas para o formatador 38. O processo de codificação pode gerar, ainda, outros metadados ao longo da trajetória 43 para uso pelos processos executados no dispositivo 10 para decodificar as informações de áudio codificadas. O calculador de metadados 44 pode calcular valores de parâmetro de metadados a partir de sua análise de qualquer um ou todos os sinais de sub-banda recebidos do decodificador 14, da saída do banco de filtro de síntese 18, e da saída do banco de filtro de análise 32.
[00031] Alguns aspectos do dispositivo 10 e do dispositivo 30 são descritos abaixo em mais detalhes. Essas descrições se aplicam aos recursos correspondentes do dispositivo 40. Esses aspectos são descritos em termos de recursos e características de métodos e dispositivos que se conformam ao Padrão ATSC mencionado acima. Esses recursos e características específicos são discutidos a título de exemplo, apenas. Os princípios subjacentes a essas implantações são diretamente aplicáveis a métodos e dispositivos que se conformam a outros padrões. C. Receptor/Decodificador
[00032] Os problemas de reprodução descritos acima podem ser resolvidos por meio do uso de uma ou mais das três técnicas diferentes descritas abaixo. A primeira técnica usa limitação de ganho e pode ser implantada por recursos apenas no dispositivo 10. As segunda e terceira técnicas usam compressão de extensão dinâmica e suas implantações requerem recursos tanto no dispositivo 10 quanto no dispositivo 30. 1. Limitador de Ganho
[00033] A primeira técnica opera o dispositivo 10 em Modo de RF ao invés de em Modo de Linha, de modo que decodifique um sinal de entrada codificado compatível com o ATSC com o controle de extensão dinâmica 16 fornecendo níveis mais elevados de compressão de extensão dinâmica e um nível de reprodução de referência mais elevado. O limitador de ganho 20 fornece ganho adicional, aumentando o nível de reprodução de referência eficaz a um valor de -14 dBps a -8 dBps. Resultados empíricos indicam que um nível de referência igual a -11 dBps oferece bons resultados para muitas aplicações.
[00034] O limitador de ganho 20 aplica, ainda, uma operação limitadora para impedir que o sinal digital amplificado exceda 0 dBps. As características de operação do limitador podem afetar a qualidade percebida do áudio reproduzido, mas nenhum limitador particular é crítico para a presente invenção. O limitador pode ser implantado em essencialmente qualquer maneira que possa ser desejada. Preferivelmente, o limitador é projetado para fornecer uma função limitadora "leve" ao invés de uma função de recorte "severa". 2. Valores de Compressão Diferenciais
[00035] A segunda técnica permite que o dispositivo 10 aplique um ou mais parâmetros de compressão de extensão dinâmica modificados no controle de extensão dinâmica 16. O deformatador 12 obtém valores de parâmetro de compressão de extensão dinâmica diferenciais (DRC) do sinal de entrada codificado e passa os valores de parâmetro diferenciais juntamente com valores de parâmetro de DRC convencionais ao longo da trajetória 13 para o controle de extensão dinâmica 16. O controle de extensão dinâmica 16 calcula os um ou mais valores de parâmetro de DRC necessários através de combinação aritmética dos valores de parâmetro convencionais de DRC com valores de parâmetro de DRC diferenciais correspondentes. O limitador de ganho 20 não precisa ser usado nessa situação.
[00036] Os valores de parâmetro de DRC diferenciais são fornecidos no sinal de entrada codificado pelo dispositivo codificador/transmissor 30 que gerou o sinal de entrada codificado. Isso é descrito abaixo.
[00037] Se o sinal de entrada codificado não contém esses valores de DRC diferenciais, o dispositivo 10 pode usar o limitador de ganho 20 de acordo com a primeira técnica descrita acima. 3. Perfil de Compressão Distinto
[00038] A terceira técnica permite que o dispositivo 10 aplique a compressão de extensão dinâmica de acordo com um novo perfil de compressão de extensão dinâmica no controle de extensão dinâmica 16. O deformatador 12 obtém um ou mais valores de parâmetro de DRC para o novo perfil do sinal de entrada codificado e os passa ao longo da trajetória 13 para o controle de extensão dinâmica 16. O limitador de ganho 20 não precisa ser usado nessa situação.
[00039] Os valores de parâmetro de DRC para o novo perfil de compressão de extensão dinâmica são fornecidos no sinal de entrada codificado pelo dispositivo codificador/transmissor 30 que gerou o sinal de entrada codificado. Isso é descrito abaixo.
[00040] Se o sinal de entrada codificado não contém os um ou mais valores de parâmetro de DRC para o novo perfil de DRC, o dispositivo 10 pode usar o limitador de ganho 20 de acordo com a primeira técnica descrita acima. D. Codificador/Transmissor 1. Valores de Compressão Diferenciais
[00041] Os processos para a segunda técnica discutida acima são implantados no dispositivo 10 por meio do uso de valores de parâmetro de DRC diferenciais que são extraídos do sinal de entrada codificado. Esses valores de parâmetro diferenciais são fornecidos pelo dispositivo 30 que gerou o sinal codificado.
[00042] O dispositivo 30 fornece um conjunto de valores de parâmetro de DRC diferenciais que representam a diferença entre um conjunto de valores de parâmetro de DRC que estarão presentes no sinal codificado e um conjunto de valores de parâmetro de base correspondentes para um novo perfil de DRC que são requeridos para impedir que as amostras de sinal de áudio codificado excedam 0 dBps para um nível de reprodução de referência mais elevado. Nenhum método particular para calcular os valores de parâmetro de DRC é crítico para a presente invenção. Métodos conhecidos para cálculo dos valores de parâmetro que são compatíveis com o Padrão ATSC são revelados em "ATSC Recommended Practice: Techniques for Estalishing an Maintaining Audio Loudness for Digital Television,"Documento A/85, 4 de novembro de 2009 publicado pelo Comitê de Sistemas de Televisão Avançados, Inc., especialmente Seção 9 e Anexo F, e em Robinson etal.,"Dynamic Range Control via Metadata,"pré-impressão n- 5028, 107a Convenção AES, New York, setembro de 1999.
[00043] Se o sinal de saída codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, o nível de reprodução de referência é aumentado para um valor de -14 dBps a -8 dBps. Resultados empíricos indicam que um nível de referência igual a -11 CIBFS oferece bons resultados para muitas aplicações.
[00044] Para sinais de saída codificados compatíveis com o ATSC, o calculador de metadados 34 calcula um valor de parâmetro diferencial para o parâmetro de base correspondente "compr" especificado no padrão. O formatador 38 pode unir o valor de parâmetro diferencial em porções de cada quadro de sinal codificado denotado como "addbsi" (informações de fluxo de bit adicionais) e/ou "auxdata" (dados auxiliares). Se os valores de parâmetro diferenciais são unidos nas porções de "addbsi" ou de "auxdata", o sinal codificado será compatível como todos os decodificadores compatíveis com o ATSC. Aqueles decodificadores que não reconhecem os valores de parâmetro diferenciais ainda podem processar e decodificar os quadros de sinal codificado corretamente ignorando as porções de "addbsi" e de "auxdata". Refira-se ao documento A/52b citado acima para mais detalhes.
[00045] Para sinais de saída codificados compatíveis com os padrões MPEG-2 AAC ou de áudio MPEG-4, o formatador 38 pode unir os valores de parâmetro diferenciais em porções de cada quadro de sinal codificado denotado como "Fill_Element" ou "Data_Stream_Element" nos dois padrões. Se os valores de parâmetro diferenciais são unidos em qualquer uma dessas porções, o sinal codificado será compatível com todos os decodificadores compatíveis com padrões MPEG-2 AAC e de áudio MPEG-4. Refira-se aos documentos ISO/IEC 13818-7 e ISO/IEC 14496-3 citados acima para mais detalhes.
[00046] Os valores de parâmetro diferenciais podem ser calculados e inseridos no sinal codificado a um índice que é maior que, igual a, ou menor que o índice no qual os valores de parâmetro de base correspondentes estão no sinal codificado. O índice para os valores diferenciais pode variar. Sinalizadores ou bits que indicam se um valor diferencial prévio deve ser reusado também podem ser incluídos no sinal codificado. 2. Perfil de Compressão Distinto
[00047] Os processos para a terceira técnica discutida acima são implantados no dispositivo 10 por meio do uso de valores de parâmetro de DRC para o novo perfil de compressão de extensão dinâmica que são extraídos do sinal de entrada codificado. Esses valores de parâmetro são fornecidos pelo dispositivo 30 que gerou o sinal codificado.
[00048] O dispositivo 30 deriva valores de parâmetro de DRC para um novo perfil de DRC através do cálculo de valores de parâmetro necessários para impedir que as amostras de sinal de áudio decodificado excedam 0 dBps para um nível de reprodução de referência mais elevado.
[00049] Se o sinal de saída codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, o calculador de metadados 34 calcula um valor de compressão de DRC baseado em um pressuposto de que o nível de reprodução de referência é aumentado para um valor de -14 dBps a -8 dBps . Resultados empíricos indicam que um nível de referência igual a -11 dBps oferece bons resultados para muitas aplicações. O formatador 38 pode unir o valor de parâmetro para o perfil de DRC em porções de cada quadro de sinal codificado conforme descrito acima para os parâmetros diferenciais. O uso dessas porções dos quadros permite que o sinal codificado seja compatível com todos os decodificadores compatíveis com o padrão respectivo. E. Implantação
[00050] Dispositivos que incorporam vários aspectos da presente invenção podem ser implantados em uma variedade de maneiras incluindo software para execução por um computador ou algum outro dispositivo que inclui componentes mais especializados tais como conjunto de circuitos de processador de sinal digital (DSP) acoplados a componentes semelhantes àqueles encontrados em um computador de propósito geral. A Figura 6 é um diagrama de bloco esquemático de um dispositivo 70 que pode ser usado para implantar aspectos da presente invenção. O processador 72 fornece recursos de computação. RAM 73 é a memória de acesso aleatório de sistema (RAM) usada pelo processador 72 para processamento. ROM 74 representa alguma forma de armazenamento persistente tal como memória apenas leitura (ROM) para armazenar programas necessários para operar o dispositivo 70 e possivelmente para realizar vários aspectos da presente invenção. Controle de E/S 75 representa um conjunto de circuitos de interface para receber sinais de entrada e transmitir sinais de saída por meio dos canais de comunicação 76, 77. Na modalidade mostrada, todos os componentes de sistemas principais são conectados ao barramento 71, que pode representar mais que um barramento físico ou lógico; contudo, uma arquitetura de barramento não é requerida para implantar a presente invenção.
[00051] Em modalidades implantadas por um sistema de computador de propósito geral, componentes adicionais podem ser incluídos para se relacionar a dispositivos tais como um teclado ou mouse e um monitor, e para controlar um dispositivo de armazenamento 78 que tem um meio de armazenamento tal como um disco ou fita magnética, ou um meio óptico. O meio de armazenamento pode ser usado para gravar programas de instruções para aplicações, utilitários e sistemas de operação, e podem incluir programas que implantam vários aspectos da presente invenção.
[00052] As funções requeridas para praticar vários aspectos da presente invenção podem ser executadas por componentes que são implantados em uma ampla variedade de maneiras incluindo componentes lógicos discretos, circuitos integrados, um ou mais ASICs e/ou processadores controlados por programa. A maneira pela qual esses componentes são implantados não é importante para a presente invenção.
[00053] Implantações de software da presente invenção podem ser transmitidas por uma variedade de meios legíveis por máquina tal como trajetórias de comunicação moduladas ou de banda base ao longo de todo o espectro incluindo de frequências supersônicas a ultravioletas, ou meios de armazenamento que transmitem informações por meio do uso de essencialmente qualquer tecnologia de gravação incluindo fita, cartões ou disco magnéticos, disco ou cartões ópticos, e marcações detectáveis em meios incluindo papel.

Claims (14)

1. Método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, compreendendo as etapas de: receber o sinal de entrada codificado que inclui informações de áudio codificadas e metadados associados que incluem um ou mais parâmetros de controle de decodificação e um ou mais primeiros parâmetros que especificam a compressão de extensão dinâmica de acordo com um primeiro perfil de compressão de extensão dinâmica e que incluem, opcionalmente, um ou mais segundos parâmetros que especificam a compressão de extensão dinâmica de acordo com um segundo perfil de compressão de extensão dinâmica, em que os um ou mais primeiros parâmetros têm valores que são estabelecidos de acordo com um processo de codificação que gerou as informações de áudio codificadas para representar os estímulos auditivos com amplitudes que não excedem um nível de recorte para reprodução em um primeiro nível de reprodução de referência, e em que os um ou mais segundos parâmetros têm valores que são ajustados de acordo com o processo de codificação que gerou as informações de áudio codificadas para representar os estímulos auditivos com amplitudes que não excedem o nível de recorte para reprodução em um segundo nível de reprodução de referência que é maior que o primeiro nível de reprodução de referência; aplicar um processo de decodificação às informações de áudio codificadas para obter sinais de sub-banda que representam conteúdo espectral dos estímulos auditivos, em que o processo de decodificação é adaptado em resposta aos um ou mais parâmetros de controle de decodificação; caracterizado pelo fato de que ainda compreende: modificar os sinais de sub-banda para obter sinais de sub- banda modificados com características de extensão dinâmica alteradas, em que a modificação é adaptada em resposta aos um ou mais segundos parâmetros se os metadados incluem os um ou mais segundos parâmetros ou é adaptada em resposta aos um ou mais primeiros parâmetros se os metadados não incluem os um ou mais segundos parâmetros; aplicar um banco de filtro de síntese aos sinais de sub- banda modificados para obter um sinal de áudio de domínio de tempo; e se os metadados não incluem os um ou mais segundos parâmetros, aplicar um ganho e um limitador ao sinal de áudio de domínio de tempo em resposta aos metadados, em que a aplicação do ganho modifica o sinal de áudio de domínio de tempo para obter o sinal de saída de áudio com amplitudes para reprodução no segundo nível de reprodução de referência, e em que a aplicação do limitador impede que as amplitudes do sinal de saída de áudio excedam o nível de recorte.
2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que os um ou mais segundos parâmetros representam diferenças entre parâmetros correspondentes para o primeiro perfil de compressão de extensão dinâmica e o segundo perfil de compressão de extensão dinâmica.
3. Método, de acordo com a reivindicação 1 ou 2, caracterizado pelo fato de que o sinal de entrada codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, o primeiro nível de reprodução de referência corresponde a uma amplitude de 20 dB abaixo do nível de recorte, e o segundo nível de reprodução de referência corresponde a uma amplitude de 11 dB abaixo do nível de recorte.
4. Método para codificar um sinal de entrada de áudio que representa estímulos auditivos, compreendendo as etapas de: receber o sinal de entrada de áudio; aplicar um banco de filtro de análise ao sinal de entrada de áudio para gerar sinais de sub-banda que representam conteúdo espectral do sinal de entrada de áudio; analisar um ou mais sinais derivados do sinal de entrada de áudio para calcular metadados que incluem um ou mais primeiros parâmetros que especificam a compressão de extensão dinâmica de acordo com um primeiro perfil de compressão de extensão dinâmica e um ou mais segundos parâmetros que especificam a compressão de extensão dinâmica de acordo com um segundo perfil de compressão de extensão dinâmica, em que os um ou mais primeiros parâmetros têm valores que são ajustados para representar os estímulos auditivos com amplitudes que não excedem um nível de recorte para reprodução em um primeiro nível de reprodução de referência, e em que os um ou mais segundos parâmetros têm valores que são ajustados para representar os estímulos auditivos com amplitudes que não excedem o nível de recorte para reprodução em um segundo nível de reprodução de referência; aplicar um processo de codificação aos sinais de sub- banda para obter informações de áudio codificadas; caracterizado pelo fato de que ainda compreende: unir as informações de áudio codificadas e os metadados em um sinal de saída codificado que tem um formato adequado para transmissão ou armazenamento, em que os um ou mais segundos parâmetros representam diferenças entre parâmetros correspondentes para o primeiro perfil de compressão de extensão dinâmica e o segundo perfil de compressão de extensão dinâmica.
5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o sinal de saída codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, o primeiro nível de reprodução de referência corresponde a uma amplitude de 20 dB abaixo do nível de recorte e o segundo nível de reprodução de referência corresponde a uma amplitude de 11 dB abaixo do nível de recorte.
6. Método para transcodificar um sinal de entrada codificado para gerar um sinal de saída codificado, caracterizado pelo fato de que compreende as etapas de: receber o sinal de entrada codificado que inclui as primeiras informações de áudio codificadas e metadados associados que incluem um ou mais parâmetros de controle de decodificação e um ou mais primeiros parâmetros que especificam a compressão de extensão dinâmica de acordo com um primeiro perfil de compressão de extensão dinâmica, em que os um ou mais primeiros parâmetros têm valores que são ajustados de acordo com um primeiro processo de codificação que gerou as primeiras informações de áudio codificadas para representar estímulos auditivos com amplitudes que não excedem um nível de recorte para reprodução em um primeiro nível de reprodução de referência; aplicar um processo de decodificação às primeiras informações de áudio codificadas para obter sinais de sub-banda que representam o conteúdo espectral dos estímulos auditivos, em que o processo de decodificação é adaptado em resposta aos um ou mais parâmetros de controle de decodificação; analisar um ou mais sinais obtidos dos sinais de sub-banda para calcular um ou mais segundos parâmetros que especificam a compressão de extensão dinâmica de acordo com um segundo perfil de compressão de extensão dinâmica, em que os um ou mais segundos parâmetros têm valores que são ajustados para representar os estímulos auditivos com amplitudes que não excedem o nível de recorte para reprodução em um segundo nível de reprodução de referência; e unir as segundas informações de áudio codificadas, os um ou mais primeiros parâmetros e os um ou mais segundos parâmetros em um sinal de saída codificado que tem um formato adequado para transmissão ou armazenamento, em que as segundas informações de áudio codificadas são uma representação codificada dos sinais de sub-banda.
7. Método, de acordo com a reivindicação 6, caracterizado pelo fato de que os um ou mais segundos parâmetros representam diferenças entre parâmetros correspondentes para o primeiro perfil de compressão de extensão dinâmica e o segundo perfil de compressão de extensão dinâmica.
8. Método, de acordo com a reivindicação 6 ou 7, caracterizado pelo fato de que compreende aplicar um banco de filtro de síntese aos sinais de sub-banda para obter os um ou mais sinais que são analisados para calcular os um ou mais segundos parâmetros que especificam a compressão de extensão dinâmica.
9. Método, de acordo com qualquer uma das reivindicações 6 a 8, caracterizado pelo fato de que compreende aplicar um segundo processo de codificação aos sinais de sub-banda para gerar as segundas informações de áudio codificadas.
10. Método, de acordo com qualquer uma das reivindicações 6 a 8, caracterizado pelo fato de que as segundas informações de áudio codificadas são as primeiras informações de áudio codificadas.
11. Método, de acordo com qualquer uma das reivindicações 6 a 10, caracterizado pelo fato de que o sinal de entrada codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, e o primeiro nível de reprodução de referência corresponde a uma amplitude de 20 dB abaixo do nível de recorte.
12. Método, de acordo com qualquer uma das reivindicações 6 a 10, caracterizado pelo fato de que o sinal de saída codificado se conforma ao Padrão ATSC, ao Padrão MPEG-2 AAC ou ao Padrão de Áudio MPEG-4, e o segundo nível de reprodução de referência corresponde a uma amplitude de 11 dB abaixo do nível de recorte.
13. Aparelho caracterizado pelo fato de que compreende meios para executar as etapas do método conforme definido em qualquer uma das reivindicações de 1 a 12.
14. Meio de armazenamento em um dispositivo caracterizado pelo fato de que é para executar as etapas do método conforme definido em qualquer uma das reivindicações de 1 a 12.
BR112012019880-7A 2010-02-11 2011-02-03 método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método para codificar um sinal de entrada de áudio que representa estímulos auditivos, método para transcodificar um sinal de entrada codificado para gerar um sinal de saída codificado, aparelho e meio de armazenamento BR112012019880B1 (pt)

Priority Applications (1)

Application Number Priority Date Filing Date Title
BR122019025627-6A BR122019025627B1 (pt) 2010-02-11 2011-02-03 método e aparelho para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, meio não-transitório em um dispositivo para executar um método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método e aparelho

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US30364310P 2010-02-11 2010-02-11
US61/303,643 2010-02-11
PCT/US2011/023531 WO2011100155A1 (en) 2010-02-11 2011-02-03 System and method for non-destructively normalizing loudness of audio signals within portable devices

Publications (2)

Publication Number Publication Date
BR112012019880A2 BR112012019880A2 (pt) 2016-04-26
BR112012019880B1 true BR112012019880B1 (pt) 2020-10-13

Family

ID=43881135

Family Applications (2)

Application Number Title Priority Date Filing Date
BR122019025627-6A BR122019025627B1 (pt) 2010-02-11 2011-02-03 método e aparelho para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, meio não-transitório em um dispositivo para executar um método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método e aparelho
BR112012019880-7A BR112012019880B1 (pt) 2010-02-11 2011-02-03 método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método para codificar um sinal de entrada de áudio que representa estímulos auditivos, método para transcodificar um sinal de entrada codificado para gerar um sinal de saída codificado, aparelho e meio de armazenamento

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BR122019025627-6A BR122019025627B1 (pt) 2010-02-11 2011-02-03 método e aparelho para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, meio não-transitório em um dispositivo para executar um método para decodificar um sinal de entrada codificado para gerar um sinal de saída de áudio, método e aparelho

Country Status (18)

Country Link
US (7) US8903729B2 (pt)
EP (3) EP3444816B8 (pt)
JP (2) JP5666625B2 (pt)
KR (1) KR101381588B1 (pt)
CN (2) CN103795364B (pt)
AR (1) AR080156A1 (pt)
BR (2) BR122019025627B1 (pt)
CA (6) CA2787466C (pt)
CL (1) CL2012002213A1 (pt)
CO (1) CO6511277A2 (pt)
EA (1) EA023730B9 (pt)
ES (1) ES2916403T3 (pt)
MX (1) MX2012008954A (pt)
MY (1) MY169981A (pt)
SG (1) SG182632A1 (pt)
TW (2) TWI447709B (pt)
UA (1) UA105277C2 (pt)
WO (1) WO2011100155A1 (pt)

Families Citing this family (60)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10848118B2 (en) 2004-08-10 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
US10158337B2 (en) 2004-08-10 2018-12-18 Bongiovi Acoustics Llc System and method for digital signal processing
US11431312B2 (en) 2004-08-10 2022-08-30 Bongiovi Acoustics Llc System and method for digital signal processing
US10701505B2 (en) 2006-02-07 2020-06-30 Bongiovi Acoustics Llc. System, method, and apparatus for generating and digitally processing a head related audio transfer function
US10848867B2 (en) 2006-02-07 2020-11-24 Bongiovi Acoustics Llc System and method for digital signal processing
TWI501580B (zh) 2009-08-07 2015-09-21 Dolby Int Ab 資料串流的鑑別
TWI413110B (zh) 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
CN102754159B (zh) 2009-10-19 2016-08-24 杜比国际公司 指示音频对象的部分的元数据时间标记信息
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
TWI525987B (zh) 2010-03-10 2016-03-11 杜比實驗室特許公司 在單一播放模式中組合響度量測的系統
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9171549B2 (en) * 2011-04-08 2015-10-27 Dolby Laboratories Licensing Corporation Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams
JP6174129B2 (ja) * 2012-05-18 2017-08-02 ドルビー ラボラトリーズ ライセンシング コーポレイション パラメトリックオーディオコーダに関連するリバーシブルダイナミックレンジ制御情報を維持するシステム
US10844689B1 (en) 2019-12-19 2020-11-24 Saudi Arabian Oil Company Downhole ultrasonic actuator system for mitigating lost circulation
US9378748B2 (en) * 2012-11-07 2016-06-28 Dolby Laboratories Licensing Corp. Reduced complexity converter SNR calculation
US9411881B2 (en) 2012-11-13 2016-08-09 Dolby International Ab System and method for high dynamic range audio distribution
RU2631139C2 (ru) * 2013-01-21 2017-09-19 Долби Лэборетериз Лайсенсинг Корпорейшн Оптимизация громкости и динамического диапазона через различные устройства воспроизведения
AU2014207590B2 (en) 2013-01-21 2015-08-13 Dolby Laboratories Licensing Corporation Audio encoder and decoder with program loudness and boundary metadata
CN203134365U (zh) * 2013-01-21 2013-08-14 杜比实验室特许公司 用于利用响度处理状态元数据处理音频的音频解码器
RU2639663C2 (ru) * 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
CN110379434B (zh) * 2013-02-21 2023-07-04 杜比国际公司 用于参数化多声道编码的方法
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
US9883318B2 (en) 2013-06-12 2018-01-30 Bongiovi Acoustics Llc System and method for stereo field enhancement in two-channel audio systems
TWM487509U (zh) * 2013-06-19 2014-10-01 杜比實驗室特許公司 音訊處理設備及電子裝置
CN117767898A (zh) * 2013-09-12 2024-03-26 杜比实验室特许公司 用于各种回放环境的动态范围控制
JP6506764B2 (ja) * 2013-09-12 2019-04-24 ドルビー ラボラトリーズ ライセンシング コーポレイション ダウンミックスされたオーディオ・コンテンツについてのラウドネス調整
CN105531762B (zh) * 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US20150095320A1 (en) * 2013-09-27 2015-04-02 Trooclick France Apparatus, systems and methods for scoring the reliability of online information
PL3522157T3 (pl) 2013-10-22 2022-02-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9906858B2 (en) 2013-10-22 2018-02-27 Bongiovi Acoustics Llc System and method for digital signal processing
US20150146099A1 (en) * 2013-11-25 2015-05-28 Anthony Bongiovi In-line signal processor
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
KR102513009B1 (ko) 2013-12-27 2023-03-22 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
EP3111670B1 (en) * 2014-02-27 2023-11-22 Sonarworks SIA Method of and apparatus for determining an equalization filter
US10063207B2 (en) * 2014-02-27 2018-08-28 Dts, Inc. Object-based audio loudness management
RU2658888C2 (ru) * 2014-03-24 2018-06-25 Долби Интернэшнл Аб Способ и устройство для применения сжатия динамического диапазона к сигналу амбиофонии высшего порядка
TR201809427T4 (tr) 2014-03-25 2018-07-23 Fraunhofer Ges Forschung Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇
US10820883B2 (en) 2014-04-16 2020-11-03 Bongiovi Acoustics Llc Noise reduction assembly for auscultation of a body
CN106663434B (zh) * 2014-06-27 2021-09-28 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP3148200B1 (en) * 2014-06-30 2020-06-17 Sony Corporation Information processing device and method selecting content files based on encoding parallelism type
EP2963948A1 (en) * 2014-07-02 2016-01-06 Thomson Licensing Method and apparatus for encoding/decoding of directions of dominant directional signals within subbands of a HOA signal representation
EP4044180A1 (en) 2014-10-01 2022-08-17 Dolby International AB Decoding an encoded audio signal using drc profiles
CN107112023B (zh) 2014-10-10 2020-10-30 杜比实验室特许公司 基于发送无关的表示的节目响度
TWI758146B (zh) 2015-03-13 2022-03-11 瑞典商杜比國際公司 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9590580B1 (en) 2015-09-13 2017-03-07 Guoguang Electric Company Limited Loudness-based audio-signal compensation
TWI594231B (zh) * 2016-12-23 2017-08-01 瑞軒科技股份有限公司 分頻壓縮電路,音訊處理方法以及音訊處理系統
US11089349B2 (en) * 2017-01-20 2021-08-10 Hanwha Techwin Co., Ltd. Apparatus and method for playing back and seeking media in web browser
EP3574583B1 (en) * 2017-03-31 2020-12-09 Dolby International AB Inversion of dynamic range control
CN110033781B (zh) * 2018-01-10 2021-06-01 盛微先进科技股份有限公司 音频处理方法、装置及非暂时性电脑可读媒体
CA3168579A1 (en) 2018-04-09 2019-10-17 Dolby International Ab Methods, apparatus and systems for three degrees of freedom (3dof+) extension of mpeg-h 3d audio
WO2019200119A1 (en) 2018-04-11 2019-10-17 Bongiovi Acoustics Llc Audio enhanced hearing protection system
WO2020028833A1 (en) 2018-08-02 2020-02-06 Bongiovi Acoustics Llc System, method, and apparatus for generating and digitally processing a head related audio transfer function
EP3809709A1 (en) * 2019-10-14 2021-04-21 Koninklijke Philips N.V. Apparatus and method for audio encoding
CN112732069A (zh) * 2021-02-20 2021-04-30 上海创感传感技术有限公司 一种电子设备状态修改方法和装置
CN112992159B (zh) * 2021-05-17 2021-08-06 北京百瑞互联技术有限公司 一种lc3音频编解码方法、装置、设备及存储介质

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2373975B (en) 2001-03-30 2005-04-13 Sony Uk Ltd Digital audio signal processing
US7328151B2 (en) * 2002-03-22 2008-02-05 Sound Id Audio decoder with dynamic adjustment of signal modification
US7072477B1 (en) 2002-07-09 2006-07-04 Apple Computer, Inc. Method and apparatus for automatically normalizing a perceived volume level in a digitally encoded file
US7454331B2 (en) * 2002-08-30 2008-11-18 Dolby Laboratories Licensing Corporation Controlling loudness of speech in signals that contain speech and other types of audio material
US7398207B2 (en) * 2003-08-25 2008-07-08 Time Warner Interactive Video Group, Inc. Methods and systems for determining audio loudness levels in programming
US7617109B2 (en) * 2004-07-01 2009-11-10 Dolby Laboratories Licensing Corporation Method for correcting metadata affecting the playback loudness and dynamic range of audio information
US7729673B2 (en) 2004-12-30 2010-06-01 Sony Ericsson Mobile Communications Ab Method and apparatus for multichannel signal limiting
JP2007109328A (ja) 2005-10-14 2007-04-26 Kenwood Corp 再生装置
US20080025530A1 (en) 2006-07-26 2008-01-31 Sony Ericsson Mobile Communications Ab Method and apparatus for normalizing sound playback loudness
EP2063418A4 (en) * 2006-09-15 2010-12-15 Panasonic Corp AUDIO CODING DEVICE AND AUDIO CODING METHOD
DE102006048685A1 (de) * 2006-10-14 2008-04-17 Mtu Aero Engines Gmbh Turbinenschaufel einer Gasturbine
US20090253457A1 (en) 2008-04-04 2009-10-08 Apple Inc. Audio signal processing for certification enhancement in a handheld wireless communications device
US8645129B2 (en) * 2008-05-12 2014-02-04 Broadcom Corporation Integrated speech intelligibility enhancement system and acoustic echo canceller
US9197181B2 (en) * 2008-05-12 2015-11-24 Broadcom Corporation Loudness enhancement system and method
US8315396B2 (en) 2008-07-17 2012-11-20 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating audio output signals using object based metadata
TWI416868B (zh) * 2008-07-29 2013-11-21 Lg Electronics Inc 音頻訊號之處理方法及其裝置
US8798776B2 (en) * 2008-09-30 2014-08-05 Dolby International Ab Transcoding of audio metadata
JP2010135906A (ja) 2008-12-02 2010-06-17 Sony Corp クリップ防止装置及びクリップ防止方法
TWI447709B (zh) * 2010-02-11 2014-08-01 Dolby Lab Licensing Corp 用以非破壞地正常化可攜式裝置中音訊訊號響度之系統及方法
PL2381574T3 (pl) 2010-04-22 2015-05-29 Fraunhofer Ges Forschung Urządzenie i sposób do modyfikacji wejściowego sygnału audio
JP5903758B2 (ja) 2010-09-08 2016-04-13 ソニー株式会社 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8989884B2 (en) 2011-01-11 2015-03-24 Apple Inc. Automatic audio configuration based on an audio output device
JP2012235310A (ja) 2011-04-28 2012-11-29 Sony Corp 信号処理装置および方法、プログラム、並びにデータ記録媒体
US8965774B2 (en) 2011-08-23 2015-02-24 Apple Inc. Automatic detection of audio compression parameters
JP5845760B2 (ja) 2011-09-15 2016-01-20 ソニー株式会社 音声処理装置および方法、並びにプログラム
JP2013102411A (ja) 2011-10-14 2013-05-23 Sony Corp 音声信号処理装置、および音声信号処理方法、並びにプログラム
BR112014015629B1 (pt) 2011-12-15 2022-03-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Aparelho e método para evitar perturbações de clipagem.
TWI517142B (zh) 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
EP2757558A1 (en) 2013-01-18 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Time domain level adjustment for audio signal decoding or encoding
RU2639663C2 (ru) 2013-01-28 2017-12-21 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Способ и устройство для нормализованного проигрывания аудио медиаданных с вложенными метаданными громкости и без них на новых медиаустройствах
US9559651B2 (en) 2013-03-29 2017-01-31 Apple Inc. Metadata for loudness and dynamic range control
US9607624B2 (en) 2013-03-29 2017-03-28 Apple Inc. Metadata driven dynamic range control
JP2015050685A (ja) 2013-09-03 2015-03-16 ソニー株式会社 オーディオ信号処理装置および方法、並びにプログラム
CN105531762B (zh) 2013-09-19 2019-10-01 索尼公司 编码装置和方法、解码装置和方法以及程序
US9300268B2 (en) 2013-10-18 2016-03-29 Apple Inc. Content aware audio ducking
PL3522157T3 (pl) 2013-10-22 2022-02-07 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Koncepcja połączonej kompresji zakresu dynamiki i sterowanego zapobiegania obcinaniu dla urządzeń audio
US9240763B2 (en) 2013-11-25 2016-01-19 Apple Inc. Loudness normalization based on user feedback
US9276544B2 (en) 2013-12-10 2016-03-01 Apple Inc. Dynamic range control gain encoding
KR102513009B1 (ko) 2013-12-27 2023-03-22 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US9608588B2 (en) 2014-01-22 2017-03-28 Apple Inc. Dynamic range control with large look-ahead
TR201809427T4 (tr) 2014-03-25 2018-07-23 Fraunhofer Ges Forschung Di̇nami̇k aralik kontrolünde etki̇n edi̇ni̇m koduna sahi̇p olan ses kodlama ci̇hazi ve bi̇r ses dekoderi̇
US9654076B2 (en) 2014-03-25 2017-05-16 Apple Inc. Metadata for ducking control
RU2653858C1 (ru) 2014-05-28 2018-05-15 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Процессор данных и транспорт данных пользовательского управления на устройства декодирования и воспроизведения аудио
SG11201609855WA (en) 2014-05-30 2016-12-29 Sony Corp Information processing apparatus and information processing method
EP3163570A4 (en) 2014-06-30 2018-02-14 Sony Corporation Information processor and information-processing method
TWI631835B (zh) 2014-11-12 2018-08-01 弗勞恩霍夫爾協會 用以解碼媒體信號之解碼器、及用以編碼包含用於主要媒體資料之元資料或控制資料的次要媒體資料之編碼器
US20160315722A1 (en) 2015-04-22 2016-10-27 Apple Inc. Audio stem delivery and control
US10109288B2 (en) 2015-05-27 2018-10-23 Apple Inc. Dynamic range and peak control in audio using nonlinear filters
BR112017025552B1 (pt) 2015-05-29 2023-01-24 Fraunhofer - Gesellschaft Zur Förderung Der Angewandten Forschung E.V Dispositivo e método para controle de volume e sintonizador de rádio
MX2017016333A (es) 2015-06-17 2018-04-24 Fraunhofer Ges Forschung Control de intensidad subjetiva para interaccion del usuario en sistemas de codificacion de audio.
US9837086B2 (en) 2015-07-31 2017-12-05 Apple Inc. Encoded audio extended metadata-based dynamic range control
US9934790B2 (en) 2015-07-31 2018-04-03 Apple Inc. Encoded audio metadata-based equalization
US10341770B2 (en) 2015-09-30 2019-07-02 Apple Inc. Encoded audio metadata-based loudness equalization and dynamic equalization during DRC

Also Published As

Publication number Publication date
AR080156A1 (es) 2012-03-14
EP2534656B1 (en) 2018-09-05
MY169981A (en) 2019-06-19
EA023730B1 (ru) 2016-07-29
JP5666625B2 (ja) 2015-02-12
CA2787466C (en) 2016-04-05
CA2787466A1 (en) 2011-08-18
EP2534656A1 (en) 2012-12-19
CL2012002213A1 (es) 2012-11-30
EP3444816B1 (en) 2022-04-13
TW201205559A (en) 2012-02-01
BR122019025627B1 (pt) 2021-01-19
CA3075793A1 (en) 2011-08-18
WO2011100155A1 (en) 2011-08-18
SG182632A1 (en) 2012-08-30
US20190325886A1 (en) 2019-10-24
EP4047602A1 (en) 2022-08-24
US11670315B2 (en) 2023-06-06
CA2995461C (en) 2020-04-28
US10566006B2 (en) 2020-02-18
BR112012019880A2 (pt) 2016-04-26
EP3444816B8 (en) 2022-05-25
JP6133263B2 (ja) 2017-05-24
US20170213566A1 (en) 2017-07-27
CA3201814A1 (en) 2011-08-18
UA105277C2 (ru) 2014-04-25
EA023730B9 (ru) 2016-11-30
US8903729B2 (en) 2014-12-02
CA3075793C (en) 2021-05-18
MX2012008954A (es) 2012-08-23
CA2995461A1 (en) 2011-08-18
ES2916403T3 (es) 2022-06-30
CN102754151A (zh) 2012-10-24
CN103795364B (zh) 2016-08-24
CA2918302A1 (en) 2011-08-18
KR101381588B1 (ko) 2014-04-17
TWI529703B (zh) 2016-04-11
JP2013519918A (ja) 2013-05-30
CA3114177C (en) 2023-08-01
EP3444816A1 (en) 2019-02-20
CA2918302C (en) 2018-04-03
US20120310654A1 (en) 2012-12-06
US11341982B2 (en) 2022-05-24
EA201270712A1 (ru) 2013-01-30
US20150043754A1 (en) 2015-02-12
CA3114177A1 (en) 2011-08-18
US20220358944A1 (en) 2022-11-10
US20200176008A1 (en) 2020-06-04
US11948592B2 (en) 2024-04-02
US10418045B2 (en) 2019-09-17
US9646622B2 (en) 2017-05-09
CO6511277A2 (es) 2012-08-31
TW201506912A (zh) 2015-02-16
TWI447709B (zh) 2014-08-01
CN102754151B (zh) 2014-03-05
US20230343347A1 (en) 2023-10-26
CN103795364A (zh) 2014-05-14
JP2015045886A (ja) 2015-03-12
KR20120124484A (ko) 2012-11-13

Similar Documents

Publication Publication Date Title
US11670315B2 (en) System and method for non-destructively normalizing loudness of audio signals within portable devices

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 03/02/2011, OBSERVADAS AS CONDICOES LEGAIS.

B25G Requested change of headquarter approved

Owner name: DOLBY LABORATORIES LICENSING CORPORATION (US) ; DOLBY INTERNATIONAL AB (IE)