BRPI0711185A2 - métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto - Google Patents

métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto Download PDF

Info

Publication number
BRPI0711185A2
BRPI0711185A2 BRPI0711185-1A BRPI0711185A BRPI0711185A2 BR PI0711185 A2 BRPI0711185 A2 BR PI0711185A2 BR PI0711185 A BRPI0711185 A BR PI0711185A BR PI0711185 A2 BRPI0711185 A2 BR PI0711185A2
Authority
BR
Brazil
Prior art keywords
signal
channel
information
audio
lowered
Prior art date
Application number
BRPI0711185-1A
Other languages
English (en)
Inventor
Sung Yong Yoon
Hee Suk Pang
Hyun Kook Lee
Dong Soo Kim
Jae Hyun Lim
Original Assignee
Lg Eletronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Eletronics Inc filed Critical Lg Eletronics Inc
Publication of BRPI0711185A2 publication Critical patent/BRPI0711185A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

MéTODOS E APARELHAGENS PARA CODIFICAçãO E DECODIFICAçãO DE SINAIS DE AUDIO ORIENTADOS A OBJETO é fornecido um método e aparelhagem de codificação de áudio e um método e aparelhagem de decodificação de áudio aonde os sinais de áudio podem ser codificados ou decodificados de modo que as imagens sonoras possam ser localizadas em qualquer posição desejada para cada sinal de áudio de objeto. O método de decodificação de áudio inclui a extração de um sinal rebaixado e a informação paralela orientada a objeto a partir de um sinal de áudio; geração da informação paralela orientada a canal com base na informação paralela orientada a objeto e na informação de controle para renderização do sinal rebaixado; processamento do sinal rebaixado fazendo uso de um sinal de canal sem correlacionamento; e geração de um sinal de áudio de múltiplos canais fazendo uso do sinal rebaixado processado e da informação paralela orientada a canal.

Description

"MÉTODOS E APARELHAGENS PARA CODIFICAÇÃO E DECODIFICAÇÃO DESINAIS DE ÁUDIO ORIENTADOS A OBJETO"
Campo Técnico
A presente invenção refere-se a um método e aparelhagem de codificação de áudioe a um método e aparelhagem para decodificação de áudio aonde as imagens sonoras pos-sam se apresentar localizadas em qualquer posição desejada para cada sinal de áudio deobjeto.
Estado da Técnica
Em regra, nas técnicas de codificação e decodificação de áudio de canais múltiplos,uma quantidade de sinais de canais de um sinal de múltiplos canais é rebaixada para menossinais de canais, transmitindo-se a informação paralela com respeito aos sinais do canaloriginal, e se restabelecendo um sinal de múltiplos canais apresentando tantos canais quan-to o sinal original de múltiplos canais.
As técnicas de codificação e decodificação de áudio orientado a objeto são basica-mente semelhantes às técnicas de codificação e decodificação de áudio de múltiplos canaisem termos de rebaixamento de várias fontes sonoras para menos fontes de sinais sonoros eda transmissão da informação paralela com respeito às fontes sonoras originais. Contudo,nas técnicas de codificação e decodificação de áudio orientado a objeto, os sinais de objeto,que compreendem os elementos básicos ( ou seja, a sonoridade de um instrumento musicalou o som da voz humana) de um sinal de canal, são tratados da mesma maneira como parao caso dos sinais de canal nas técnicas de codificação e decodificação de áudio para múlti-plos canais e podem assim serem codificados.
Em outras palavras, nas técnicas de codificação e decodificação de áudio orientadoa objeto, cada sinal de objeto é correlacionado junto a entidade a ser codificada. A esse res-peito, as técnicas de codificação e decodificação de áudio orientado a objeto apresentam-sediferentes das técnicas de codificação e decodificação para múltiplos canais em que se rea-liza uma operação de codificação de áudio para múltiplos canais simplesmente com base nainformação entre canais a despeito da quantidade de elementos a serem codificados de umsinal de canal.
Descrição da Invenção
Problema Técnico
A presente invenção proporciona um método e aparelhagem para codificação deáudio e um método e aparelhagem para decodificação de áudio em que os sinais de áudiopodem ser codificados ou decodificados de modo que as imagens sonoras possam se apre-sentar localizadas em qualquer posição desejada para cada sinal de áudio de objeto.
Solução Técnica
De acordo com um aspecto da presente invenção, é fornecido um método de deco-dificação de áudio incluindo a extração de um sinal de rebaixamento e informação paralelaorientada a objeto a partir de um sinal de áudio; a geração de informação paralela orientadaa canal com base na informação paralela orientada a objeto e na informação de controlepara renderização do sinal rebaixado; processamento do sinal rebaixado utilizando um sinalde canal sem correlacionamento; e geração de um sinal de áudio de múltiplos canais utili-zando o sinal rebaixado processado e a informação paralela orientada a canal.
De acordo com outro aspecto da presente invenção, é fornecida uma aparelhagemde decodificação de áudio incluindo um demultiplexador que extrai um sinal rebaixado e ainformação paralela orientada a objeto a partir de um sinal de áudio; um conversor de parâ-metro que gera informação paralela orientada a canal com base na informação paralela ori-entada a objeto e na informação de controle para renderização do sinal rebaixado; um pro-cessador de rebaixamento que modifica o sinal rebaixado desfazendo a correlação do sinalrebaixado caso o sinal rebaixado seja um sinal rebaixado estéreo; e um decodificador demúltipls canais que gera um sinal de áudio de múltiplos canais utilizando um sinal rebaixadomodificado obtido pelo processador rebaixado e pela informação paralela orientada a canal.
De acordo com um outro aspecto da presente invenção é fornecido um método dedecodificação de áudio incluindo a extração de um sinal rebaixado e ainformação paralelaorientada a objeto a partir de um sinal de áudio; geração de informação paralela orientada acanal e um ou mais parâmetros de processamento com base na informação paralela orien-tada a objeto e na informação de controle para renderização do sinal rebaixado; geração deum sinal de áudio de múltiplos canais utilizando o sinal rebaixado e a informação paralelaorientada a canal; e modificação do sinal de áudio de múltiplos canais utilizando os parâme-tros de processamento.
De acordo com outro aspecto da presente invenção, é fornecida uma aparelhagemde decodificação de áudio incluindo um demultiplexador que extrai um sinal rebaixado e in-formação paralela orientada a objeto a partir de um sinal de áudio; um conversor de parâme-tro que gera informação paralela orientada a canal e um ou mais parâmetros de processa-mento com base na informação paralela orientada a canal e na informação de controle pararenderização do sinal rebaixado; um decodificador de múltiplos canais que gera um sinal deáudio de múltiplos canais utilizando o sinal rebaixado e a informação paralela orientada acanal; e um processador de canal que modifica o sinal de áudio de múltiplos canais utilizan-do os parâmetros de processamento.
De acordo com outro aspecto da presente invenção, é fornecida uma mídia de gra-vação fixa apresentando um método de decodificação de áudio registrada na mesma, inclu-indo a extração de um sinal rebaixado e a informação paralela orientada a objeto a partir deum sinal de áudio; geração de informação paralela orientada a canal com base na informa-ção paralela orientada a objeto e na informação de controle para a renderização do sinalrebaixado; processamento do sinal rebaixado utilizando um sinal de canal sem correlacio-namento; e geração de um sinal de áudio de múltiplos canais utilizando o sinal rebaixadoprocessado obtido por transferência e pela informação paralela orientada a canal.
De acordo com outro aspecto da presente invenção, é fornecida uma mídia de gra-vação fixa apresentando um método de decodificação de áudio registrado na mesma, inclu-indo a extração de um sinal rebaixado e informação paralela orientada a objeto a partir deum sinal de áudio; geração de informação paralela orientada a canal e um ou mias parâme-tros de processamento com base na informação paralela orientada a objeto e na informaçãode controle para renderização do sinal rebaixado; geração de um sinal de áudio de múltiploscanais utilizando o sinal rebaixado e a informação paralela orientada a canal; e modificandoo sinal de áudio de múltiplos canais utilizando os parâmetros de processamento.Conseqüências Vantajosas
São fornecidos um método e aparelhagem para codificação de áudio e um métodoe aparelhagem para decodificação de áudio em que os sinais de áudio podem ser codifica-dos ou decodificados de modo que as imagens sonoras possam se apresentar localizadasem qualquer posição desejada para cada sinal de áudio de objeto.Breve Descrição dos Desenhos
A presente invenção irá se tornar mais plenamente compreendida a partir da des-crição detalhada fornecida adiante e através dos desenhos de acompanhamento, que sãofornecidos somente para fins ilustrativos, e não pretendem limitar a presente invenção, emque:
a Figura 1 compreende de um diagrama de blocos de um típico sistema de codifi-cação/decodificação de áudio orientado a objeto;
a Figura 2 compreende um diagrama de blocos de uma aparelhagem de decodifi-cação de áudio de acordo com uma primeira modalidade da presente invenção;
a Figura 3 compreende um diagrama de blocos de uma aparelhagem de decodifi-cação de áudio de acordo com uma segunda modalidade da presente invenção;
a Figura 4 compreende um gráfico explicando a influência de uma diferença de am-plitude e uma diferença temporal, que são independentes entre si, na localização de ima-gens sonoras;
a Figura 5 compreende um gráfico de funções com respeito a correlação entre asdiferenças em amplitude e as diferenças temporais que são necessárias para localizaçãodas imagens sonoras em uma posição pré-determinada;
a Figura 6 ilustra o formato do dado de controle incluindo informação harmônica;a Figura 7 representa um diagrama de blocos de uma aparelhagem de decodifica-ção de áudio de acordo com uma terceira modalidade da presente invenção;
a Figura 8 compreende de um diagrama de blocos de um módulo artístico de ga-nhos rebaixado (ADG) que pode ser utilizado na aparelhagem de decodificação de áudio,ilustrada na Figura 7;
a Figura 9 compreende de um diagrama de blocos de uma aparelhagem de decodi-ficação de áudio de acordo com uma quarta modalidade da presente invenção;
a Figura 10 representa um diagrama de blocos de uma aparelhagem de decodifica-ção de áudio de acordo com uma quinta modalidade da presente invenção;
a Figura 11 representa um diagrama de blocos de uma aparelhagem de decodifica-ção de áudio de acordo com uma sexta modalidade da presente invenção;
a Figura 12 compreende de um diagrama de blocos de uma aparelhagem de deco-dificação de áudio de acordo com uma sétima modalidade da presente invenção;
a Figura 13 compreende um diagrama de blocos de uma aparelhagem de decodifi-cação de áudio de acordo com uma oitava modalidade da presente invenção;
a Figura 14 compreende um diagrama para explicação de aplicação de informaçãotri-dimensional (3D) junto a um quadro através da aparelhagem de decodificação de áudio,ilustrada na Figura 13;
a Figura 15 compreende um diagrama de blocos de uma aparelhagem de decodifi-cação de áudio de acordo com uma nona modalidade da presente invenção;
a Figura 16 compreende um diagrama de blocos de uma aparelhagem de decodifi-cação de áudio de acordo com a décima modalidade da presente invenção;
as Figuras de 17 a 19 são diagramas que explicam um método de decodificação deáudio de acordo com uma modalidade da presente invenção; e
a Figura 20 compreende um diagrama de blocos de uma aparelhagem de codifica-ção de áudio de acordo com uma modalidade da presente invenção.
Melhor Modo de Condução da Invenção
A presente invenção será descrita a seguir em detalhes com referência aos dese-nhos de acompanhamento aonde são mostradas as modalidades exemplares da invenção.Um método e aparelhagem de codificação de áudio e um método e aparelhagempara decodificação de áudio de acordo com a presente invenção podem ser aplicados juntoa operações de processamento de áudio orientadas a objeto, mas a presente invenção nãose restringe a esta finalidade. Em outras palavras, o método e aparelhagem de codificaçãode áudio e o método e aparelhagem de decodificação de áudio podem ser aplicados junto avárias operações de processamento de sinal diferentes daquelas operações de processa-mento de áudio orientadas a objeto.
A Figura 1 representa um diagrama de blocos de um típico sistema de codifica-ção/decodificação de áudio orientado a objeto. Em regra, a entrada de sinais de áudio juntoa uma aparelhagem de codificação de áudio orientada a objeto não corresponde aos canaisde um sinal de canais múltiplos, mas compreende sinais independentes de objeto. A esterespeito, uma aparelhagem de codificação de áudio orientada a objeto é diferenciada deuma aparelhagem de codificação de áudio de canais múltiplos aonde são introduzidos ossinais de canais de um sinal de múltiplos canais.
Por exemplo, os sinais de canais, tais como um sinal frontal do canal esquerdo eum sinal frontal do canal direito de um sinal de canal em formato 5,1 podem ser introduzidosjunto a um sinal de áudio de múltiplos canais, em que os sinais de áudio de objeto, tais co-mo a voz humana ou o som de um instrumento musical (por exp., o som de um violino ouum piano) que compreendem entidades menores do que os sinais de canais, podem serintroduzidos junto a uma aparelhagem de codificação de áudio orientada a objeto.
Com referência a Figura 1, um sistema de codificação/decodificação de áudio orien-tado a objeto inclui uma aparelhagem de codificação de áudio orientada a objeto e uma apa-relhagem de decodificação de áudio orientada a objeto. A aparelhagem de codificação deáudio orientada a objeto inclui um codificador de objeto 100, e a aparelhagem de decodifica-ção de áudio orientada a objeto inclui um decodificador de objeto 111 e um componente derenderização 113.
O codificador de objeto 100 recebe N sinais de áudio de objeto, e gera um sinal re-baixado orientado a objeto com um ou mais canais e informação paralela incluindo umaquantidade de peças de informação extraídas de N sinais de áudio de objeto, tal como, dife-rença de energia, diferença de fase, e valor de correlação. A informação paralela e o sinalrebaixado orientado a objeto são incorporados em um único fluxo de bits, e o fluxo de bits étransmitido para a aparelhagem de decodificação orientada a objeto.
A informação paralela pode incluir um sinalizador indicando se deve desempenhara codificação de áudio orientada a canal ou a codificação de áudio orientada a objeto, e as-sim, podendo determinar se deve desempenhar a codificação de áudio orientada a canal oua codificação de áudio orientada a objeto no sinalizador da informação paralela. A informa-ção paralela pode incluir também informação de invólucro, informação de agrupamento, in-formação de período silencioso, e informação de retardo com referência aos sinais de obje-to. A informação paralela pode incluir também informação de diferenças de nível de objeto,informação de correlação cruzada entre objetos, informação rebaixada de ganho, informa-ção de diferenças de nível de canal rebaixado, e informação da energia absoluta de objeto. O decodificador de objeto 111 recebe o sinal rebaixado orientado a objeto e a in-formação paralela a partir da aparelhagem de codificação de áudio orientado a objeto, erestabelece os sinais de objeto apresentando propriedades similares àquelas dos N sinaisde áudio objeto com base no sinal rebaixado orientado a objeto e na informação paralela.Os sinais de objeto gerados pelo decodificador de objeto 111 ainda não teriam sido aloca-dos para qualquer posição em um espaço de múltiplos canais. Assim, o componente derenderização 113 aloca cada um dos sinais de objeto gerados pelo decodificador de objeto111 para uma posição pré-determinada em um espaço de múltiplos canais e determina osníveis dos sinais de objeto de modo que os sinais de objeto possam ser reproduzidos a par-tir das respectivas posições correspondentes designadas pelo componente de renderização113 com os respectivos níveis correspondentes determinados pelo componente de renderi-zação 113. Vê-se que a informação de controle com referência a cada um dos sinais de ob-jeto gerados pelo decodificador de objeto 111 pode variar com o tempo, e assim, as posi-ções espaciais e os níveis dos sinais de objeto gerados pelo decodificador de objeto 111podem variar de acordo com a informação de controle.
A Figura 2 compreende de um diagrama de blocos de uma aparelhagem de decodi-ficação de áudio 120 de acordo com uma primeira modalidade da presente invenção. Comreferência a Figura 2, incluída na aparelhagem de decodificação de áudio 120 tem-se umdecodificador de objeto 121, um componente de renderização 123, e um conversor de pa-râmetro 125. Tem-se que aaparelhagem de decodificação de áudio 120 pode incluir tambémum demultiplexador (não mostrado) que extrai um sinal rebaixado e informação paralela apartir da entrada de um fluxo de bits no mesmo, e procedera desta forma para todas as apa-relhagens de decodificação de áudio, de acordo com as outras modalidades da presenteinvenção.
O decodificador de objeto 121 gera uma quantidade de sinais de objeto com baseem um sinal rebaixado e da informação paralela modificada provida pelo conversor de pa-râmetro 125. O componente de renderização 123 aloca cada um dos sinais de objeto gera-dos pelo decodificador de objeto 121 para uma posição pré-determinada em um espaço demúltiplos canais e determina os níveis dos sinais de objeto gerados pelo decodificador deobjeto 121 de acordo com a informação de controle. O conversor de parâmetro 125 gera ainformação paralela modificada através da combinação da informação paralela e da infor-mação de controle. Então, o conversor de parâmetro 125 transmite a informação paralelamodificada para o decodificador de objeto 121.
O decodificador de objeto 121 pode ser capaz de executar a decodificação adapta-tiva pela análise da informação de controle na informação paralela modificada.
Por exemplo, caso a informação de controle indique que um primeiro sinal de objetoe um segundo sinal de objeto foram alocados para a mesma posição em um espaço de múl-tiplos canais e se encontram no mesmo nível, uma típica aparelhagem de decodificação deáudio pode decodificar separadamente o primeiro e o segundo sinais de objeto, e daí, posi-cioná-los em um espaço de múltiplos canais através de uma operação de mixa-gem/renderização.
Por outro lado, o decodificador de objeto 121 da aparelhagem de decodificação deáudio 120 apreende da informação de controle na informação paralela modificada que oprimeiro e segundo sinais de objeto foram alocados para a mesma posição em um espaçode múltiplos canais e apresentam o mesmo nível caso eles fossem originados de uma únicafonte sonora. Resultando que, o decodificador de objeto 121 decodifica o primeiro e segun-do sinais de objeto tratando-os como uma única fonte sonora sem decodificá-los separada-mente. Resulta que, a complexidade da decodificação diminui. Ainda, devido a uma diminui-ção na quantidade de fontes sonoras que precisam ser processadas, a complexidade damixagem/renderização também diminui.
A aparelhagem de decodificação de áudio 120 pode ser utilizada de forma efetivana situação quando uma quantidade de sinais de objeto é maior do que a quantidade decanais de saída devido à pluralidade de sinais de objeto ser muito provavelmente alocadapara a mesma posição espacial.
Alternativamente, a aparelhagem de decodificação de áudio 120 pode ser utilizadana situação quando o primeiro e o segundo sinais de objeto são alocados para a mesmaposição em um espaço de múltiplos canais, mas apresentam níveis diferentes. Nesta situa-ção, a aparelhagem de decodificação de áudio 120 decodifica o primeiro e o segundo sinaisde objeto tratando-os como um único sinal de objeto, ao invés de decodificá-los separada-mente, e transmitindo-os decodificados para o componente de renderização 123. Mais es-pecificamente, o decodificador de objeto 121 pode obter informação com respeito a diferen-ça entre os níveis do primeiro e do segundo sinais de objeto a partir da informação de con-trole na informação paralela modificada, e decodificar o primeiro e segundo sinais de objetocom base na informação obtida. Resulta que, mesmo caso o primeiro e o segundo sinais deobjeto apresentem níveis diferentes, eles podem ser decodificados como se fossem umaúnica fonte sonora.
Ainda, de forma alternativa, o decodificador de objeto 121 pode ajustar os níveisdos sinais de objeto gerados pelo decodificador de objeto 121 de acordo com a informaçãode controle. Então, o decodificador de objeto 121 pode decodificar os sinais de objeto cujosníveis são ajustados. Resulta que, o componente de renderização 123 não necessita deajustar os níveis dos sinais de objeto decodificados providos pelo decodificador de objeto121, mas simplesmente posicionar os sinais de objeto decodificados providos pelo decodifi-cador de objeto 121 em um espaço de múltiplos canais. Em resumo, uma vez que o decodi-ficador de objeto 121 ajusta os níveis dos sinais de objeto gerados pelo decodificador deobjeto 121 de acordo com a informação de controle, o componente de renderização 123pode, prontamente, disponibilizar os sinais de objeto gerados pelo decodificador de objeto121 em um espaço de múltiplos canais sem a necessidade de ajustar adicionalmente osníveis dos sinais de objeto gerados pelo decodificador de objeto 121. Portanto, é possível sereduzir a complexidade da mixagem/renderização.
De acordo com a modalidade da Figura 2, o decodificador de objeto da aparelha-gem de decodificação de áudio 120 pode de forma adaptativa desempenhar uma operaçãode decodificação através da análise da informação de controle, reduzindo assim, a comple-xidade da decodificação e a complexidade da mixagem/renderização. Uma combinação dosmétodos descritos anteriormentepela aparelhagem de decodificação de áudio 120 pode serutilizada.
A Figura 3 compreende de um diagrama de blocos de uma aparelhagem de decodi-ficação de áudio 130 de acordo com uma segunda modalidade da presente invenção. PelaFigura 3 observa-se que a aparelhagem de decodificação de áudio 130 inclui um decodifica-dor de objeto 131 e um componente de renderização 133. Tem-se que a aparelhagem dedecodificação de áudio 130 é caracterizada pelo fornecimento de informação paralela nãosó ao decodificador de objeto 131, mas também para o componente de renderização 133.
A aparelhagem de decodificação de áudio 130 pode desempenhar de forma eficien-te uma operação de decodificação mesmo quando existe um sinal de objeto corresponden-do a um período de silêncio. Por exemplo, do segundo ao quarto dos sinais de objeto podemcorresponder a um período de reprodução musical durante o qual um instrumento musical étocado, e um primeiro sinal de objeto pode corresponder a um período de silêncio aonde umacompanhamento é tocado. Nesta situação, a informação indicando qual de uma pluralidadede sinais de objeto corresponde a um período de silêncio pode apresentar-se incluída nainformação paralela, e a informação paralela pode ser fornecida ao componente de renderi-zação 133, bem como ao decodificador de objeto 131.
O decodificador de objeto 131 pode minimizar a complexidade da decodificaçãonão decodificando um sinal de objeto correspondendo a um período de silêncio. O decodifi-cador de objeto 131 ajusta um sinal de objeto correspondendo a um valor de 0 e transmite onível do sinal de objeto para o componente de renderização 133. Em regra, os sinais de ob-jeto apresentando um valor 0 são tratados da mesma maneira dos sinais de objeto apresen-tando um valor diferente de 0, e assim estão sujeitos a uma operação de mixa-gem/renderização.
Por outro lado, a aparelhagem de decodificação de áudio 130 transmite informaçãoparalela incluindo informação indicando que uma pluralidade de sinais de objeto correspon-de a um período de silêncio junto ao componente de renderização 133 e pode, assim, impe-dir que um sinal de objeto correspondendo a um período de silêncio sejam submetidos auma operação de mixagem/renderização desempenhada pelo componente de renderização133. Portanto, a aparelhagem de decodificação de áudio 130 pode impedir que ocorra umdesnecessário aumento da complexidade de mixagem/renderização.
O componente de renderização 133 pode fazer uso da informação de mixagem deparâmetro que é incluída na informação de controle para localizar uma imagem sonora decada sinal de objeto junto a um cenário estéreo. A informação de mixagem de parâmetropode incluir tanto somente a informação de amplitude como ambas a informação de ampli-tude e a informação de tempo. A informação de mixagem de parâmetro afeta não somente alocalização das imagens sonoras em estéreo, mas também a percepção psíquico-acústicada qualidade espacial do som por um usuário.
Por exemplo, mediante a comparação de duas imagens sonoras que são geradasutilizando-se um método de varredura para o tempo e um método de varredura para a ampli-tude, respectivamente, e reproduzidas na mesma localização utilizando-se um alto-falanteestéreo de dois-canais, reconhece-se que o método de varredura para a amplitude podecontribuir para determinar uma localização precisa das imagens sonoras, e que o método devarredura para o tempo pode fornecer sons naturais com uma profunda sensação de espa-ço. Assim, caso o componente de renderização 133 faça uso somente do método de varre-dura para a amplitude para disponibilizar sinais de objeto em um espaço de múltiplos canais,o componente de renderização 133 pode ser capaz de localizar precisamente cada imagemsonora, mas pode não ser capaz de fornecer uma profunda sensação sonora como quandofazendo uso do método de varredura para o tempo. Os usuários podem dar preferência, àsvezes, por uma localização precisa das imagens sonoras ao invés da sensação profunda dosom ou vice-versa, de acordo com o tipo de fontes sonoras.
As Figuras 4(a ) e 4 (b) explicam a influência da intensidade (diferença de amplitu-de) e uma diferença de tempo na localização das imagens sonoras conforme realizado nareprodução de sinais com um alto-falante estéreo de dois-canais. Com referência as Figuras4(a) e 4(b), uma imagem sonora pode se apresentar localizada em um ângulo pre-determinado de acordo com uma diferença de amplitude e uma diferença de tempo, que sãoindependentes entre si. Por exemplo, uma amplitude de diferença em torno de 8 dB, ou umadiferença temporal de em torno de 0,5 ms, eqüivalendo a uma diferença de amplitude de 8dB, pode ser empregada de forma a localizar uma imagem sonora a um ângulo de 20°. Por-tanto, mesmo se somente uma diferença de amplitude é fornecida como informação de mi-xagem de parâmetro, é possível se obter vários sons com diferentes propriedades atravésda conversão da diferença de amplitude em diferença de tempo que é o equivalente a dife-rença de amplitude durante a localização das imagens sonoras.
A Figura 5 ilustra funções com respeito à correspondência entre as diferenças deamplitude e as diferenças de tempo que são precisas para se localizar as imagens sonorasem ângulos de 10°, 20°, e 30°. A função, ilustrada na Figura 5, pode ser obtida com basenas Figuras 4(a) e 4(b). Com referência a Figura 5, várias combinações de diferença de am-plitude - diferença de tempo podem ser fornecidas para a localização de uma imagem sono-ra em uma posição pré-determinada. Por exemplo, assumindo que uma diferença de ampli-tude de 8 dB seja fornecida na forma de informação de mixagem de parâmetro de maneira ase localizar uma imagem sonora a um ângulo de 20°. De acordo com a função ilustrada naFigura 5, uma imagem sonora pode se apresentar, também, localizada a um ângulo de 20°utilizando-se a combinação de uma diferença de amplitude de 3 dB-e uma diferença de tem-po de 0,3 ms. Neste caso, não somente a informação da diferença de amplitude, mas tam-bém a informação da diferença de tempo podem ser fornecidas na forma de informação demixagem de parâmetro, acentuando assim a sensação de espaço.
Portanto, de modo a se gerar sons com propriedades desejadas pelo usuário du-rante uma operação de mixagem/renderização, a informação de mixagem de parâmetro po-de ser adequadamente convertida de maneira que qualquer que seja a amplitude e o tempode varredura que agradem ao usuário, ela pode ser realizada. Ou seja, caso a informaçãode mixagem de parâmetro inclua somente informação da diferença de amplitude e o usuáriodeseje sons com uma profunda sensação de espaço, a informação da diferença de amplitu-de pode ser convertida em informação de diferença de tempo, eqüivalendo a informação dadiferença de amplitude com referência aos dados psíquico-acústicos. De maneira alternati-va, caso seja do desejo do usuário que ambos sons apresentem uma profunda sensação deespaço e uma localização precisa das imagens sonoras, a informação da diferença de am-plitude pode ser convertida em uma combinação da informação da diferença de amplitude ea informação da diferença de tempo eqüivalendo a informação da amplitude original. Deforma alternativa, caso a informação de mixagem de parâmetro inclua somente informaçãoda diferença de tempo e o usuário prefira uma localização precisa das imagens sonoras, ainformação da diferença de tempo pode ser convertida na informação da diferença de ampli-tude equivalente a informação da diferença de tempo, ou pode ser convertida na combina-ção da informação da diferença de amplitude e a informação da diferença de tempo quevenha a satisfazer a preferência do usuário acentuando tanto a precisão da localização dasimagens sonoras como a sensação de espaço.
Ainda, de maneira alternativa, caso a informação de mixagem de parâmetro incluatanto a informação da diferença de amplitude quanto a informação da diferença de tempo eo usuário dê preferência a uma precisa localização das imagens sonoras, a combinação dainformação da diferença de amplitude e a informação da diferença de tempo podem serconvertidas na informação da diferença de amplitude eqüivalendo a combinação da informa-ção da diferença de amplitude original e a informação da diferença de tempo. Por outro lado,caso a informação de mixagem de parâmetro inclua tanto a informação da diferença de am-plitude e a informação da diferença de tempo e o usuário dê preferência a acentuar a sen-sação de espaço, a combinação da informação da diferença de amplitude e da informaçãoda diferença de tempo pode ser convertida na informação da diferença de tempo eqüivalen-do a combinação da informação da diferença de amplitude e a informação da diferença detempo original. Com referência a Figura 6, a informação de controle pode incluir a informa-ção de mixagem/renderização e a informação harmônica com respeito a um ou mais sinaisde objeto. A informação harmônica pode incluir, pelo menos, uma informação de passo, in-formação da freqüência fundamental, e informação da faixa de freqüência dominante comrelação a um ou mais sinais de objeto, e descrições da energia e do espectro de cada sub-faixa de cada um dos sinais de objeto.
A informação harmônica pode ser empregada para processar um sinal de objetodurante uma operação de renderização devido a insuficiência de resolução de um compo-nente de renderização que desempenha esta operação em unidades de sub-faixas.
Caso a informação harmônica inclua informação de passo com respeito a um oumais sinais de objeto, o ganho de cada um dos sinais de objeto pode ser ajustado pela ate-nuação ou fortalecimento de um pré-determinado domínio da freqüência utilizando um filtrode pente ou um filtro de pente invertido. Por exemplo, caso um dos sinais de objeto a partirde uma pluralidade seja um sinal vocal, os sinais de objeto podem ser empregados na formade um karaokê atenüando-se somente o sinal de vocal. De maneira alternativa, caso a in-formação harmônica inclua a informação de domínio de uma freqüência dominante com res-peito a um ou mais sinais de objeto, pode-se realizar um processo de atenuação ou fortale-cimento de um domínio para uma freqüência dominante. Ainda, de forma alternativa, caso ainformação harmônica inclua informação de espectro com respeito a um ou mais sinais deobjeto, o ganho de cada um dos sinais de objeto pode ser controlado através do desempe-nho da atenuação ou fortalecimento sem se ficar restrito a qualquer um dos limites das sub-faixas.
A Figura 7 compreende de um diagrama de blocos de uma aparelhagem de decodi-ficação de áudio 140 de acordo com uma outra modalidade da presente invenção. Observa-se pela Figura 7 que a aparelhagem de decodificação de áudio 140 faz uso de um decodifi-cador de múltiplos canais 141, ao invés de um decodificador de objeto e um componente derenderização, e decodifica uma quantidade de sinais de objeto após os sinais de objeto se-rem apropriadamente dispostos em um espaço de múltiplos canais.
Mais especificamente, a aparelhagem de decodificação de áudio 140 inclui o deco-dificador de múltiplos canais 141 e um conversor de parâmetro 145. O decodificador de múl-tiplos canais 141 gera um sinal de múltiplos canais cujos sinais de objeto tenham sido previ-amente arranjados em um espaço de múltiplos canais com base em um sinal rebaixado e nainformação de parâmetro espacial, que compreende informação paralela orientada a canalfornecida pelo conversor de parâmetro 145. O conversor de parâmetro 145 analisa a infor-mação paralela e a informação de controle transmitidas por uma aparelhagem de codifica-ção de áudio (não mostrada), e gera a informação de parâmetro espacial com base no resul-tado da análise. Mais especificamente, o conversor de parâmetro 145 gera a informação deparâmetro espacial através da combinação da informação paralela e da informação de con-trole que inclui a informação de estabelecimento de reprodução e a informação de mixagem.Ou seja, o conversor de parâmetro 145 desempenha a conversão da combinação da infor-mação paralela e da informação de controle junto ao dado espacial correspondente a umacaixa Um-por-Dois (OTT) ou uma caixa Dois-por-Três (TTT).
A aparelhagem de decodificação de áudio 140 pode desempenhar uma operaçãode decodificação de múltiplos canais aonde uma operação de decodificação orientada aobjeto e uma operação de mixagem/renderização são incorporadas e daí saltar a decodifi-cação de cada sinal de objeto. Portanto, é possível se reduzir a complexidade da decodifi-cação e/ou mixagem/renderização.
Por exemplo, quando ocorrem 10 sinais de objeto e um sinal de múltiplos canaisobtidos com base nos 10 sinais de objeto para serem reproduzidos através de um sistemade reprodução com alto-falante para canal em formato 5,1, uma típica aparelhagem de de-codificação de áudio orientada a objeto gera sinais decodificados, correspondendo, respec-tivamente, a 10 sinais de objeto baseados em um sinal rebaixado e na informação paralela,e daí, gerando um sinal para canal em formato 5,1, arranjando-se apropriadamente os 10sinais de objeto em um espaço de múltiplos canais, de modo que os sinais de objeto pos-sam se tornar adequados para um ambiente com alto-falante para canal em formato 5,1.Entretanto, é ineficaz se gerar 10 sinais de objeto durante a geração de um sinal para canalem formato 5,1, e este problema torna-se mais severo conforme vá crescendo a diferençaentre a quantidade de sinais de objeto e a quantidade de canais de um sinal de múltiploscanais a serem gerados.
Por outro lado, de acordo com a modalidade da Figura 7, observa-se que a apare-lhagem de decodificação de áudio 140 gera informação de parâmetro espacial adequadapara um sinal para canal em formato 5,1 com base na informação paralela e na informaçãode controle, e fornece a informação do parâmetro espacial e um sinal rebaixado junto aodecodificador de múltiplos canais 141. Então, o decodificador de múltiplos canais 141 geraum sinal para canal em formato 5,1 com base na informação paralela espacial e no sinalrebaixado. Em outras palavras, quando a quantidade de canais a serem liberados compre-ende canais no formato 5,1, a aparelhagem de decodificação de áudio 140 pode gerar pron-tamente um sinal para canal em formato 5,1 com base no sinal rebaixado sem a necessida-de de gerar os 10 sinais de objeto, sendo uma forma mais eficiente em termos de complexi-dade do que no caso de uma aparelhagem de decodificação de áudio convencional.
A aparelhagem de decodificação de áudio 140 é considerada ser eficiente quando aquantidade de computação requerida para cálculo da informação de parâmetro espacial cor-respondendo a cada caixa OTT e a cada caixa TTT, através da análise da informação para-lela e da informação de controle transmitida por uma aparelhagem de codificação de áudio,é menor do que a quantidade de computação requerida para desempenhar uma operaçãode mixagem/renderização após a decodificação de cada sinal de objeto.
A aparelhagem de decodificação de áudio 140 pode ser obtida através da simplesadição de um módulo para geração da informação de parâmetro espacial através da análisede informação paralela e informação de controle junto a uma típica aparelhagem de decodi-ficação de áudio de múltiplos canais, e pode assim manter a compatibilidade com uma típicaaparelhagem de decodificação de áudio de múltiplos canais.
Ainda, a aparelhagem de decodificação de áudio 140 pode melhorar a qualidade dosom utilizando as ferramentas disponíveis de uma típica aparelhagem de decodificação deáudio de múltiplos canais, tais como, um delineador de invólucro, um periférico de proces-samento temporal em sub-faixas (STP), e um misturador. Sendo fornecido este equipamen-to conclui-se que todas as vantagens de um típico método de decodificação de áudio demúltiplos canais pode ser prontamente aplicado junto a um método de decodificação de áu-dio-objeto.
A informação do parâmetro espacial transmitida para o decodificador de múltiploscanais 141 pelo conversor de parâmetro 145 pode ser comprimida de modo a tornar-se a-dequada para transmissão. De forma alternativa, a informação de parâmetro espacial podeapresentar formato idêntico daquele dos dados transmitidos via uma típica aparelhagem decodificação de múltiplos canais. Ou seja, a informação de parâmetro espacial pode estarsujeita a uma operação de decodificação Huffman ou a uma operação de decodificação pilo-to e pode ser transmitida para cada módulo na forma de um dado de instrução espacial não-comprimido. A primeira operação é adequada para transmissão da informação de parâmetroespacial junto a uma aparelhagem de decodificação de áudio de múltiplos canais em umlocal remoto, e a outra operação é conveniente devido a que não existe necessidade deuma aparelhagem de decodificação de áudio de múltiplos canais para conversão do dado deinstrução espacial comprimido em um dado de instrução espacial não-comprimido que pos-sa ser prontamente utilizado em uma operação de decodificação.
A configuração da informação de parâmetro espacial com base na análise da infor-mação lateral e da informação de controle pode levar a um retardo entre o sinal rebaixado ea informação do parâmetro espacial. De forma a se analisar esta questão, uma memóriaintermediária adicional pode ser fornecida tanto para um sinal rebaixado como para a infor-mação de parâmetro espacial de modo que o sinal rebaixado e a informação de parâmetroespacial possam ser sincronizados entre si. Estes métodos, contudo, se apresentam incon-venientes devido à necessidade de ser fornecida uma memória intermediária adicional. Demaneira alternativa, a informação paralela pode ser transmitida antes de um sinal rebaixadoem consideração da possibilidade de ocorrência de um retardo entre um sinal rebaixado e ainformação de parâmetro espacial. Neste caso, a informação de parâmetro espacial obtidapela combinação da informação paralela e informação de controle não necessita de ser a-justada, mas pode ser utilizada prontamente.
Caso uma pluralidade de sinais de objeto de um sinal rebaixado apresente níveisdiferentes, um módulo artístico de ganhos rebaixado (ADG),que pode compensar diretamen-te o sinal rebaixado, pode determinar os níveis relativos dos sinais de objeto, e cada um dossinais de objeto pode ser alocado junto a uma posição pré-determinada em um espaço demúltiplos canais utilizando o dado de instrução espacial, tal como a informação de diferençade nível de canal, a informação de correlação entre canais (ICC), e a informação de coefici-ente de previsão de canal (CPC).
Por exemplo, caso a informação de controle indique que um sinal de objeto pre-determinado esteja para ser alocado junto a uma posição pré-determinada em um espaçode múltiplos canais e apresente um nível mais elevado do que os outros sinais de objeto, umtípico decodificador de múltiplos canais pode calcular a diferença entre as energias dos ca-nais de um sinal rebaixado, e dividir o sinal rebaixado em uma quantidade de canais de saí-da com base nos resultados do cálculo. Contudo, um típico decodificador de múltiplos ca-nais não pode aumentar ou reduzir o volume de uma certa sonoridade em um sinal rebaixa-do. Em outras palavras, um típico decodificador de múltiplos canais distribui simplesmenteum sinal rebaixado junto a uma quantidade de canais de saída e assim, não pode aumentarou reduzir o volume sonoro no sinal rebaixado.
É relativamente fácil se alocar cada sinal de uma quantidade de sinais de objeto deum sinal rebaixado gerado por um codificador de objeto junto a uma posição pré-determinada em um espaço de múltiplos canais de acordo com a informação de controle.Entretanto, técnicas especiais são necessárias para se aumentar ou reduzir a amplitude deum sinal de objeto pré-determinado. Em outras palavras, caso um sinal rebaixado geradopor um codificador de objeto seja utilizado da forma esperada, será difícil se reduzir a ampli-tude de cada sinal de objeto do sinal rebaixado.
Por conseguinte, de acordo com uma modalidade da presente invenção, as ampli-tudes relativas dos sinais de objeto podem ser variadaspodem ser variadas de acordo com ainformação de controle utilizando um módulo ADG 147 ilustrado na Figura 8. Mais especifi-camente, a amplitude de qualquer sinal de uma pluralidade de sinais de objeto de um sinalrebaixado transmitido por codificador de objeto pode ser aumentada ou reduzida utilizando-se o módulo ADG 147. Um sinal rebaixado obtido pela compensação executada pelo módu-lo ADG 147 pode estar sujeito a decodificação de múltiplos canais.
Caso as amplitudes relativas de sinais de objeto de um sinal rebaixado sejam ajus-tadas de forma apropriada utilizando o módulo ADG 147, é possível se executar a decodifi-cação de objeto utilizando-se um típico decodificador de múltiplos canais. Caso um sinalrebaixado gerado por um decodificador de objeto seja um sinal mono ou estéreo ou um sinalde múltiplos canais com três ou mais canais, o sinal rebaixado pode ser processado pelomódulo ADG 147. Caso um sinal rebaixado - gerado por um codificador de objeto apresentedois ou mais canais e um sinal de objeto pré-determinado que precise ser ajustado pelo mó-dulo AG 147 exista somente em um dos canais do sinal rebaixado - o módulo ADG 147 po-de ser aplicado somente para o canal incluindo o sinal de objeto pré-determinado, ao invésde ser aplicado para todos os canais de sinal rebaixado. Um sinal rebaixado processadopelo módulo ADG 147 na maneira descrita acima pode ser imediatamente processado utili-zando-se um típico decodificador de múltiplos canais sem a necessidade de modificar oquadro do decodificador de múltiplos canais.
Mesmo quando um sinal de saída final não compreende de um sinal de múltiploscanais que possam ser reproduzidos por um alto-falante de múltiplos canais, mas compre-enda de um sinal biauricular, o módulo ADG 147 pode ser utilizado para ajustar as amplitu-des relativas dos sinais de objeto do sinal de saída final.
Uma forma alternativa ao emprego do módulo ADG 147 é a informação de ganhoespecificando um valor de ganho a ser aplicado à cada sinal de objeto podendo ser incluídana informação de controle durante a geração de uma quantidade de sinais de objeto. Paraisto, o quadro de um típico decodificador de múltiplos canais pode ser modificado. Muitoembora necessitando de uma modificação do quadro de um decodificador de múltiplos ca-nais existente, este método é conveniente em termos de redução da complexidade de deco-dificação através da aplicação de um valor de ganho para cada sinal de objeto durante umaoperação de decodificação sem a necessidade de se calcular o ADG e para se compensarcada sinal de objeto.
A Figura 9 compreende de um diagrama de blocos de uma aparelhagem de decodi-ficação de áudio 150 de acordo com uma quarta modalidade da presente invenção. Comreferência a Figura 9, caracteriza-se a aparelhagem de decodificação de áudio 150 pela ge-ração de um sinal biauricular.
Mais especificamente, a aparelhagem de decodificação de áudio 150 inclui um de-codificador biauricular de múltiplos canais 151, um primeiro conversor de parâmetro 157, eum segundo conversor de parâmetro 159.
O segundo conversor de parâmetro 159 analisa a informação paralela e a informa-ção de controle que são fornecidas através de uma aparelhagem de codificação de áudio, econfigura a informação de parâmetro espacial com base no resultado da análise. O primeiroconversor de parâmetro 157 configura a informação de parâmetro biauricular, que pode serutilizada pelo decodificador biauricular de múltiplos canais 151, através da adição da infor-mação tri-dimensional (3D), tal como parâmetros funcionais de transferência relacionados àcabeça (HRTF), junto à informação de parâmetro espacial. O decodificador biauricular demúltiplos canais 151 gera um sinal virtual tri-dimensional (3D) através da aplicação da infor-mação de parâmetro virtual 3D junto a um sinal rebaixado.
O primeiro conversor de parâmetro 157 e o segundo conversor de parâmetro 159podem ser substituídos por um único módulo, ou seja, um módulo de conversão de parâme-tro 155 que recebe a informação paralela, a informação de controle, e os parâmetros HRTFe configura a informação de parâmetro biauricular com base na informação paralela, na in-formação de controle, e nos parâmetros HRTF.
Convencionalmente, de modo a se gerar um sinal biauricular para a reprodução deum sinal rebaixado incluindo 10 sinais de objeto com fone de ouvido, um sinal de objeto de-ve gerar 10 sinais decodificados correspondendo, respectivamente, a 10 sinais de objetocom base no sinal rebaixado e na informação paralela. Posteriormente, um componente derenderização aloca cada um dos 10 sinais de objeto em uma posição pré-determinada emum espaço de múltiplos canais com referência a informação de controle de forma a adequar-se num ambiente de alto-falante para canal em formato 5,1.Posteriormente, o componentede renderização gera um sinal para canal em formato 5,1 que pode ser reproduzido utilizan-do-se um alto-falante para canal em formato 5,1. Posteriormente, o componente de renderi-zação aplica os parâmetros HRTF junto ao sinal para canal em formato 5,1, gerando umsinal para dois canais. Em resumo, o método de decodificação de áudio convencional men-cionado acima inclui a reprodução de 10 sinais de objeto, a conversão dos 10 sinais de obje-to para um sinal para canal em formato 5,1, e a geração de um sinal para dois canais combase no sinal para cinco canais, e, por conseguinte é ineficiente.
Por outro lado, a aparelhagem de decodificação de áudio 150 pode gerar, pronta-mente, um sinal biauricular que pode ser reproduzido utilizando-se um fone de ouvido combase nos sinais de áudio de objeto. Ainda, a aparelhagem de decodificação de áudio 150configura a informação do parâmetro espacial através da análise da informação paralela eda informação de controle, e pode assim, gerar um sinal biauricular utilizando um típico de-codificador biauricular de múltiplos canais . Mais ainda, a aparelhagem de decodificação deáudio 150 ainda pode fazer uso de um decodificador biauricular típico de múltiplos canaismesmo quando sendo equipada com um conversor de parâmetro incorporado que recebeinformação paralela, informação de controle, e os parâmetros HRTF e configura a informa-ção de parâmetro biauricular com base na informação paralela, na informação de controle, enos parâmetros HRTF.
A Figura 10 compreende de um diagrama de blocos de uma aparelhagem de deco-dificação de áudio 160, de acordo com a quinta modalidade da presente invenção. Observa-se pela Figura 10, que a aparelhagem de decodificação de áudio 160 inclui um processadorde rebaixamento 161, um decodificador de múltiplos canais 163, e um conversor de parâme-tros 165. O processador de rebaixamento 161 e o conversor de parâmetros 163 podem sersubstituídos por um único módulo 167.
O conversor de parâmetros 165 gera informação de parâmetro espacial, que podeser utilizada pelo decodificador de múltiplos canais 163, e a informação de parâmetro, quepode ser utilizada pelo processador de rebaixamento 161. O processador de rebaixamento161 desempenha uma operação de pré-processamento em úm sinal rebaixado, e transmiteum sinal rebaixado resultante da operação de pré-processamento junto ao decodificador demúltiplos canais 163. O decodificador de múltiplos canais 163 desempenha uma operaçãode decodificação no sinal rebaixado transmitido pelo processador de rebaixamento 161, libe-rando assim um sinal estéreo, um sinal estéreo biauricular ou um sinal de múltiplos canais.Exemplos da operação de pré-processamento desempenhada pelo processador de rebai-xamento 161 incluem a modificação ou conversão de um sinal rebaixado em um domínio detempo ou num domínio de freqüência utilizando-se filtragem.
Caso a entrada de um sinal rebaixado junto à aparelhagem de decodificação deáudio 160 seja um sinal estéreo, o sinal rebaixado pode estar sujeito a um pré-processamento de rebaixamento desempenhado pelo processador de rebaixamento 161antes de ser introduzido junto ao decodificador de múltiplos canais 163 devido a incapacida-de do decodificador de múltiplos canais 163 de mapear um componente do sinal rebaixadocorrespondendo a um canal esquerdo, que compreende ser um dos múltiplos canais, paraum canal direito, que é outro dos múltiplos canais. Portanto, de maneira a se desviar a posi-ção de um sinal de objeto classificado no canal esquerdo para uma direção em sentido aocanal direito, a entrada do sinal rebaixado junto a aparelhagem de decodificação de áudio160 pode ser pré-processada pelo processador de rebaixamento 161, e o sinal rebaixadopré-processado pode ser introduzido junto ao decodificador de múltiplos canais 163.
O pré-processamento de um sinal rebaixado estéreo pode ser realizado com basena informação de pré-processamento obtida a partir da informação paralela e da informaçãode controle.
A Figura 11 compreende de um diagrama de blocos de uma aparelhagem de áudio170, de acordo com uma sexta modalidade da presente invenção. Observa-se pela Figura11 que a aparelhagem de decodificação de áudio 170 inclui um decodificador de múltiploscanais 171, um processador de canal 173, e um conversor de parâmetro 175.
O conversor de parâmetro 175 gera a informação de parâmetro espacial, que podeser utilizada pelo decodificador de múltiplos canais 173 e gera a informação de parâmetroque pode ser utilizada pelo processador de canal 173. O processador de canal 173 desem-penha uma operação de pós-processamento na saída de sinal através do decodificador demúltiplos canais 173. Exemplos da saída de sinal pelo decodificador de múltiplos canais 173incluem um sinal estéreo, um sinal estéreo biauricular e um sinal de múltiplos canais. Exemplos da operação de pós-processamento desempenhada pelo processador dereserva 173 incluem a modificação e conversão de cada canal ou de todos os canais de umsinal de saída. Por exemplo, caso a informação paralela inclua informação da freqüênciafundamental com respeito a um sinal de objeto pré-determinado, o processador de canal173 pode remover os componentes harmônicos do sinal de objeto pré-determinado comreferência a informação da freqüência fundamental. Um método de decodificação de áudiode múltiplos canais pode não ser eficiente o bastante para ser utilizado num sistema karao-kê. Contudo, caso a informação de freqüência fundamental com respeito aos sinais de obje-to vocal seja incluída na informação paralela e os componentes harmônicos dos sinais deobjeto vocal sejam removidos durante uma operação de pós-processamento, é possível seconstruir um sistema karaokê de alto desempenho fazendo-se uso da modalidade da Figura11. Além daqueles sinais de objeto vocal, a modalidade da Figura 11 pode ser também apli-cada junto aos sinais de objeto. Por exemplo, é possível se remover o som de um pre-determinado instrumento musical utilizando-se a modalidade da Figura 11. Ainda, é possívelse amplificar os componentes harmônicos pré-determinados fazendo-se uso da informaçãoda freqüência fundamental com respeito aos sinais de objeto utilizando-se a modalidade daFigura 11.
O processador de canal 173 pode desempenhar o processamento de efeito adicio-nal em um sinal rebaixado. De forma alternativa, o processador de canal 173 pode adicionarum sinal obtido pelo processamento de efeito adicional junto à saída de sinal pelo decodifi-cador de múltiplos canais 171. O processador de canal 173 pode alterar o espectro de umobjeto ou modificar um sinal rebaixado se necessário. Caso não seja apropriado desempe-nhar diretamente uma operação de processamento de efeito, tal como reverberação de umsinal rebaixado e transmitir o sinal obtido pela operação de processamento de efeito para odecodificador de múltiplos canais 171 ,o processador de rebaixamento 173 pode adicionar osinal obtido pela operação de processamento de efeito junto à saída do decodificador demúltiplos canais 171, ao invés de desempenhar o processamento de efeito no sinal rebaixa-do.
A aparelhagem de decodificação de áudio 170 pode ser projetada para incluir nãosomente o processador de canal 173, mas também um processador de rebaixamento . Nes-te caso, o processador de rebaixamento pode se apresentar localizado na frente do decodi-ficador de múltiplos canais 173, e o processador de canal 173 pode se apresentar dispostoatrás do decodificador de múltiplos canais 173.
A Figura 12 representa um diagrama de blocos de uma aparelhagem de decodifica-ção de áudio 210 de acordo com uma sétima modalidade da presente invenção. Observa-sepela Figura 12, que a aparelhagem de decodificação de áudio 210 faz uso de um decodifi-cador de múltiplos canais 213, ao invés de um decodificador de objeto.
Mais especificamente, a aparelhagem de decodificação de áudio 210 inclui o deco-dificador de múltiplos canais 213, um transcodificador 215, um componente de renderização217, e uma base de dados de informação 3D 217.
O componente de renderização 217 determina as posições em 3D de uma plurali-dade de sinais de objeto com base na informação 3D correspondendoaos dados indexadosincluídos na informação de controle. O transcodificador 215 gera a informação paralela ori-entada a canal pela sintetização da informação da posiçãocom respeito à quantidade desinais de áudio de objeto aonde se obtém a informação 3D aplicada pelo componente derenderização 217. O decodificador de múltiplos canais 213 libera um sinal 3D através daaplicação da informação paralela orientada a canal junto a um sinal rebaixado.
Uma função de transferência relacionada à cabeça (HRTF) pode ser empregadacomo a informação 3D. Um HRTF compreende de uma função de transferência que descre -ve a transmissão de ondas sonoras entre uma fonte sonora em uma posição arbitrária e otímpano, e retorna com um valor que varia de acordo com a direção e a altitude da fontesonora. Caso um sinal sem nenhuma capacidade de direção seja filtrado fazendo-se empre-go do HRTF, o sinal pode ser ouvido como se tivesse sido reproduzido a partir de uma certadireção.
Quando se recebe uma entrada de fluxo de bits, a aparelhagem de decodificaçãode áudio 210 extrai um sinal rebaixado orientado a objeto e informação de parâmetro orien-tada a objeto a partir da entrada do fluxo de bits fazendo-se emprego de um demultiplexador(não mostrado). Então, o componente de renderização 217 extrai o dado indexado a partirda informação de controle, que é utilizado para determinar as posições de uma pluralidadede sinais de áudio de objeto, e retira a informação 3D correspondendo ao dado indexadoextraído da base dados da informação 3D 219.
Mais especificamente, a informação de mixagem de parâmetro, que é incluída nainformação de controle que é utilizada pela aparelhagem de decodificação de áudio 210,pode incluir não somente a informação de nível, mas também os dados indexados necessá-rios para a busca da informação 3D. A informação de mixagem de parâmetro pode incluirtambém a informação de tempo com respeito a diferença de tempo entre os canais, a infor-mação de posição e um ou mais parâmetros obtidos pelo fato de apropriadamente combina-rem a informação de nível e a informação de tempo.
A posição de um sinal de áudio de objeto pode ser determinada inicialmente de a-cordo com a falta de informação de mixagem de parâmetro, e pode ser alterada posterior-mente através da aplicação da informação 3D correspondendo a uma posição desejada pelousuário junto ao sinal de áudio de objeto. De forma alternativa, caso o usuário deseje aplicarum efeito 3D somente para vários sinais de áudio de objeto, a informação de nível e a infor-mação de tempo, com respeito aos outros sinais de áudio de objeto para os quais o usuárionão deseja aplicar um efeito 3D, podem ser utilizados na forma de informação de mixagemde parâmetro.
O transcodificador 217 gera informação paralela orientada a canal com respeito a Mcanais através da sintetizaçãoda informação de parâmetro orientada a objeto considerandoN sinais de objeto transmitidos pela aparelhagem de codificação de áudio e pela informaçãode posição de uma quantidade de sinais de objeto aonde se aplica a informação 3D, tal co-mo um HRTF pelo componente de renderização 217.
O decodificador de múltiplos canais 213 gera um sinal de áudio com base em umsinal rebaixado e na informação paralela orientada a canal provida pelo transcodificador217, e gera um sinal de múltiplos canais 3D através da execução de uma operação de ren-derização 3D fazendo uso da informação 3D incluída na informação paralela orientada acanal.
A Figura 13 compreende de um diagrama de blocos de uma aparelhagem de deco-dificação de áudio 220 de acordo com uma oitava modalidade da presente invenção. Obser-va-se pela Figura 13, que a aparelhagem de decodificação de áudio 220 é diferente da apa-relhagem de decodificação de áudio 210 ilustrada na Figura 12 no sentido que um transcodi-ficador 225 transmite informação paralela orientada a canal e informação 3D separadamentepara um decodificador de múltiplos canais 223. Em outras palavras, o transcodificador 225da aparelhagem de decodificação de áudio 220 obtém informação paralela orientada a canalcom respeito a M canais a partir da informação de parâmetro orientada a objeto com respei-to aos N sinais de objeto e transmite a informação paralela orientada a canal e a informação3D, que é aplicada junto a cada um dos N sinais de objeto, junto ao decodificador de múlti-plos canais 223, em que o transcodificador 217 da aparelhagem de decodificação de áudio210 transmite a informação paralela orientada a canal incluindo a informação 3D junto aodecodificador de múltiplos canais 213.
A Figura 14 é referenciada em que a informação paralela orientada a canal e a in-formação 3D podem incluir uma pluralidade de indexadores de quadro.Assim, o decodifica-dor de múltiplos canais 223 pode sincronizar a informação paralela orientada a canal e ainformação 3D com referência aos indexadores de quadro de cada informação paralela ori-entada a canal e informação 3D, e pode, assim, aplicar a informação 3D junto a um quadrode um fluxo de bits correspondendo a informação 3D. Por exemplo, a informação 3D apre-sentando um indexador 2 pode ser aplicada no início do quadro 2 apresentando um indexa-dor2.
Uma vez que a informação paralela orientada a canal e a informação 3D incluem,ambas, indexadores de quadro, é possível , efetivamente, se determinar uma posição tem-poral da informação paralela orientada a canal aonde deva ser aplicada a informação 3D,mesmo caso a informação 3D venha a ser atualizada periodicamente. De outra forma, otranscodificador 225 inclui informação 3D e uma quantidade de indexadores de quadro nainformação paralela orientada a canal, e, dessa maneira, o decodificador de múltiplos canais223 pode facilmente sincronizar a informação paralela orientada a canal e a informação 3D.
O processador de rebaixamento 231, o transcodificador 235, o componente de ren-derização 237 e a base de dados da informação 3D podem ser substituídos por um únicomódulo 239.
A Figura 15 compreende de um diagrama de blocos de uma aparelhagem de deco-dificação de áudio 230 de acordo com uma nona modalidade da presente invenção. Obser-va-se da Figura 15 que a aparelhagem de decodificação de áudio 230 é diferenciada da a -parelhagem de decodificação de áudio 220 ilustrada na Figura 14 pela inclusão adicional deum processador de rebaixamento 231.
Mais especificamente, a aparelhagem de decodificação de áudio 230 inclui umtranscodificador 235, um componente de renderização 237, uma base de dados com infor-mação 3D 239, um decodificador de múltiplos canais 233, e o processador de rebaixamento231. O transcodificador 235, o componente de renderização 237, mais a base de dados cominformação 3D 239, e o decodificador de múltiplos canais 233 são idênticos as suas respec-tivas partes contrárias, ilustradas na Figura 14. O processador de rebaixamento 231 desem-penha uma operação de pré-processamento em um sinal rebaixado estéreo para ajustamen-to da posição. A base de dados com informação 3D 239 pode ser incorporada com o com-ponente de renderização 237. Um módulo para a aplicação de um efeito pré-determinadojunto a um sinal rebaixado pode ser fornecido também na aparelhagem de decodificação deáudio 230.
A Figura 16 ilustra um diagrama de blocos de uma aparelhagem de decodificaçãode áudio 240 de acordo com uma décima modalidade da presente invenção. Vê-se pela Fi-gura 16 que a aparelhagem de decodificação de áudio 240 é diferenciada da aparelhagemde decodificação de áudio 230 ilustrada na Figura 15 pela inclusão de um combinador deunidade de controle de múltiplos pontos 241.
Ou seja, a aparelhagem de decodificação de áudio 240, assim como a aparelhagemde decodificação de áudio 230, inclui um processador de rebaixamento 243, um decodifica-dor de múltiplos canais 244, um transcodificador 245, um componente de renderização 247,e uma base de dados com informação 3D 249. O combinador de unidade de controle demúltiplos pontos 241 combina uma pluralidade de fluxos de bits obtidas pela codificaçãoorientada a objeto, obtendo dessa forma um único fluxo de bits. Por exemplo, quando umprimeiro fluxo de bits para um primeiro sinal de áudio e um segundo fluxo de bits para umsegundo sinal de áudio são introduzidos, o combinador de unidade de controle de múltiplospontos 241 extrai um primeiro sinal rebaixado a partir do primeiro fluxo de bits, extrai umsegundo sinal rebaixado a partir do segundo fluxo de bits e gera um terceiro sinal rebaixadopela combinação do primeiro e do segundo sinais rebaixados. Ainda, o combinador de uni-dade de controle de múltiplos pontos 241 extrai a primeira informação paralela orientada aobjeto a partir do primeiro fluxo de bits, extrai a segunda informação paralela orientada aobjeto a partir do segundo fluxo de bits, e gera a terceira informação paralela orientada aobjeto pela combinação da primeira e segunda informações paralelas orientadas a objeto.Posteriormente, o combinador de unidade de controle de múltiplos pontos 241 gera um fluxode bits através da combinação do terceiro sinal rebaixado e da terceira informação paralelaorientada a objeto e libera o fluxo de bits gerado.
Portanto, de acordo com a décima modalidade da presente invenção, é possível seprocessar de maneira eficiente sinais combinados transmitidos por dois ou mais padrões decomunicação em comparação com a situação de se codificar ou decodificar cada sinal deobjeto.
De modo que o combinador de unidade de controle de múltiplos pontos 241 incor-pore uma pluralidade de sinais rebaixados, que são respectivamente extraídos de uma plu-ralidade de fluxos de bits e são associados com diferentes códigos de compressão, conver-gindo para um único sinal rebaixado, os sinais rebaixados podem necessitar de serem con-vertidos em sinais de modulação de código de pulso (PCM) ou em sinais para um domínio de freqüência pré-determinado de acordo com os tipos dos códigos de compressão dos si-nais rebaixados, os sinais PCM ou os sinais obtidos pela conversão podem necessitar deserem conjuntamente combinados, e um sinal obtido pela combinação pode necessitar deser convertido utilizando-se um código de compressão pré-determinado. Nesta situação,pode ocorrer um retardo de acordo se os sinais rebaixados são incorporados em um sinalPCM ou em um sinal no domínio de freqüência pré-determinado. Portanto, o retardo podenecessitar de ser incluído em um fluxo de bits e ser transmitido juntamente com o fluxo debits. O retardo pode indicar a quantidade de amostras de retardo em um sinal PCM ou aquantidade de amostras de retardo no domínio de freqüência pré-determinado.
Durante uma operação de codificação de áudio orientada a objeto, uma considerá-vel quantidade de sinais de entrada pode às vezes necessitar de processamento em compa-ração com a quantidade de sinais de entrada, em regra, processados durante uma típicaoperação de codificação de múltiplos canais (por exp., uma operação de codificação de ca-nal em formato 5,1 ou 7,1). Portanto, um método de codificação de áudio orientado a objetorequer taxas de bits muito mais elevadas do que no caso de um típico método de codifica-ção de áudio de múltiplos canais orientado a canal. Contudo, uma vez que um método decodificação de áudio orientado a objeto envolve o processamento de sinais de objeto quesão menores do que os sinais de canal, é possível se gerar sinais de saída dinâmicos utili-zando um método de codificação de áudio orientado a objeto.
Descrever-se-á em detalhes com referência as Figuras 17 até 20, um método decodificação de áudio de acordo com uma modalidade da presente invenção.
No método de codificação de áudio orientado a objeto, os sinais de objeto podemser definidos como representando sonoridades individuais, tais como a voz humana ou osom de um instrumento musical. De maneira alternativa, os sons apresentando característi-cas semelhantes, tais como os sons de instrumentos musicais de corda (por exp., uma viola,e um violoncelo), sons inclusos dentro da mesma faixa de freqüência, ou sons classificadosna mesma categoria de acordo com as direções e os ângulos de suas fontes sonoras, po-dem ser agrupados em conjunto, e definidos pelos mesmos sinais de objeto. Ainda, de ma-neira alternativa, os sinais de objeto podem ser definidos fazendo-se emprego da combina-ção dos métodos descritos acima.
Uma quantidade de sinais de objeto pode ser transmitida na forma de um sinal re-baixado e de informação paralela. Durante a criação de informação a ser transmitida, a e-nergia ou potência de um sinal rebaixado ou cada pluralidade de sinais de objeto do sinalrebaixado é calculada originalmente com a finalidade de se detectar o invólucro do sinal re-baixado. Os resultados dos cálculos podem ser utilizados para a transmissão dos sinais deobjeto ou do sinal rebaixado ou para se calcular a razão de níveis dos sinais de objeto.
Um algoritmo de codificação com predição linear (LPC) pode ser empregado junto ataxas de bits mais baixas. Mais especificamente, uma quantidade de coeficientes LPC querepresenta o invólucro de um sinal é gerada através da análise do sinal, e os coeficientesLPC são transmitidos, ao invés da transmissão da informação do invólucro com respeito aosinal. Este método é eficiente em termos de taxas de bits. Contudo, uma vez que os coefici-entes LPCs tendem a se apresentar discrepante a partir do invólucro atual do sinal, estemétodo requer um processo de adição, tal como correção de erro. Em resumo, um métodoque envolve a transmissão da informação de invólucro de um sinal pode garantir um som dealta qualidade, mas isto resulta em um aumento considerável da quantidade de informaçãoque precisa ser transmitida. Por outro lado, um método que envolve a utilização de coefici-entes LPC pode reduzir a quantidade de informação que precisa ser transmitida, mas requerum processo adicional tal como correção de erro e resulta em uma redução da qualidadesonora.
De acordo com uma modalidade da presente invenção, pode-se utilizar uma combi-nação desses métodos. Em outras palavras, o invólucro de um sinal pode ser representadopela energia ou potência do sinal ou um valor indexado ou outro valor, tal como um coefici-ente LPC correspondendo à energia ou potência do sinal.
A informação de invólucro com respeito a um sinal pode ser obtida em unidades deseções temporais ou seções de freqüência. Mais especificamente, pela Figura 17 vê-se quea informação de invólucro com respeito a um sinal pode ser obtida em unidades de quadro.De forma alternativa, caso um sinal seja representado por um quadro de faixa de freqüênciafazendo uso de um banco de filtro, tal como um banco de filtro em quadratura espelhada(QMF), informação de invólucro com respeito a um sinal pode ser obtida em unidades desub-faixas de freqüência, partições de sub-faixas de freqüência que compreendem fatoresmenores do que as sub-faixas de freqüência, grupos de sub-faixas de freqüência ou gruposde partições de sub-faixas de freqüência. Ainda, de forma alternativa, uma combinação dométodo orientado a quadro, o método de freqüência orientado a sub-faixa, e o método defreqüência orientado a partição de sub-faixa podem ser empregados dentro do escopo dapresente invenção.
Ainda, de forma alternativa, dado que os componentes de baixa freqüência de umsinal, em regra, apresentam mais informação do que os componentes de alta-frequência dosinal, a informação de invólucro com respeito aos componentes de baixa freqüência de umsinal pode ser transmitida como ela se apresenta, em que a informação de invólucro comrespeito aos componentes de alta-frequência do sinal pode ser representada pelos coefici-entes LPC ou outros valores, e os coeficientes LPC ou outros valores podem ser transmiti-dos ao invés da informação de invólucro com respeito aos componentes de alta-frequênciado sinal. Contudo, os componentes de baixa freqüência de um sinal podem não apresentar,necessariamente mais informação do que os componentes de alta-frequência do sinal. Por-tanto, o método descrito acima deve ter aplicação flexível de acordo com as circunstâncias.
De acordo com uma modalidade da presente invenção, pode-se transmitir a infor-mação de invólucro ou o dado indexado correspondendo a uma porção (referida no relatóriocomo a porção dominante) de um sinal que surge como dominante no eixo do tem-po/frequência, e pode não se transmitir nada da informação de invólucro e do dado indexadocorrespondendo a uma porção não-dominante do sinal. De maneira alternativa, pode-setransmitir os valores (por exp., os coeficientes LPC) que representam a energia e a potênciada porção dominante, e pode-se não transmitir nenhum dos valores correspondendo a por-ção não-dominante do sinal. Ainda, de forma alternativa, pode-se transmitir a informação deinvólucro ou do dado indexado correspondendo a porção dominante do sinal, e os valoresque representam a energia ou a potência da porção não-dominante do sinal podem sertransmitidos. Ainda, de forma alternativa, a informação com respeito somente a porção do-minante do sinal pode ser transmitida de modo que a porção não-dominante do sinal possaser estimada com base na informação com respeito à porção dominante do sinal. Ainda, deforma alternativa, pode-se utilizar uma combinação dos métodos descritos acima.
Por exemplo, com respeito a Figura 18, caso seja dividido um sinal em um períododominante e um período não-dominante, a informação com referência ao sinal pode sertransmitida de quatro diferentes maneiras, conforme indicado por (a) até (d).
De maneira a se transmitir uma quantidade de sinais de objeto como a combinaçãode um sinal rebaixado e informação paralela, o sinal rebaixado necessita de ser dividido emuma pluralidade de elementos como parte de uma operação de decodificação, por exemplo,levando em consideração a taxa dos níveis dos sinais de objeto. De modo a se garantir aindependência entre os elementos do sinal rebaixado, uma operação para se desfazer acorrelação necessita de ser adicionalmente realizada.
Os sinais de objeto que compreendem as unidades de codificação em um métodode codificação orientado a objeto apresentam mais independência do que os sinais de canalque compreendem as unidades de codificação em um método de codificação de múltiploscanais. Em Outras palavras, um sinal de canal inclui uma quantidade de sinais de objeto,necessitando de terem a correlação desfeita. Por outro lado, os sinais de objeto se apresen-tam independentes uns dos outros, e, assim, a separação de canal pode ser feita de manei-ra facilitada, utilizando-se simplesmente as características dos sinais de objeto sem a ne-cessidade de uma operação que desfaça a correlação.
Mais especificamente, pela Figura 19, os sinais de objeto A, B, e C levam tempopara surgirem como dominantes no eixo da freqüência. Neste caso, não existe a necessida-de de se dividir um sinal rebaixado em uma quantidade de sinais, de acordo com a taxa deníveis dos sinais de objeto A, B, e C e de se desfazer a correlação. Ao contrário, a informa-ção com respeito aos períodos dominantes dos sinais de objeto A, B, e C pode ser transmi-tida, ou um valor de ganho pode ser aplicado para cada componente da freqüência de cadaum dos sinais de objeto A, B, e C, evitando-se então desfazer-se a correlação. Portanto, épossível se reduzir a quantidade de computação e se reduzir a taxa de bits por uma quanti-dade que teria sido solicitada pela informação paralela necessária para se desfazer a corre-lação.
Em resumo, de forma a se evitar desfazer a correlação, que é realizada de forma ase garantir a independência entre uma quantidade de sinais obtida via a divisão de um sinalrebaixado pela razão das razões dos sinais de objeto do sinal rebaixado, pode-se transmitirinformação com respeito a um domínio de freqüência, incluindo cada sinal de objeto na for-ma de informação paralela. De forma alternativa, os diferentes valores de ganho podem seraplicados junto a um período dominante durante o qual cada sinal de objeto surge comodominante e um período não-dominante durante o qual cada sinal de objeto surge comomenos dominante, e assim, informação com respeito ao período dominante pode ser princi-palmente fornecida como informação paralela. Ainda, de forma alternativa, a informaçãocom respeito ao período dominante pode ser transmitida como informação paralela, e podenão ser transmitida nenhuma informação com respeito ao período não-dominante. Ainda, deforma alternativa, pode-se fazer uso de uma combinação dos métodos descritos acima querepresentam alternativas a um método para se desfazer a correlação. Os métodos descritos acima que compreendem alternativas a um método para sedesfazer a correlação podem ser aplicados para todos os sinais de objeto ou somente paraalguns sinais de objeto que sejam períodos dominantes facilmente distinguíveis. Ainda, osmétodos descritos acima que compreendem alternativas a um método para se desfazer acorrelação podem ser aplicados de modos variáveis nas unidades de quadros.
A codificação dos sinais de áudio de objeto fazendo uso de um sinal residual serádescrita em detalhe adiante.Em regra, em um método de codificação de áudio orientado a objeto, uma quanti-dade de sinais de objeto é codificada, e os resultados da codificação são transmitidos naforma de combinação de um sinal rebaixado e informação paralela. Daí, uma quantidade desinais de objeto é restaurada a partir do sinal rebaixado através da decodificação de acordocom a informação paralela, e os sinais de objeto restaurados são devidamente mixados, porexemplo, mediante a solicitação de um usuário de acordo com a informação de controle,gerando assim um sinal de canal final. Um método de codificação de áudio orientado a obje-to, em regra, objetiva a variar livremente um sinal de canal liberado de acordo com a infor-mação de controle com o auxílio de um mixer. Contudo, um método de codificação de áudioorientado a objeto pode também ser utilizado para gerar uma saída de canal em uma manei-ra pré-definida indiferentemente da informação de controle.
Para isto, a informação paralela pode incluir não somente a informação necessáriapara se obter uma quantidade de sinais de objeto a partir de um sinal rebaixado, mas tam-bém a informação de mixagem de parâmetro necessária para se gerar um sinal de canal.Assim, é possível se gerar um sinal de saída de canal final sem o auxílio de um mixer. Nestecaso, tal algoritmo pode ser empregado na forma de codificação residual para se melhorar aqualidade do som.
Um método de codificação residual típicoinclui a codificação de um sinal e a codifi-cação do erro entre o sinal codificado e o sinal original, ou seja, um sinal residual. Duranteuma operação de decodificação, o sinal codificado é decodificado enquanto compensando oerro entre o sinal codificado e o sinal original, restabelecendo assim um sinal que se apre-senta semelhante ao sinal original, tanto quanto possível. Uma vez que o erro entre o sinalcodificado e o sinal original, em regra, é intolerável, é possível se reduzir a quantidade deinformação adicional necessária para se executar a codificação residual.
Caso uma saída de canal final de um decodificador seja fixada, não somente a in-formação de mixagem de parâmetro, necessária para geração de um sinal de canal final,mas também, a informação de codificação residual, podem ser fornecidas como informaçãoparalela. Neste caso, é possível se melhorar a qualidade sonora.
A Figura 20 compreende de uma aparelhagem de codificação de áudio 310 de a-cordo com uma modalidade da presente invenção. Pela Figura 20, a aparelhagem de codifi-cação de áudio 310 é caracterizada pelo emprego de um sinal residual.
Mais especificamente, a aparelhagem de codificação de áudio 310 inclui um codifi-cador 311, um decodificador 313, um primeiro mixer 315, um segundo mixer 319, um adicio-nador 317, e um gerador de fluxo de bits 321.
O primeiro mixer 315 desempenha uma operação de mixagem em um sinal original,e o segundo mixer 319 desempenha uma operação de mixagem em um sinal obtida pelaexecução de uma operação de codificação, e daí, uma operação de decodificação do sinaloriginal. O adicionador 317 calcula um sinal residual entre uma saída de sinal pelo primeiromixer 315 e uma saída de sinal pelo segundo mixer 319. O gerador de fluxo de bits 321 adi-ciona o sinal residual na informação paralela e transmite o resultado da adição. Desta ma-neira, é possível se melhorar a qualidade do som.
O cálculo de um sinal residual pode ser aplicado para todas as porções de um sinalou somente para as porções de baixa freqüência de um sinal. De maneira alternativa, o cál-culo de um sinal residual pode ser aplicado de maneira variável somente para domínios dafreqüência incluindo os sinais dominantes em uma base de quadro a quadro. Ainda de ma-neira alternativa, pode-se empregar uma combinação dos métodos descritos acima.
Uma vez que a quantidade de informação paralela incluindo a informação de sinalresidual é muito maior do que a quantidade de informação paralela incluindo a ausência deinformação de sinal residual, o cálculo de um sinal residual pode ser somente aplicado paraalgumas porções de um sinal que afetam diretamente a qualidade do som, prevenindo-seassim quanto a um aumento excessivo da taxa de bits. A presente invenção pode ser execu-tada na forma de um código de computador fixo escrito em uma mídia de gravação fixa. Amídia de gravação fixa pode compreender qualquer tipo de dispositivo de gravação aonde odado é armazenado em uma maneira fixa. Exemplos da mídia de gravação fixa incluem umROM, um RAM, um CD-ROM, uma fita magnética, um disco floppy, uma dispositivo de ar-mazenagem de dado ótico, uma onda portadora (por exp., transmissão de dados através daInternet). A mídia de gravação fixa pode ser distribuída através de uma pluralidade de sis-temas computacionais conectados numa rede de trabalho, de modo que o código fixo sejaescrito nos mesmos e ali executado em uma maneira descentralizada. Os programas fun-cionais, códigos, segmentos de códigos necessários para a execução da presente invençãopodem ser facilmente construídos por um especialista na área.
Aplicabilidade Industrial
Conforme descrito acima, de acordo com a presente invenção, as imagens sonorasapresentam-se localizadas para cada sinal de áudio de objeto beneficiando-se com as van-tagens dos métodos de decodificação e codificação de áudio orientado a objeto. Assim, épossível se oferecer sons mais realísticos através da reprodução de sinais de áudio de obje-to. Ainda, a presente invenção pode ser aplicada para jogos interativos, e pode oferecer umaexperiência virtualmente mais realística da realidade a um usuário.
Enquanto a presente invenção tenha sido apresentada e descrita com respeito assuas modalidades exemplares, compreender-se-á que os especialistas na área poderãoconceber várias alterações na forma e nos detalhes sem se afastarem do espírito e escopoda presente invenção definida conforme as reivindicações apensas.

Claims (21)

1. Método de decodificação de áudio, CARACTERIZADO pelo fato de compreen-der:extração de um sinal rebaixado e informação paralela orientada a objeto a partir daentrada de um sinal de áudio;geração de informação paralela orientada a canal com base na informação paralelaorientada a objeto e na informação de controle para renderização do sinal rebaixado;processamento do sinal rebaixado utilizando um sinal de canal sem correlaciona-mento; egeração de um sinal de áudio de múltiplos canais utilizando o sinal rebaixado pro-cessado e a informação paralela orientada a canal.
2. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de compreender ainda antes da geração de um sinal de áudiode múltiplos canais, modificar o sinal rebaixado fazendo uso da informação paralela orienta-da a objeto e a informação de controle.
3. Método de decodificação de áudio, de acordo com a reivindicação 2,CARACTERIZADO pelo fato da modificação do sinal rebaixado compreender o desempe-nho, pelo menos, do nível de ajuste, do processamento da imagem sonora e a adição doefeito no sinal rebaixado.
4. Método de decodificação de áudio, de acordo com a reivindicação 3,CARACTERIZADO pelo fato da modificação do sinal rebaixado compreender ainda a modi-ficação do sinal rebaixado tanto no domínio do tempo como no domínio da freqüência.
5. Método de decodificação de áudio, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de compreender ainda executar o processamento da reverbe-ração no sinal de áudio de múltiplos canais.
6. Método de decodificação de áudio, de acordo com a reivindicação 3,CARACTERIZADO pelo fato de compreender ainda a adição de um sinal pré-determinadaobtido pelo processamento de efeito junto ao sinal de áudio de múltiplos canais.
7. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato do sinal de canal sem correlacionamento se basear no sinal deáudio de canal e no sinal rebaixado.
8. Aparelhagem de decodificação de áudio, CARACTERIZADA pelo fato de com-preender:um demultiplexador que extrai um sinal rebaixado e uma informação paralela orien-tada a objeto a partir de um sinal de áudio;um conversor de parâmetro que gera informação paralela orientada a canal combase na informação paralela orientada a objeto e na informação de controle para renderiza-ção do sinal rebaixado;um processador de rebaixamento que modifica o sinal rebaixado através de desfa-zer a correlação do sinal rebaixado caso o sinal rebaixado seja um sinal rebaixado estéreo;eum decodificador de múltiplos canais que gera um sinal de áudio de múltiplos ca-nais utilizando um sinal rebaixado modificado obtido pelo processador de rebaixamento epela informação paralela orientada a canal.
9. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 8,CARACTERIZADA pelo fato do processador de rebaixamento modificar o sinal rebaixadofazendo uso da informação paralela orientada a objeto e da informação de controle.
10. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADA pelo fato do processador de rebaixamento modificar o sinal rebaixadoatravés da realização, pelo menos, de um ajuste de nível, processamento da imagem sono-ra e adição de efeito no sinal rebaixado.
11. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADA pelo fato do processador de rebaixamento modificar o sinal rebaixado,tanto em um domínio de tempo como num domínio de freqüência.
12. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADA pelo fato de compreender ainda um processador de canal que executa oprocessamento da reverberação no sinal de áudio de múltiplos canais.
13. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADA pelo fato de compreender ainda um processador de canal que adicionaum sinal pré-determinado obtido pelo processamento de efeito junto ao sinal de áudio demúltiplos canais.
14. Método de decodificação de áudio, CARACTERIZADO pelo fato de compreen-der:extração de um sinal rebaixado e informação paralela orientada a objeto a partir deum sinal de áudio;geração de informação paralela orientada a canal e um ou mais parâmetros de pro-cessamento com base na informação paralela orientada a objeto e na informação de contro-le para renderização do sinal rebaixado;geração de um sinal de áudio de múltiplos canais fazendo uso do sinal rebaixado eda informação paralela orientada a canal; emodificação do sinal de áudio de múltiplos canais fazendo uso dos parâmetros deprocessamento.
15. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 14,CARACTERIZADA pelo fato da modificação do sinal rebaixado compreender a execução doprocessamento da reverberação no sinal de áudio de múltiplos canais fazendo uso do pa-râmetro.
16. Aparelhagem de decodificação de áudio, de acordo com a reivindicação 14,CARACTERIZADA pelo fato da modificação do sinal rebaixado compreender da adição deum sinal obtido pelo processamento de efeito junto ao sinal de áudio de múltiplos canais.
17. Aparelhagem de decodificação de áudio, CARACTERIZADA pelo fato de com-preender:um demultiplexador que extrai um sinal rebaixado e informação paralela orientada aobjeto a partir de um sinal de áudio;um conversor de parâmetro que gera a informação paralela orientada a canal e umou mais parâmetros de processamento com base na informação paralela orientada a objetoe informação de controle para renderização do sinal rebaixado;um decodificador de múltiplos canais que gera um sinal de áudio de múltiplos ca-nais fazendo uso dos parâmetros de processamento.
18. Aparelhagem, de acordo com a reivindicação 17, CARACTERIZADA pelo fatodo processador de canal realizar o processamento da reverberação no sinal de áudio demúltiplos canais fazendo uso do parâmetro.
19. Aparelhagem, de acordo com a reivindicação 17, CARACTERIZADA pelo pro-cessador de canal adicionar um sinal obtido pelo processamento de efeito junto ao sinal deáudio de múltiplos canais.
20. Mídia de gravação fixa, CARACTERIZADA pelo fato de apresentar um métodode decodificação de áudio registrado na mesma compreendendo:extração de um sinal rebaixado e informação paralela orientada a objeto a partir deum sinal de áudio;geração de informação paralela orientada a canal com base na informação paralelaorientada a objeto e na informação de controle para renderização do sinal rebaixado;processamento do sinal rebaixado fazendo uso de um sinal de canal sem correla-cionamento; egeração de um sinal de áudio de múltiplos canais fazendo uso do sinal rebaixadoprocessado obtido pela transferência e pela informação paralela orientada a canal.
21. Mídia de gravação fixa, CARACTERIZADA pelo fato de apresentar um métodode decodificação de áudio registrado na mesma compreendendo:extração de um sinal rebaixado e informação paralela orientada a objeto a partir deum sinal de áudio;geração de informação paralela orientada a canal e um ou mais parâmetros de pro-cessamento com base na informação paralela orientada a objeto e na informação de contro-le para renderização do sinal rebaixado;geração de um sinal de áudio de múltiplos canais fazendo uso do sinal rebaixado eda informação paralela orientada a canal;emodificação do sinal de áudio de múltiplos canais fazendo uso dos parâmetros deprocessamento.
BRPI0711185-1A 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto BRPI0711185A2 (pt)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US84829306P 2006-09-29 2006-09-29
US60/848.293 2006-09-29
US82980006P 2006-10-17 2006-10-17
US60/829.800 2006-10-17
US86330306P 2006-10-27 2006-10-27
US60/863.303 2006-10-27
US86082306P 2006-11-24 2006-11-24
US60/860.823 2006-11-24
US88071407P 2007-01-17 2007-01-17
US60/880.714 2007-01-17
US88094207P 2007-01-18 2007-01-18
US60/880.942 2007-01-18
US94837307P 2007-07-06 2007-07-06
US60/948.373 2007-07-06
PCT/KR2007/004803 WO2008039043A1 (en) 2006-09-29 2007-10-01 Methods and apparatuses for encoding and decoding object-based audio signals

Publications (1)

Publication Number Publication Date
BRPI0711185A2 true BRPI0711185A2 (pt) 2011-08-23

Family

ID=39230400

Family Applications (4)

Application Number Title Priority Date Filing Date
BRPI0710923-7A BRPI0710923A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
BRPI0711185-1A BRPI0711185A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
BRPI0711104-5A BRPI0711104A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto
BRPI0711102-9A BRPI0711102A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0710923-7A BRPI0710923A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto

Family Applications After (2)

Application Number Title Priority Date Filing Date
BRPI0711104-5A BRPI0711104A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto
BRPI0711102-9A BRPI0711102A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto

Country Status (10)

Country Link
US (7) US7979282B2 (pt)
EP (4) EP2070081A4 (pt)
JP (4) JP5238707B2 (pt)
KR (4) KR100987457B1 (pt)
AU (4) AU2007300810B2 (pt)
BR (4) BRPI0710923A2 (pt)
CA (4) CA2645909C (pt)
MX (4) MX2008012315A (pt)
RU (1) RU2551797C2 (pt)
WO (4) WO2008039041A1 (pt)

Families Citing this family (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8577686B2 (en) * 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
JP4988716B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
EP1974347B1 (en) * 2006-01-19 2014-08-06 LG Electronics Inc. Method and apparatus for processing a media signal
KR100921453B1 (ko) * 2006-02-07 2009-10-13 엘지전자 주식회사 부호화/복호화 장치 및 방법
AU2007300810B2 (en) * 2006-09-29 2010-06-17 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
CA2874454C (en) * 2006-10-16 2017-05-02 Dolby International Ab Enhanced coding and parameter representation of multichannel downmixed object coding
AU2007312597B2 (en) * 2006-10-16 2011-04-14 Dolby International Ab Apparatus and method for multi -channel parameter transformation
JP5023662B2 (ja) * 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
CA2645863C (en) * 2006-11-24 2013-01-08 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
WO2008069594A1 (en) * 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for processing an audio signal
JP5463143B2 (ja) * 2006-12-07 2014-04-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及びその装置
EP2595150A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Apparatus for coding multi-object audio signals
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
WO2008084427A2 (en) * 2007-01-10 2008-07-17 Koninklijke Philips Electronics N.V. Audio decoder
CN101689368B (zh) * 2007-03-30 2012-08-22 韩国电子通信研究院 对具有多声道的多对象音频信号进行编码和解码的设备和方法
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
RU2452043C2 (ru) * 2007-10-17 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Аудиокодирование с использованием понижающего микширования
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
KR101062351B1 (ko) 2008-04-16 2011-09-05 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
EP2111060B1 (en) 2008-04-16 2014-12-03 LG Electronics Inc. A method and an apparatus for processing an audio signal
WO2009128662A2 (en) * 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
CN102099854B (zh) 2008-07-15 2012-11-28 Lg电子株式会社 处理音频信号的方法和装置
EP2146342A1 (en) * 2008-07-15 2010-01-20 LG Electronics Inc. A method and an apparatus for processing an audio signal
KR101614160B1 (ko) 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
JP5243527B2 (ja) * 2008-07-29 2013-07-24 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
CN102177542B (zh) * 2008-10-10 2013-01-09 艾利森电话股份有限公司 能量保留多通道音频编码
MX2011011399A (es) * 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466675B (en) * 2009-01-06 2013-03-06 Skype Speech coding
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
KR101137360B1 (ko) * 2009-01-28 2012-04-19 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
CN102016982B (zh) * 2009-02-04 2014-08-27 松下电器产业株式会社 结合装置、远程通信系统以及结合方法
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101123698B1 (ko) 2009-07-30 2012-03-15 삼성전자주식회사 프로세스 카트리지 및 이를 구비한 화상형성장치
CN102549655B (zh) * 2009-08-14 2014-09-24 Dts有限责任公司 自适应成流音频对象的系统
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
ES2644520T3 (es) * 2009-09-29 2017-11-29 Dolby International Ab Decodificador de señal de audio MPEG-SAOC, método para proporcionar una representación de señal de mezcla ascendente usando decodificación MPEG-SAOC y programa informático usando un valor de parámetro de correlación inter-objeto común dependiente del tiempo/frecuencia
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
WO2011071928A2 (en) * 2009-12-07 2011-06-16 Pixel Instruments Corporation Dialogue detector and correction
US9042559B2 (en) 2010-01-06 2015-05-26 Lg Electronics Inc. Apparatus for processing an audio signal and method thereof
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103119846B (zh) * 2010-09-22 2016-03-30 杜比实验室特许公司 利用对白水平归一化对音频流进行混合
EP2609589B1 (en) * 2010-09-28 2016-05-04 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9026450B2 (en) 2011-03-09 2015-05-05 Dts Llc System for dynamically creating and rendering audio objects
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR101783962B1 (ko) * 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
US8838262B2 (en) 2011-07-01 2014-09-16 Dolby Laboratories Licensing Corporation Synchronization and switch over methods and systems for an adaptive audio system
AU2012279349B2 (en) 2011-07-01 2016-02-18 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
HUE054452T2 (hu) * 2011-07-01 2021-09-28 Dolby Laboratories Licensing Corp Rendszer és eljárás adaptív hangjel elõállítására, kódolására és renderelésére
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
EP2741285B1 (en) 2012-07-02 2019-04-10 Sony Corporation Decoding device and method, encoding device and method, and program
WO2014007097A1 (ja) 2012-07-02 2014-01-09 ソニー株式会社 復号装置および方法、符号化装置および方法、並びにプログラム
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9479886B2 (en) * 2012-07-20 2016-10-25 Qualcomm Incorporated Scalable downmix design with feedback for object-based surround codec
JP6045696B2 (ja) * 2012-07-31 2016-12-14 インテレクチュアル ディスカバリー シーオー エルティディIntellectual Discovery Co.,Ltd. オーディオ信号処理方法および装置
WO2014020181A1 (en) * 2012-08-03 2014-02-06 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decoder and method for multi-instance spatial-audio-object-coding employing a parametric concept for multichannel downmix/upmix cases
AU2013301864B2 (en) 2012-08-10 2016-04-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and methods for adapting audio information in spatial audio object coding
US20140114456A1 (en) * 2012-10-22 2014-04-24 Arbitron Inc. Methods and Systems for Clock Correction and/or Synchronization for Audio Media Measurement Systems
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
EP2959479B1 (en) 2013-02-21 2019-07-03 Dolby International AB Methods for parametric multi-channel encoding
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
US9558785B2 (en) 2013-04-05 2017-01-31 Dts, Inc. Layered audio coding and transmission
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
KR102058619B1 (ko) * 2013-04-27 2019-12-23 인텔렉추얼디스커버리 주식회사 예외 채널 신호의 렌더링 방법
ES2640815T3 (es) 2013-05-24 2017-11-06 Dolby International Ab Codificación eficiente de escenas de audio que comprenden objetos de audio
EP3312835B1 (en) 2013-05-24 2020-05-13 Dolby International AB Efficient coding of audio scenes comprising audio objects
EP3005352B1 (en) 2013-05-24 2017-03-29 Dolby International AB Audio object encoding and decoding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
US10178398B2 (en) * 2013-10-11 2019-01-08 Telefonaktiebolaget Lm Ericsson (Publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
JP6299202B2 (ja) * 2013-12-16 2018-03-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
US9756448B2 (en) 2014-04-01 2017-09-05 Dolby International Ab Efficient coding of audio scenes comprising audio objects
US10754925B2 (en) 2014-06-04 2020-08-25 Nuance Communications, Inc. NLU training with user corrections to engine annotations
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
JP6306958B2 (ja) * 2014-07-04 2018-04-04 日本放送協会 音響信号変換装置、音響信号変換方法、音響信号変換プログラム
WO2016069809A1 (en) * 2014-10-30 2016-05-06 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
US10057707B2 (en) 2015-02-03 2018-08-21 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
US10567185B2 (en) 2015-02-03 2020-02-18 Dolby Laboratories Licensing Corporation Post-conference playback system having higher perceived quality than originally heard in the conference
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US10325610B2 (en) 2016-03-30 2019-06-18 Microsoft Technology Licensing, Llc Adaptive audio rendering
US10863297B2 (en) 2016-06-01 2020-12-08 Dolby International Ab Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
WO2018057639A1 (en) 2016-09-20 2018-03-29 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB201808897D0 (en) * 2018-05-31 2018-07-18 Nokia Technologies Oy Spatial audio parameters
WO2020080099A1 (ja) * 2018-10-16 2020-04-23 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP7326824B2 (ja) 2019-04-05 2023-08-16 ヤマハ株式会社 信号処理装置、及び信号処理方法

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3882280A (en) * 1973-12-19 1975-05-06 Magnavox Co Method and apparatus for combining digitized information
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
EP0520068B1 (en) 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
RU2121718C1 (ru) 1998-02-19 1998-11-10 Яков Шоел-Берович Ровнер Портативная музыкальная система для караоке и картридж для нее
US20050120870A1 (en) 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3173482B2 (ja) 1998-11-16 2001-06-04 日本ビクター株式会社 記録媒体、及びそれに記録された音声データの音声復号化装置
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US7020618B1 (en) * 1999-10-25 2006-03-28 Ward Richard E Method and system for customer service process management
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US6849794B1 (en) 2001-05-14 2005-02-01 Ronnie C. Lau Multiple channel system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP2003186500A (ja) 2001-12-17 2003-07-04 Sony Corp 情報伝達システム、情報符号化装置および情報復号装置
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
KR101016251B1 (ko) 2002-04-10 2011-02-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 스테레오 신호의 코딩
EP1500083B1 (en) 2002-04-22 2006-06-28 Koninklijke Philips Electronics N.V. Parametric multi-channel audio representation
JP4714416B2 (ja) * 2002-04-22 2011-06-29 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 空間的オーディオのパラメータ表示
EP1502361B1 (en) * 2002-05-03 2015-01-14 Harman International Industries Incorporated Multi-channel downmixing device
KR20050021484A (ko) 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP2004064363A (ja) 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
EP1554716A1 (en) 2002-10-14 2005-07-20 Koninklijke Philips Electronics N.V. Signal filtering
US7395210B2 (en) 2002-11-21 2008-07-01 Microsoft Corporation Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform
US9002716B2 (en) 2002-12-02 2015-04-07 Thomson Licensing Method for describing the composition of audio signals
ES2282860T3 (es) 2003-04-17 2007-10-16 Koninklijke Philips Electronics N.V. Generacion de señal de audio.
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
JPWO2005081229A1 (ja) 2004-02-25 2007-10-25 松下電器産業株式会社 オーディオエンコーダ及びオーディオデコーダ
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
US7756713B2 (en) 2004-07-02 2010-07-13 Panasonic Corporation Audio signal decoding device which decodes a downmix channel signal and audio signal encoding device which encodes audio channel signals together with spatial audio information
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
JP4466242B2 (ja) 2004-07-13 2010-05-26 株式会社サタケ ペレット選別機
KR100658222B1 (ko) 2004-08-09 2006-12-15 한국전자통신연구원 3차원 디지털 멀티미디어 방송 시스템
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1817767B1 (en) 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005008342A1 (de) 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
WO2007004829A2 (en) 2005-06-30 2007-01-11 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8359341B2 (en) 2005-12-10 2013-01-22 International Business Machines Corporation Importing content into a content management system using an e-mail application
ATE476732T1 (de) * 2006-01-09 2010-08-15 Nokia Corp Steuerung der dekodierung binauraler audiosignale
EP1989704B1 (en) * 2006-02-03 2013-10-16 Electronics and Telecommunications Research Institute Method and apparatus for control of randering multiobject or multichannel audio signal using spatial cue
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
DE102007003374A1 (de) 2006-02-22 2007-09-20 Pepperl + Fuchs Gmbh Induktiver Näherungsschalter sowie Verfahren zum Betreiben eines solchen
BRPI0621499B1 (pt) * 2006-03-28 2022-04-12 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Método melhorado para formatação de sinal em reconstrução de áudio de canais múltiplos
ATE542216T1 (de) * 2006-07-07 2012-02-15 Fraunhofer Ges Forschung Vorrichtung und verfahren zum kombinieren mehrerer parametrisch kodierter audioquellen
MX2009002795A (es) * 2006-09-18 2009-04-01 Koninkl Philips Electronics Nv Codificacion y decodificacion de objetos de audio.
AU2007300810B2 (en) * 2006-09-29 2010-06-17 Lg Electronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8295494B2 (en) 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
TW200930042A (en) * 2007-12-26 2009-07-01 Altek Corp Method for capturing image

Also Published As

Publication number Publication date
JP2010505141A (ja) 2010-02-18
CA2645909A1 (en) 2008-04-03
JP2010505142A (ja) 2010-02-18
EP2071564A1 (en) 2009-06-17
BRPI0711102A2 (pt) 2011-08-23
CA2645910C (en) 2015-04-07
CA2645908C (en) 2013-11-26
AU2007300814B2 (en) 2010-05-13
US7987096B2 (en) 2011-07-26
AU2007300814A1 (en) 2008-04-03
AU2007300812A1 (en) 2008-04-03
EP2070080A4 (en) 2009-10-14
JP4787362B2 (ja) 2011-10-05
KR20090013177A (ko) 2009-02-04
EP2071563A4 (en) 2009-09-02
WO2008039043A1 (en) 2008-04-03
US20090157411A1 (en) 2009-06-18
KR20090026121A (ko) 2009-03-11
AU2007300810A1 (en) 2008-04-03
US9384742B2 (en) 2016-07-05
JP5238706B2 (ja) 2013-07-17
US20160314793A1 (en) 2016-10-27
WO2008039039A1 (en) 2008-04-03
EP2071564A4 (en) 2009-09-02
EP2070080A1 (en) 2009-06-17
US9792918B2 (en) 2017-10-17
CA2645910A1 (en) 2008-04-03
KR101069266B1 (ko) 2011-10-04
WO2008039042A1 (en) 2008-04-03
US8504376B2 (en) 2013-08-06
RU2010141970A (ru) 2012-04-20
CA2645908A1 (en) 2008-04-03
MX2008012250A (es) 2008-10-07
US8762157B2 (en) 2014-06-24
KR100987457B1 (ko) 2010-10-13
EP2070081A1 (en) 2009-06-17
US20110196685A1 (en) 2011-08-11
AU2007300810B2 (en) 2010-06-17
BRPI0711104A2 (pt) 2011-08-23
MX2008012246A (es) 2008-10-07
AU2007300812B2 (en) 2010-06-10
CA2646045A1 (en) 2008-04-03
WO2008039041A1 (en) 2008-04-03
KR20090013178A (ko) 2009-02-04
US20090164221A1 (en) 2009-06-25
US8625808B2 (en) 2014-01-07
KR20090009842A (ko) 2009-01-23
JP2010505140A (ja) 2010-02-18
EP2070081A4 (en) 2009-09-30
KR101065704B1 (ko) 2011-09-19
JP5232789B2 (ja) 2013-07-10
AU2007300813B2 (en) 2010-10-14
CA2646045C (en) 2012-12-11
US20140303985A1 (en) 2014-10-09
EP2071563A1 (en) 2009-06-17
RU2551797C2 (ru) 2015-05-27
US20080140426A1 (en) 2008-06-12
US7979282B2 (en) 2011-07-12
BRPI0710923A2 (pt) 2011-05-31
AU2007300813A1 (en) 2008-04-03
JP5238707B2 (ja) 2013-07-17
CA2645909C (en) 2012-12-11
JP2010505328A (ja) 2010-02-18
MX2008012251A (es) 2008-10-07
MX2008012315A (es) 2008-10-10
US20090164222A1 (en) 2009-06-25

Similar Documents

Publication Publication Date Title
BRPI0711185A2 (pt) métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
BRPI0715312B1 (pt) Aparelhagem e método para transformação de parâmetros multicanais
PT1603118T (pt) Recetor e método para descodificar o fluxo de bits codificado em estéreo paramétrico
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]
B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]