BRPI0711102A2 - métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto - Google Patents

métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto Download PDF

Info

Publication number
BRPI0711102A2
BRPI0711102A2 BRPI0711102-9A BRPI0711102A BRPI0711102A2 BR PI0711102 A2 BRPI0711102 A2 BR PI0711102A2 BR PI0711102 A BRPI0711102 A BR PI0711102A BR PI0711102 A2 BRPI0711102 A2 BR PI0711102A2
Authority
BR
Brazil
Prior art keywords
information
signal
channel
audio
converted
Prior art date
Application number
BRPI0711102-9A
Other languages
English (en)
Inventor
Sung Yong Yoon
Hee Suk Pang
Hyun Kook Lee
Dong Soo Kim
Jae Hyun Lim
Original Assignee
Lg Eletronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Lg Eletronics Inc filed Critical Lg Eletronics Inc
Publication of BRPI0711102A2 publication Critical patent/BRPI0711102A2/pt

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/087Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using mixed excitation models, e.g. MELP, MBE, split band LPC or HVXC
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/439Processing of audio elementary streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/04Time compression or expansion
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/03Aspects of down-mixing multi-channel audio to configurations with lower numbers of playback channels, e.g. 7.1 -> 5.1
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/11Positioning of individual sound objects, e.g. moving airplane, within a sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]

Abstract

MéTODOS E APARELHOS PARA CODIFICAR E DECODIFICAR SINAIS DE áUDIO COM BASE EM OBJETO São fornecidos um método e aparelho de codificação de áudio e um método e aparelho de decodificação de áudio nos quais sinais de áudio podem ser codificados ou decodificados para que imagens de som possam ser localizadas em qualquer posição desejada para cada sinal de áudio de objeto. O método de decodificação de áudio compreende: gerar um terceiro sinal convertido para menos canais pela combinação de um primeiro sinal convertido para menos canais extraído de um primeiro sinal de áudio e de um segundo sinal convertido para menos canais extraido de um segundo sinal de áudio; gerar terceira informação complementar com base em objeto pela combinação da primeira informação complementar com base em objeto extraída do primeiro sinal de áudio e da segunda informação complementar com base em objeto extraída do segundo sinal de áudio; converter a terceira informação complementar com base em objeto em informação complementar com base em canal; e gerar um sinal de áudio multicanais usando o terceiro sinal convertido para menos canais e a informação complementar com base em canal.

Description

"MÉTODOS E APARELHOS PARA CODIFICAR E DECODIFICAR SINAIS DEÁUDIO COM BASE EM OBJETO"
CAMPO TÉCNICO
A presente invenção diz respeito a um método e aparelho de codificação de áudio ea um método e aparelho de decodificação de áudio, nos quais imagens podem ser localiza-das em qualquer posição desejada para cada sinal de áudio de objeto.
ANTECEDENTES DA INVENÇÃO
No geral, em técnicas de codificação e de decodificação de áudio muiticanais, é re-alizada conversão para menos canais de inúmeros sinais de canal de um sinal muiticanaisem menos sinais de canal, informação complementar considerando os sinais de canal origi-nais é transmitida, e um sinal muiticanais com tantos canais quanto o sinal muiticanais origi-nal é restaurado.
Basicamente, técnicas de codificação e de decodificação de áudio com base emobjeto são similares às técnicas de codificação e de decodificação de áudio muiticanais emtermos de fazer conversão para menos canais de diversas fontes de som em menos sinaisde fonte de som e de transmitir informação complementar considerando as fontes de somoriginais. Entretanto, em técnicas de codificação e de decodificação de áudio com base emobjeto, sinais de objetos, que são elementos básicos (por exemplo, o som de um instrumen-to musical ou de uma voz humana) de um sinal de canal, são tratados da mesma forma queos sinais de canal em técnicas de codificação e de decodificação de áudio muiticanais e,assim, podem ser codificados.
Em outras palavras, em técnicas de codificação e de decodificação de áudio combase em objeto, cada sinal de objeto é considerado a entidade a ser codificada. Neste as-pecto, técnicas de codificação e de decodificação de áudio com base em objeto são diferen-tes das técnicas de codificação e de decodificação de áudio muiticanais nas quais uma ope-ração de codificação de áudio muiticanais é realizada simplesmente com base em informa-ção intercanais, independente do número de elementos de um sinal de canal a ser codifica-do.
DIVULGAÇÃO DA INVENÇÃOPROBLEMA TÉCNICO
A presente invenção fornece um método e um aparelho de codificação de áudio eum método e um aparelho de decodificação de áudio nos quais sinais de áudio podem sercodificados ou decodificados para que imagens de som possam ser localizadas em qualquerposição desejada para cada sinal de áudio de objeto.
SOLUÇÃO TÉCNICA
De acordo com um aspecto da presente invenção, é fornecido um método de deco-dificação de áudio que inclui gerar um terceiro sinal convertido para menos canais pelacombinação de um primeiro sinal convertido para menos canais extraído de um primeirosinal de áudio e de um segundo sinal convertido para menos canais extraído de um segundosinal de áudio; gerar terceira informação complementar com base em objeto pela combina-ção da primeira informação complementar com base em objeto extraída do primeiro sinal deáudio e da segunda informação complementar com base em objeto extraída do segundosinal de áudio; converter a terceira informação complementar com base em objeto em infor-mação complementar com base em canal; e gerar um sinal de áudio multicanais usando oterceiro sinal convertido para menos canais e a informação complementar com base emcanal.
De acordo com um outro aspecto da presente invenção, é fornecido um aparelho dedecodificação de áudio que inclui um combinador de unidade de controle multipontos quegera um terceiro sinal convertido para menos canais pela combinação de um primeiro sinalconvertido para menos canais extraído de um primeiro sinal de áudio e de um segundo sinalconvertido para menos canais extraído de um segundo sinal de áudio, e gera terceira infor-mação complementar com base em objeto pela combinação da primeira informação com-plementar com base em objeto extraída do primeiro sinal de áudio e da segunda informaçãocomplementar com base em objeto extraída do segundo sinal de áudio; um transcodificadorque converte a terceira informação complementar com base em objeto em informação com-plementar com base em canal; e um decodificador multicanais que gera um sinal de áudiomulticanais usando o terceiro sinal convertido para menos canais e a informação comple-mentar com base em canal.
De acordo com um outro aspecto da presente invenção, é fornecida uma mídia degravação legível por computador com um método de decodificação de áudio nela gravadoque inclui gerar um terceiro sinal convertido para menos canais pela combinação de um pri-meiro sinal convertido para menos canais extraído de um primeiro sinal de áudio e de umsegundo sinal convertido para menos canais extraído de um segundo sinal de áudio; gerarterceira informação complementar com base em objeto pela combinação da primeira infor-mação complementar com base em objeto extraída do primeiro sinal de áudio e da segundainformação complementar com base em objeto extraída do segundo sinal de áudio; conver-ter a terceira informação complementar com base em objeto em informação complementarcom base em canal; e gerar um sinal de áudio multicanais usando o terceiro sinal convertidopara menos canais e a informação complementar com base em canal.
EFEITOS VANTAJOSOS
São fornecidos um método e aparelho de codificação de áudio e um método e apa-relho de decodificação de áudio nos quais sinais de áudio podem ser codificados ou decodi-ficados para que imagens de som possam ser localizadas em qualquer posição desejadapara cada sinal de áudio de objeto.DESCRIÇÃO RESUMIDA DOS DESENHOS
A presente invenção será mais completamente entendida a partir da descrição de-talhada dada aqui a seguir e dos desenhos anexos, que são dados para ilustração somente,e, assim, não são Iimitantes da presente invenção, e em que:
a figura 1 é um diagrama de blocos de um sistema típico de codificação / decodifi-cação de áudio com base em objeto;
a figura 2 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma primeira modalidade da presente invenção;
a figura 3 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma segunda modalidade da presente invenção;
a figura 4 é um gráfico para explicar a influência de uma diferença de amplitude ede uma diferença de tempo, que são independentes entre si, na localização das imagens dosom;
a figura 5 é um gráfico de funções que considera a correspondência entre diferen-ças de amplitude e diferenças de tempo que são exigidas para localizar imagens de som emuma posição pré-determinada;
a figura 6 ilustra o formato de informação de controle que incluem informação har-mônica;
a figura 7 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma terceira modalidade da presente invenção;
a figura 8 é um diagrama de blocos de um módulo de ganhos de conversão paramenos canais artística (ADG) que pode ser usado no aparelho de decodificação de áudioilustrado na figura 7;
a figura 9 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma quarta modalidade da presente invenção;
a figura 10 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma quinta modalidade da presente invenção;
a figura 11 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma sexta modalidade da presente invenção;
a figura 12 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma sétima modalidade da presente invenção;
a figura 13 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma oitava modalidade da presente invenção;
a figura 14 é um diagrama para explicar a aplicação de informação tridimensional(3D) em um quadro pelo aparelho de decodificação de áudio ilustrado na figura 13;
a figura 15 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma nona modalidade da presente invenção;a figura 16 é um diagrama de blocos de um aparelho de decodificação de áudio deacordo com uma décima modalidade da presente invenção;
as figuras 17 até 19 são diagramas para explicar um método de decodificação deáudio de acordo com uma modalidade da presente invenção; ea figura 20 é um diagrama de blocos de um aparelho de codificação de áudio deacordo com uma modalidade da presente invenção.
MELHOR MODO PARA REALIZAR A INVENÇÃO
A presente invenção será descrita com detalhes a seguir em relação aos desenhosanexos nos quais modalidades exemplares da invenção são mostradas.
Um método e um aparelho de codificação de áudio e um método e um aparelho dedecodificação de áudio de acordo com a presente invenção podem ser aplicados em opera-ções de processamento de áudio com base em objeto, mas a presente invenção não é res-trita a isto. Em outras palavras, o método e aparelho de codificação de áudio e o método eaparelho de decodificação de áudio podem ser aplicados a várias operações de processa-mento de sinal diferentes das operações de processamento de áudio com base em objeto.
A figura 1 é um diagrama de blocos de um sistema típico de codificação / decodifi-cação de áudio com base em objeto. No geral, sinais de áudio inseridos em um aparelho decodificação de áudio com base em objeto não correspondem a canais de um sinal multica-nais, mas são sinais de objetos independentes. Neste aspecto, um aparelho de codificação de áudio com base em objeto é diferenciado de um aparelho de codificação de áudio multi-canais no qual sinais de canal de um sinal multicanais são inseridos.
Por exemplo, sinais de canal, tais como sinal de canal frontal esquerdo e sinal decanal frontal direito de um sinal de 5.1 canais podem ser inseridos em um sinal de áudiomulticanais, enquanto que sinal de áudio de objeto, tais como uma voz humana ou o som de um instrumento musical (por exemplo, o som de um violino ou de um piano), que são enti-dades menores do que sinais de canal, pode ser inserido em um aparelho de codificação deáudio com base em objeto.
Em relação à figura 1, o sistema de codificação / decodificação de áudio com baseem objeto inclui um aparelho de codificação de áudio com base em objeto e um aparelho dedecodificação de áudio com base em objeto. O aparelho de codificação de áudio com baseem objeto inclui um codificador de objeto 100, e o aparelho de decodificação de áudio combase em objeto inclui um decodificador de objeto 111 e um renderizador 113.
O codificador de objeto 100 recebe N sinais de áudio de objeto e gera um sinalconvertido para menos canais com base em objeto com um ou mais canais e informaçãocomplementar incluindo inúmeras partes de informação extraídas dos N sinais de áudio deobjeto, tais como diferença de energia, diferença de fase e valor de correlação. A informa-ção complementar e o sinal convertido para menos canais com base em objeto são incorpo-rados em um único fluxo contínuo de bits, e o fluxo contínuo de bits é transmitido ao apare-lho de decodificação com base em objeto.
A informação complementar pode incluir um indicador que indica se deve-se reali-zar codificação de áudio com base em canal ou codificação de áudio com base em objeto e,assim, pode-se determinar se deve ser realizada codificação de áudio com base em canalou codificação de áudio com base em objeto com base no indicador da informação comple-mentar. A informação complementar também pode incluir informação de envelope, informa-ção de agrupamento, informação de período em silêncio, e informação de atraso conside-rando sinais de objetos. A informação complementar também pode incluir informação dediferenças de nível de objeto, informação de correlação cruzada interobjetos, informação deganho de conversão para menos canais, informação de diferença de nível de canal de con-versão para menos canais e informação de energia de objeto absoluta.
O decodificador de objeto 111 recebe o sinal convertido para menos canais combase em objeto e a informação complementar do aparelho de codificação de áudio com ba-se em objeto e restaura sinais de objetos com propriedades similares daquelas dos N sinaisde áudio de objeto com base no sinal convertido para menos canais com base em objeto ena informação complementar. Os sinais de objetos gerados pelo decodificador de objeto 111ainda não foram alocados em nenhuma posição em um espaço multicanais. Assim, o rende-rizador 113 aloca cada um dos sinais de objetos gerados pelo decodificador de objeto 111em uma posição pré-determinada em um espaço multicanais e determina os níveis dos si-nais de objetos para que os sinais de objetos possam ser reproduzidos a partir de respecti-vas posições correspondentes designadas pelo renderizador 113 com respectivos níveiscorrespondentes determinados pelo renderizador 113. Informação de controle considerandocada um dos sinais de objetos gerados pelo decodificador de objeto 111 pode variar duranteo tempo e, assim, posições espaciais e os níveis dos sinais de objetos gerados pelo decodi-ficador de objeto 111 podem variar de acordo com a informação de controle.
A figura 2 é um diagrama de blocos de um aparelho de decodificação de áudio 120de acordo com uma primeira modalidade da presente invenção. Em relação à figura 2, oaparelho de decodificação de áudio 120 inclui um decodificador de objeto 121, um renderi-zador 123 e um conversor de parâmetro 125. O aparelho de decodificação de áudio 120também pode incluir um demultiplexador (não mostrado) que extrai um sinal convertido paramenos canais e informação complementar de um fluxo contínuo de bits nele inserido, e istose aplicará a todos os aparelhos de decodificação de áudio de acordo com outras modalida-des da presente invenção.
O decodificador de objeto 121 gera inúmeros sinais de objetos com base em um si-nal convertido para menos canais e em informação complementar modificada fornecida peloconversor de parâmetro 125. O renderizador 123 aloca cada um dos sinais de objetos gera-dos pelo decodificador de objeto 121 em uma posição pré-determinada em um espaço mul-ticanais e determina os níveis dos sinais de objetos gerados pelo decodificador de objeto121 de acordo com a informação de controle. O conversor de parâmetro 125 gera a infor-mação complementar modificada pela combinação da informação complementar e da infor-mação de controle. Então, o conversor de parâmetro 125 transmite a informação comple-mentar modificada ao decodificador de objeto 121.
O decodificador de objeto 121 pode ser capaz de realizar decodificação adaptativapela análise da informação de controle na informação complementar modificada.
Por exemplo, se a informação de controle indicar que um primeiro sinal de objeto eum segundo sinal de objeto estão alocados na mesma posição em um espaço multicanais etêm o mesmo nível, um aparelho de decodificação de áudio típico pode decodificar os pri-meiro e segundo sinais de objetos separadamente e, então, arranjá-los em um espaço mul-ticanais por meio de uma operação de conversão de canais / renderização.
Por outro lado, o decodificador de objeto 121 do aparelho de decodificação de áu-dio 120 aprende a partir da informação de controle na informação complementar modificadaque os primeiro e segundo sinais de objetos estão alocados na mesma posição em um es-paço multicanais e têm o mesmo nível se eles eram uma única fonte de som. Dessa manei-ra, o decodificador de objeto 121 decodifica os primeiro e segundo sinais de objetos tratan-do-os como uma única fonte de som sem decodificá-los separadamente. Em decorrênciadisto, a complexidade da decodificação diminui. Além do mais, em função de uma diminui-ção no número de fontes de som que precisam ser processadas, a complexidade da con-versão de canais / renderização também diminui.
O aparelho de decodificação de áudio 120 pode ser efetivamente usado na situaçãoem que o número de sinais de objetos é maior do que o número de canais de saída em vir-tude de ser altamente provável que uma pluralidade de sinais de objetos esteja alocada namesma posição espacial.
Alternativamente, o aparelho de decodificação de áudio 120 pode ser usado na si-tuação em que o primeiro sinal de objeto e o segundo sinal de objeto são alocados na mes-ma posição em um espaço multicanais, mas têm diferentes níveis. Neste caso, o aparelhode decodificação de áudio 120 decodifica os primeiro e segundo sinais de objetos pelo tra-tamento dos primeiro e segundo sinais de objetos com um único sinal, em vez de decodificaros primeiro e segundo sinais de objetos separadamente e transmitir os primeiro e segundosinais de objetos decodificados ao renderizador 133. Mais especificamente, o decodificadorde objeto 121 pode obter informação considerando a diferença entre os níveis dos primeiroe segundo sinais de objetos da informação de controle na informação complementar modifi-cada, e pode decodificar os primeiro e segundo sinais de objetos com base na informaçãoobtida. Em decorrência disto, mesmo se os primeiro e segundo sinais de objetos tiveremníveis diferentes, os primeiro e segundo sinais de objetos podem ser decodificados como seeles fossem uma única fonte de som.
Ainda alternativamente, o decodificador de objeto 121 pode ajustar os níveis dos si-nais de objetos gerados pelo decodificador de objeto 121 de acordo com a informação decontrole. Então, o decodificador de objeto 121 pode decodificar os sinais de objetos cujosníveis são ajustados. Dessa maneira, o renderizador 123 não precisa ajustar os níveis dossinais de objetos decodificados fornecidos pelo decodificador de objeto 121, mas simples-mente arranja os sinais de objetos decodificados fornecidos pelo decodificador de objeto121 em um espaço multicanais. Em resumo, já que o decodificador de objeto 121 ajusta osníveis dos sinais de objetos gerados pelo decodificador de objeto 121 de acordo com a in-formação de controle, o renderizador 123 pode arranjar prontamente os sinais de objetosgerados pelo decodificador de objeto 121 em um espaço multicanais sem a necessidade deajustar adicionalmente os níveis dos sinais de objetos gerados pelo decodificador de objeto121. Portanto, é possível reduzir a complexidade de conversão de canais / renderização.
De acordo com a modalidade da figura 2, o decodificador de objeto do aparelho dedecodificação de áudio 120 pode realizar adaptativamente uma operação de decodificaçãopor meio da análise da informação de controle, desse modo, reduzindo a complexidade dadecodificação e a complexidade da conversão de canais / renderização. Uma combinaçãodos métodos supradescritos realizados pelo aparelho de decodificação de áudio 120 podeser usada.
A figura 3 é um diagrama de blocos de um aparelho de decodificação de áudio 130de acordo com uma segunda modalidade da presente invenção. Em relação à figura 3, oaparelho de decodificação de áudio 130 inclui um decodificador de objeto 131 e um renderi-zador 133. O aparelho de decodificação de áudio 130 é caracterizado por fornecer informa-ção complementar não somente ao decodificador de objeto 131, mas também ao renderiza-dor 133.
O aparelho de decodificação de áudio 130 pode realizar efetivamente uma opera-ção de decodificação mesmo quando há um sinal de objeto correspondente a um períodoem silêncio. Por exemplo, os segundo até quarto sinais de objetos podem corresponder aum período de reprodução de música durante o qual um instrumento musical é tocado, e umprimeiro sinal de objeto pode corresponder a um período em silêncio durante o qual um a-companhamento é tocado. Neste caso, informação que indica qual de uma pluralidade desinais de objetos corresponde a um período em silêncio pode ser incluída na informaçãocomplementar, e a informação complementar pode ser fornecida ao renderizador 133, bemcomo ao decodificador de objeto 131.
O decodificador de objeto 131 pode minimizar a complexidade da decodificação pe-la não decodificação de um sinal de objeto correspondente a um período em silêncio. O de-codificador de objeto 131 ajusta um sinal de objeto correspondente a um valor de 0 e trans-mite o nível do sinal de objeto ao renderizador 133. No geral, sinais de objetos com um valorde O são tratados da mesma forma que os sinais de objetos com um valor diferente de O e,assim, são sujeitos a uma operação de conversão de canais / renderização.
Por outro lado, o aparelho de decodificação de áudio 130 transmite informaçãocomplementar que inclui informação que indica qual de uma pluralidade de sinais de objetoscorresponde a um período em silêncio ao renderizador 133 e, assim, pode impedir que umsinal de objeto correspondente a um período em silêncio seja sujeito a uma operação deconversão de canais / renderização realizada pelo renderizador 133. Portanto, o aparelho dedecodificação de áudio 130 pode impedir um aumento desnecessário na complexidade daconversão de canais / renderização.
O renderizador 133 pode usar informação de parâmetro de conversão de canaisque está incluída na informação de controle para localizar uma imagem de som de cadasinal de objeto em uma cena estéreo. A informação de parâmetro de conversão de canaispode incluir informação de amplitude somente ou tanto informação de amplitude quanto in-formação de tempo. A informação de parâmetro de conversão de canais afeta não somentea localização das imagens de som estéreo, mas também a percepção psicoacústica de umaqualidade espacial de som por um usuário.
Por exemplo, mediante comparação de duas imagens de som que são geradas u-sando um método de variação de tempo e um método de variação de amplitude, respecti-vamente, e reproduzidas no mesmo local usando um alto-falante estéreo de 2 canais, per-cebe-se que o método de variação de amplitude pode contribuir para uma precisa localiza-ção das imagens de som, e que o método de variação de tempo pode fornecer sons naturaiscom uma profunda sensação de espaço. Assim, se o renderizador 133 usar somente o mé-todo de variação de amplitude para arranjar sinais de objetos em um espaço multicanais, orenderizador 133 pode ser capaz de localizar precisamente cada imagem de som, mas podenão ser capaz de fornecer uma sensação de som tão profunda quanto durante o uso do mé-todo de variação de tempo. Algumas vezes, usuários podem preferir uma precisa localiza-ção das imagens de som em relação a uma profunda sensação do som ou vice-versa, deacordo com o tipo das fontes de som.
As figuras 4(a) e 4(b) explicam a influência da intensidade (diferença de amplitude)e de uma diferença de tempo na localização das imagens de som realizada na reproduçãodos sinais com um alto-falante estéreo de 2 canais. Em relação às figuras 4(a) e 4(b), umaimagem de som pode ser localizada em um ângulo pré-determinado de acordo com umadiferença de amplitude e uma diferença de tempo que são independentes entre si. Por e-xemplo, uma diferença de amplitude de cerca de 8 dB ou uma diferença de tempo de cercade 0,5 ms, que é equivalente à diferença de amplitude de 8 dB, podem ser usadas a fim delocalizar uma imagem de som em um ângulo de 20 Portanto, mesmo se somente umadiferença de amplitude for fornecida como informação de parâmetro de conversão de ca-nais, é possível obter vários sons com diferentes propriedades pela conversão da diferençade amplitude em uma diferença de tempo, que é equivalente à diferença de amplitude, du-rante a localização das imagens de som.
A figura 5 ilustra funções que consideram a correspondência entre as diferenças deamplitude e as diferenças de tempo que são exigidas para localizar imagens de som emângulos de 10 20 ° e 30 A função ilustrada na figura 5 pode ser obtida com base nasfiguras 4(a) e 4(b). Em relação à figura 5, várias combinações de diferença de amplitude -diferença de tempo podem ser fornecidas para localização de uma imagem de som em umaposição pré-determinada. Por exemplo, considere que uma diferença de amplitude de 8 dBé fornecida como informação de parâmetro de conversão de canais a fim de localizar umaimagem de som em um ângulo de 20 De acordo com a função ilustrada na figura 5, umaimagem de som também pode ser localizada no ângulo de 20 0 usando a combinação deuma diferença de amplitude de 3 dB e de uma diferença de tempo de 0,3 ms. Neste caso,não somente a informação de diferença de amplitude, mas também a informação de dife-rença de tempo pode ser fornecida como informação de parâmetro de conversão de canais,desse modo, melhorando a sensação de espaço.
Portanto, a fim de gerar sons com propriedades desejadas por um usuário duranteuma operação de conversão de canais / renderização, informação de parâmetro de conver-são de canais pode ser apropriadamente convertida para que qualquer que seja a variaçãode amplitude e variação de tempo que é adequada ao usuário possa ser realizada. Isto é, sea informação de parâmetro de conversão de canais incluir somente informação de diferençade amplitude e o usuário desejar sons com uma profunda sensação de espaço, a informa-ção de diferença de amplitude pode ser convertida em informação de diferença de tempoequivalente à informação de diferença de amplitude em relação aos dados psicoacústicos.Alternativamente, se o usuário desejar ambos os sons com uma profunda sensação de es-paço e uma precisa localização de imagens de som, a informação de diferença de amplitudepode ser convertida na combinação de informação de diferença de amplitude e de informa-ção de diferença de tempo equivalente à informação de amplitude original. Alternativamente,se a informação de parâmetro de conversão de canais incluir somente informação de dife-rença de tempo e um usuário preferir uma precisa localização de imagens de som, a infor-mação de diferença de tempo pode ser convertida em informação de diferença de amplitudeequivalente à informação de diferença de tempo, ou pode ser convertida na combinação deinformação de diferença de amplitude e de informação de diferença de tempo que pode sa-tisfazer a preferência do usuário pela melhoria tanto da precisão da localização de imagensde som quanto da sensação de espaço.Ainda alternativamente, se a informação de parâmetro de conversão de canais in-cluir tanto informação de diferença de amplitude quanto informação de diferença de tempo,e um usuário preferir uma precisa localização das imagens de som, a combinação da infor-mação de diferença de amplitude e da informação de diferença de tempo pode ser converti- da em informação de diferença de amplitude equivalente à combinação da informação dediferença de amplitude original e da informação de diferença de tempo. Por outro lado, se ainformação de parâmetro de conversão de canais incluir tanto informação de diferença deamplitude quanto informação de diferença de tempo e um usuário preferir a meinoria dasensação de espaço, a combinação da informação de diferença de amplitude e da informa- ção de diferença de tempo pode ser convertida em informação de diferença de tempo equi-valente à combinação da informação de diferença de amplitude e à informação de diferençade tempo original. Em relação à figura 6, a informação de controle pode incluir informaçãode conversão de canais / renderização e informação harmônica considerando um ou maissinais de objetos. A informação harmônica pode incluir pelo menos uma informação de altu- ra, informação de freqüência fundamental e informação de banda de freqüência dominanteconsiderando um ou mais sinais de objetos, e descrições da energia e do espectro de cadasub-banda de cada um dos sinais de objetos.
A informação harmônica pode ser usada para processar um sinal de objeto duranteuma operação de renderização em virtude de a resolução de um renderizador que realiza sua operação em unidades de sub-bandas ser insuficiente.
Se a informação harmônica incluir informação de altura considerando um ou maissinais de objetos, o ganho de cada um dos sinais de objetos pode ser ajustado pela atenua-ção ou intensificação de um domínio de freqüência pré-determinado usando um filtro comboou um filtro combo invertido. Por exemplo, se um de uma pluralidade de sinais de objetos for um sinal vocal, os sinais de objetos podem ser usados como um karaokê pela atenuaçãosomente do sinal vocal. Alternativamente, se a informação harmônica incluir informação dedomínio de freqüência dominante considerando um ou mais sinais de objetos, um processopara atenuar ou intensificar um domínio de freqüência dominante pode ser realizado. Aindaalternativamente, se a informação harmônica incluir informação de espectro considerando um ou mais sinais de objetos, o ganho de cada um dos sinais de objetos pode ser controla-do pela realização de atenuação ou de reforço sem ser restrito por nenhum dos limites desub-banda.
A figura 7 é um diagrama de blocos de um aparelho de decodificação de áudio 140de acordo com uma outra modalidade da presente invenção. Em relação à figura 7, o apare- lho de decodificação de áudio 140 usa um decodificador multicanais 141, em vez de um de-codificador de objeto e um renderizador, e decodifica inúmeros sinais de objetos depois queos sinais de objetos forem apropriadamente arranjados em um espaço multicanais.Mais especificamente, o aparelho de decodificação de áudio 140 inclui o decodifi-cador multicanais 141 e um conversor de parâmetro 145. O decodificador multicanais 141gera um sinal multicanais cujos sinais de objetos já foram arranjados em um espaço multi-canais com base em um sinal convertido para menos canais e em informação de parâmetroespacial, que é informação complementar com base em canal fornecida pelo conversor deparâmetro 145. O conversor de parâmetro 145 analisa informação complementar e informa-ção de controle transmitidas por um aparelho de codificação de áudio (não mostrado) e geraa informação de parâmetro espacial com base no resultado da análise. Mais especificamen-te, o conversor de parâmetro 145 gera a informação de parâmetro espacial pela combinaçãoda informação complementar e da informação de controle que inclui informação de ajuste dereprodução e informação de conversão de canais. Isto é, o conversor de parâmetro 145 rea-liza a conversão da combinação da informação complementar e da informação de controleem dados espaciais correspondentes a uma caixa Um-Para-Um (OTT) ou a uma caixa Dois-Para-Três (TTT).
O aparelho de decodificação de áudio 140 pode realizar uma operação de decodifi-cação multicanais na qual uma operação de decodificação com base em objeto e uma ope-ração de conversão de canais / renderização são incorporadas e, assim, pode pular a deco-dificação de cada sinal de objeto. Portanto, é possível reduzir a complexidade da decodifica-ção e/ou da conversão de canais / renderização.
Por exemplo, quando há 10 sinais de objetos e um sinal multicanais obtido com ba-se nos 10 sinais de objetos dever ser reproduzido por um sistema de reprodução de alto-falante de 5.1 canais, um aparelho típico de decodificação de áudio com base em objetogera sinais decodificados respectivamente correspondentes aos 10 sinais de objetos combase em um sinal convertido para menos canais e em informação complementar e, então,gera um sinal de 5.1 canais arranjando apropriadamente os 10 sinais de objetos em um es-paço multicanais para que os sinais de objetos possam ficar adequados para um ambientede alto-falante de 5.1 canais. Entretanto, ele é ineficiente para gerar 10 sinais de objetosdurante a geração de um sinal de 5.1 canais, e este problema fica mais severo à medidaque a diferença entre o número de sinais de objetos e o número de canais de um sinal mul-ticanais a ser gerado aumenta.
Por outro lado, de acordo com a modalidade da figura 7, o aparelho de decodifica-ção de áudio 140 gera informação de parâmetro espacial adequada para um sinal de 5.1canais com base na informação complementar e na informação de controle, e fornece a in-formação de parâmetro espacial e um sinal convertido para menos canais ao decodificadormulticanais 141. Então, o decodificador multicanais 141 gera um sinal de 5.1 canais combase na informação de parâmetro espacial e no sinal convertido para menos canais. Emoutras palavras, quando o número de canais a ser transmitido é 5.1 canais, o aparelho dedecodificação de áudio 140 pode gerar prontamente um sinal de 5.1 canais com base emum sinal convertido para menos canais sem a necessidade de gerar 10 sinais de objetos e,assim, é mais eficiente do que um aparelho de decodificação de áudio convencional emtermos de complexidade.
O aparelho de decodificação de áudio 140 é considerado eficiente quando a quanti-dade de computação exigida para calcular informação de parâmetro espacial corresponden-te a cada uma de uma caixa OTT e de uma caixa TTT por meio da análise da informaçãocomplementar e da informação de controle transmitidas por um aparelho de codificação deáudio for menor do que a quantidade de computação exigida para realizar uma operação deconversão de canais / renderização depois da decodificação de cada sinal de objeto.
O aparelho de decodificação de áudio 140 pode ser obtido simplesmente pela adi-ção de um módulo para gerar informação de parâmetro espacial por meio da análise da in-formação complementar e da informação de controle em um aparelho típico de decodifica-ção de áudio multicanais e, assim, pode manter a compatibilidade com um aparelho típicode decodificação de áudio multicanais. Também, o aparelho de decodificação de áudio 140pode melhorar a qualidade de som usando ferramentas existentes de um aparelho típico dedecodificação de áudio multicanais, tais como um formador de envelope, uma ferramenta deprocessamento temporal de sub-banda (STP) e um decorrelator. Dado tudo isto, conclui-seque todas as vantagens de um método típico de decodificação de áudio multicanais podemser prontamente aplicadas a um método de decodificação de áudio objeto.
Informação de parâmetro espacial transmitida ao decodificador multicanais 141 peloconversor de parâmetro 145 pode ter sido comprimida para ser adequada para ser transmi-tida. Alternativamente, a informação de parâmetro espacial pode ter o mesmo formato da-quela dos dados transmitidos por um aparelho típico de codificação multicanais. Isto é, ainformação de parâmetro espacial pode ter sido sujeita a uma operação de decodificaçãoHuffman ou a uma operação de decodificação piloto e, assim, pode ser transmitida a cadamódulo como dados espaciais marcados não comprimidos. O anterior é adequado paratransmitir a informação de parâmetro espacial a um aparelho de decodificação de áudio mul-ticanais em um local remoto, e este último é conveniente em virtude de não haver necessi-dade de um aparelho de decodificação de áudio multicanais para converter dados espaciaismarcados comprimidos em dados espaciais marcados não comprimidos que podem serprontamente usados em uma operação de decodificação.
A configuração da informação de parâmetro espacial com base na análise da infor-mação complementar e na informação de controle pode ocasionar um atraso entre um sinalconvertido para menos canais e a informação de parâmetro espacial. A fim de abordar esteproblema, um armazenamento temporário adicional pode ser fornecido tanto para um sinalconvertido para menos canais quanto para a informação de parâmetro espacial para que osinal convertido para menos canais e a informação de parâmetro espacial possam ser sin-cronizados entre si. Entretanto, estes métodos são inconvenientes em virtude da exigênciade fornecer um armazenamento temporário adicional. Alternativamente, a informação com-plementar pode ser transmitida à frente de um sinal convertido para menos canais em con-sideração da possibilidade de ocorrência de um atraso entre um sinal convertido para me-nos canais e a informação de parâmetro espacial. Neste caso, a informação de parâmetroespacial obtida pela combinação da informação complementar e da informação de controlenão precisa ser ajustada, mas pode ser prontamente usada.
Se uma pluralidade de sinais de objetos de um sinal convertido para menos canaistiver diferentes níveis, um módulo de ganhos de conversão para menos canais artística(ADG), que pode compensar diretamente o sinal convertido para menos canais, pode de-terminar os níveis relativos dos sinais de objetos, e cada um dos sinais de objetos pode seralocado em uma posição pré-determinada em um espaço multicanais usando dados espaci-ais marcados, tais como informação de diferença de nível de canal, informação de correla-ção intercanais (ICC), e informação de coeficiente de prognóstico de canal (CPC).
Por exemplo, se informação de controle indicar que um sinal de objeto pre-determinado deve ser alocado em uma posição pré-determinada em um espaço multicanaise tiver um nível superior ao dos outros sinais de objetos, um decodificador multicanais típicopode calcular a diferença entre as energias dos canais de um sinal convertido para menoscanais e dividir o sinal convertido para menos canais em inúmeros canais de saída com ba-se nos resultados do cálculo. Entretanto, um decodificador multicanais típico não pode au-mentar ou reduzir o volume de certo som em um sinal convertido para menos canais. Emoutras palavras, um decodificador multicanais típico simplesmente distribui um sinal conver-tido para menos canais a inúmeros canais de saída e, assim, não pode aumentar ou reduziro volume de um som no sinal convertido para menos canais.
É relativamente fácil alocar cada um dos inúmeros sinais de objetos de um sinalconvertido para menos canais gerado por um codificador de objeto em uma posição pré-determinada em um espaço multicanais de acordo com a informação de controle. Entretan-to, técnicas espaciais são exigidas para aumentar ou reduzir a amplitude de um sinal deobjeto pré-determinado. Em outras palavras, se um sinal convertido para menos canais ge-rado por um codificador de objeto for usado como ele é, é difícil reduzir a amplitude de cadasinal de objeto do sinal convertido para menos canais.
Portanto, de acordo com uma modalidade da presente invenção, as amplitudes re-lativas dos sinais de objetos podem variar de acordo com a informação de controle usandoum módulo ADG 147 ilustrado na figura 8. Mais especificamente, a amplitude de qualquerum de uma pluralidade de sinais de objetos de um sinal convertido para menos canaistransmitido por um codificador de objeto pode ser aumentada ou reduzida usando o móduloADG 147. Um sinal convertido para menos canais obtido pela compensação realizada pelomódulo ADG 147 pode ser sujeita à decodificação multicanais.
Se as amplitudes relativas dos sinais de objetos de um sinal convertido para menoscanais forem apropriadamente ajustadas usando o módulo ADG 147, é possível realizardecodificação de objeto usando um decodificador multicanais típico. Se um sinal convertidopara menos canais gerado por um codificador de objeto for um sinal mono ou estéreo ou umsinal multicanais com três ou mais canais, o sinal convertido para menos canais pode serprocessado pelo módulo ADG 147. Se um sinal convertido para menos canais gerado porum codificador de objeto tiver dois ou mais canais, e um sinal de objeto pré-determinado queprecisa ser ajustado pelo módulo ADG 147 existir somente em um dos canais do sinal con-vertido para menos canais, o módulo ADG 147 pode ser aplicado somente no canal queinclui o sinal de objeto pré-determinado em vez de ser aplicado em todos os canais do sinalconvertido para menos canais. Um sinal convertido para menos canais processado pelomódulo ADG 147 da maneira supradescrita pode ser prontamente processado usando umdecodificador multicanais típico sem a necessidade de modificar a estrutura do decodificadormulticanais.
Mesmo quando um sinal de saída final não for um sinal multicanais que pode serreproduzido por um alto-falante multicanais, mas for um sinal binaural, o módulo ADG 147pode ser usado para ajustar as amplitudes relativas dos sinais de objetos do sinal de saída20 final.
Alternativamente ao uso do módulo ADG 147, informação de ganho que especificaum valor de ganho a ser aplicado em cada sinal de objeto pode ser incluído na informaçãode controle durante a geração de inúmeros sinais de objetos. Para isto, a estrutura de umdecodificador multicanais típico pode ser modificada. Mesmo embora exija a modificação25 para a estrutura de um decodificador multicanais existente, este método é conveniente emtermos de redução da complexidade da decodificação pela aplicação de um valor de ganhopara cada sinal de objeto durante a operação de decodificação sem a necessidade de calcu-lar ADG e para compensar cada sinal de objeto.
A figura 9 é um diagrama de blocos de um aparelho de decodificação de áudio 15030 de acordo com uma quarta modalidade da presente invenção. Em relação à figura 9, o apa-relho de decodificação de áudio 150 é caracterizado pela geração de um sinal binaural.
Mais especificamente, o aparelho de decodificação de áudio 150 inclui um decodifi-cador binaural multicanais 151, um primeiro conversor de parâmetro 157 e um segundoconversor de parâmetro 159.35 O segundo conversor de parâmetro 159 analisa a informação complementar e a in-
formação de controle que são fornecidas por um aparelho de codificação de áudio e configu-ra informação de parâmetro espacial com base no resultado da análise. O primeiro conver-sor de parâmetro 157 configura informação de parâmetro binaural que pode ser usada pelodecodificador binaural multicanais 151 pela adição de informação tridimensional (3D), taiscomo parâmetros de função de transferência relacionada a cabeçalho (HRTF), na informa-ção de parâmetro espacial. O decodificador binaural multicanais 151 gera um sinal tridimen-sional (3D) virtual pela aplicação da informação de parâmetro 3D virtual em um sinal conver-tido para menos canais.
O primeiro conversor de parâmetro 157 e o segundo conversor de parâmetro 159podem ser substituídos por um único módulo, isto é, um módulo de conversão de parâmetro155 que recebe a informação complementar, a informação de controle e os parâmetrosHRTF, e configura a informação de parâmetro binaural com base na informação comple-mentar, na informação de controle e nos parâmetros HRTF.
Convencionalmente, a fim de gerar um sinal binaural para a reprodução de um sinalconvertido para menos canais que inclui 10 sinais de objetos com um fone de ouvido, umsinal de objeto deve gerar 10 sinais decodificados respectivamente correspondentes aos 10sinais de objetos com base no sinal convertido para menos canais e na informação comple-mentar. Posteriormente, um renderizador aloca cada um dos 10 sinais de objetos em umaposição pré-determinada em um espaço multicanais em relação à informação de controlepara se adequar a um ambiente de alto-falante de 5 canais. Posteriormente, o renderizadorgera um sinal de 5 canais que pode ser reproduzido usando um alto-falante de 5 canais.Posteriormente, o renderizador aplica parâmetros HRTF em um sinal de 5 canais, dessemodo, gerando um sinal de 2 canais. Em resumo, o método convencional de decodificaçãode áudio supramencionado inclui reproduzir 10 sinais de objetos, converter os 10 sinais deobjetos em um sinal de 5 canais, e gerar um sinal de 2 canais com base no sinal de 5 canaise, assim, é ineficiente.
Por outro lado, o aparelho de decodificação de áudio 150 pode gerar prontamenteum sinal binaural que pode ser reproduzido usando um fone de ouvido com base em sinaisde áudio de objeto. Além do mais, o aparelho de decodificação de áudio 150 configura in-formação de parâmetro espacial por meio da análise de informação complementar e de in-formação de controle e, assim, pode gerar um sinal binaural usando um decodificador binau-ral multicanais típico. Além do mais, o aparelho de decodificação de áudio 150 ainda podeusar um decodificador binaural multicanais típico mesmo quando é equipado com um con-versor de parâmetro incorporado que recebe informação complementar, informação de con-trole e parâmetros HRTF, e configura informação de parâmetro binaural com base na infor-mação complementar, na informação de controle e nos parâmetros HRTF.
A figura 10 é um diagrama de blocos de um aparelho de decodificação de áudio160 de acordo com uma quinta modalidade da presente invenção. Em relação à figura 10, oaparelho de decodificação de áudio 160 inclui um processador de conversão para menoscanais 161, um decodificador multicanais 163 e um conversor de parâmetro 165. O proces-sador de conversão para menos canais 161 e o conversor de parâmetro 163 podem sersubstituídos por um único módulo 167.
O conversor de parâmetro 165 gera informação de parâmetro espacial, que pode ser usada pelo decodificador multicanais 163, e informação de parâmetro, que pode ser u-sada pelo processador de conversão para menos canais 161. O processador de conversãopara menos canais 161 realiza uma operação de pré-processamento em um sinal convertidopara menos canais e transmite um sinal convertido para menos canais resultante da opera-ção de pré-processamento ao decodificador multicanais 163. O decodificador multicanais 163 realiza uma operação de decodificação no sinal convertido para menos canais transmi-tido pelo processador de conversão para menos canais 161, desse modo, transmitindo umsinal estéreo, um sinal estéreo binaural ou um sinal multicanais. Exemplos da operação depré-processamento realizada pelo processador de conversão para menos canais 161 inclu-em a modificação ou conversão de um sinal convertido para menos canais em um domínio temporal ou em um domínio de freqüência usando filtragem.
Se um sinal convertido para menos canais inserido no aparelho de decodificação deáudio 160 for um sinal estéreo, o sinal convertido para menos canais pode ter que ser sujei-to ao pré-processamento de conversão para menos canais realizado pelo processador deconversão para menos canais 161 antes de ser inserido no decodificador multicanais 163 em virtude de o decodificador multicanais 163 não poder mapear um componente do sinalconvertido para menos canais correspondente a um canal esquerdo, que é um dos múltiploscanais, até um canal direito, que é um outro dos múltiplos canais. Posteriormente, a fim dedeslocar a posição de um sinal de objeto classificado no canal esquerdo na direção do canaldireito, o sinal convertido para menos canais inserido no aparelho de decodificação de áudio 160 pode ser pré-processado pelo processador de conversão para menos canais 161, e osinal convertido para menos canais pré-processado pode ser inserido no decodificador mul-ticanais 163.
O pré-processamento de um sinal convertido para menos canais estéreo pode serrealizado com base na informação de pré-processamento obtida da informação complemen- tar e da informação de controle.
A figura 11 é um diagrama de blocos de um aparelho de decodificação de áudio170 de acordo com uma sexta modalidade da presente invenção. Em relação à figura 11, oaparelho de decodificação de áudio 170 inclui um decodificador multicanais 171, um proces-sador de canal 173 e um conversor de parâmetro 175.
O conversor de parâmetro 175 gera informação de parâmetro espacial, que podeser usada pelo decodificador multicanais 173, e informação de parâmetro, que pode ser u-sada pelo processador de canal 173. O processador de canal 173 realiza uma operação depós-processamento em um sinal transmitido pelo decodificador multicanais 173. Exemplosdo sinal transmitido pelo decodificador multicanais 173 incluem um sinal estéreo, um sinalestéreo binaural e um sinal multicanais.
Exemplos da operação de pós-processamento realizada pelo pós-processador 173incluem a modificação e conversão de cada canal ou de todos os canais de um sinal de saí-da. Por exemplo, se a informação complementar incluir informação de freqüência fundamen-tal considerando um sinal de objeto pré-determinado, o processador de canal 173 pode re-mover componentes harmônicos do sinal de objeto pré-determinado em relação à informa-ção de freqüência fundamental. Um método de decodificação de áudio multicanais pode nãoser eficiente o suficiente para ser usado em um sistema de karaokê. Entretanto, se informa-ção de freqüência fundamental considerando sinais de objetos vocais for incluída na infor-mação complementar e componentes harmônicos dos sinais de objetos vocais forem remo-vidos durante uma operação de pós-processamento, é possível realizar um sistema de ka-raokê de alto desempenho usando a modalidade da figura 11. A modalidade da figura 11também pode ser aplicada a sinais de objetos diferentes dos sinais de objetos vocais. Porexemplo, é possível remover o som de um instrumento musical pré-determinado usando amodalidade da figura 11. Também, é possível amplificar componentes harmônicos pre-determinados usando informação de freqüência fundamental considerando sinais de objetosusando a modalidade da figura 11.
O processador de canal 173 pode realizar processamento de efeito adicional emum sinal convertido para menos canais. Alternativamente, o processador de canal 173 podeadicionar um sinal obtido pelo processamento de efeito adicional em um sinal transmitidopelo decodificador multicanais 171. O processador de canal 173 pode mudar o espectro deum objeto ou modificar um sinal convertido para menos canais sempre que necessário. Senão for apropriado realizar diretamente uma operação de processamento de efeito, tal comoreverberação em um sinal convertido para menos canais, e transmitir um sinal obtido pelaoperação de processamento de efeito ao decodificador multicanais 171, o processador deconversão para menos canais 173 pode adicionar o sinal obtido pela operação de proces-samento de efeito na saída do decodificador multicanais 171, em vez de realizar processa-mento de efeito no sinal convertido para menos canais.
O aparelho de decodificação de áudio 170 pode ser projetado para incluir não so-mente o processador de canal 173, mas também um processador de conversão para menoscanais. Neste caso, o processador de conversão para menos canais pode ficar disposto nafrente do decodificador multicanais 173, e o processador de canal 173 pode ficar dispostoatrás do decodificador multicanais 173.
A figura 12 é um diagrama de blocos de um aparelho de decodificação de áudio210 de acordo com uma sétima modalidade da presente invenção. Em relação à figura 12, oaparelho de decodificação de áudio 210 usa um decodificador multicanais 213, em vez deum decodificador de objeto.
Mais especificamente, o aparelho de decodificação de áudio 210 inclui o decodifi-cador multicanais 213, um transcodificador 215, um renderizador 217 e uma base de dadosde informação 3D 217.
O renderizador 217 determina as posições 3D de uma pluralidade de sinais de obje-tos com base na informação 3D correspondente aos dados de índice incluídos na informa-ção de controle. O transcodificador 215 gera informação complementar com base em canalsintetizando informação de posição considerando inúmeros sinais de áudio de objeto nosquais a informação 3D é aplicada pelo renderizador 217. O decodificador multicanais 213transmite um sinal 3D pela aplicação de informação complementar com base em canal emum sinal convertido para menos canais.
Uma função de transferência relacionada a cabeçalho (HRTF) pode ser usada co-mo a informação 3D. Uma HRTF é uma função de transferência que descreve a transmissãode ondas sonoras entre uma fonte de som em uma posição arbitrária e o tímpano, e retornaum valor que varia de acordo com a direção e a altitude da fonte de som. Se um sinal semdiretividade for filtrado usando a HRTF, o sinal pode ser ouvido como se ele fosse reprodu-zido a partir de uma certa direção.
Quando um fluxo contínuo de bits de entrada for recebido, o aparelho de decodifi-cação de áudio 210 extrai um sinal convertido para menos canais com base em objeto einformação de parâmetro com base em objeto a partir do fluxo contínuo de bits de entradausando um demultiplexador (não mostrado). Então, o renderizador 217 extrai dados de índi-ce da informação de controle, que são usados para determinar as posições de uma plurali-dade de sinais de áudio de objeto, e retira informação 3D correspondente aos dados de ín-dice extraídos da base de dados de informação 3D 219.
Mais especificamente, informação de parâmetro de conversão de canais, que é in-cluída na informação de controle que é usada pelo aparelho de decodificação de áudio 210,pode incluir não somente informação de nível, mas também dados de índice necessáriospara buscar informação 3D. A informação de parâmetro de conversão de canais tambémpode incluir informação de tempo considerando a diferença de tempo entre canais, informa-ção de posição e um ou mais parâmetros obtidos pela apropriada combinação da informa-ção de nível e da informação de tempo.
A posição de um sinal de áudio de objeto pode ser determinada inicialmente de a-cordo com informação de parâmetro de conversão de canais padrão, e pode ser mudadaposteriormente pela aplicação de informação 3D correspondente a uma posição desejadapor um usuário no sinal de áudio de objeto. Alternativamente, se o usuário desejar aplicarum efeito 3D somente em alguns sinais de áudio de objeto, informação de nível e informa-ção de tempo considerando outros sinais de áudio de objeto nos quais o usuário deseja nãoaplicar um efeito 3D podem ser usadas como informação de parâmetro de conversão decanais.
O transcodificador 217 gera informação complementar com base em canal conside-rando M canais sintetizando informação de parâmetro com base em objeto considerando Nsinais de objetos transmitidos por um aparelho de codificação de áudio e informação de po-sição de inúmeros sinais de objetos nos quais informação 3D, tal como uma HRTF1 é apli-cada pelo renderizador 217.
O decodificador multicanais 213 gera um sinal de áudio com base em um sinal con-vertido para menos canais e na informação complementar com base em canal fornecidapelo transcodificador 217, e gera um sinal multicanais 3D pela realização de uma operaçãode renderização 3D usando informação 3D incluída na informação complementar com baseem canal.
A figura 13 é um diagrama de blocos de um aparelho de decodificação de áudio220 de acordo com uma oitava modalidade da presente invenção. Em relação à figura 13, oaparelho de decodificação de áudio 220 é diferente do aparelho de decodificação de áudio210 ilustrado na figura 12 em que o transcodificador 225 transmite informação complemen-tar com base em canal e informação 3D separadamente a um decodificador multicanais 223.Em outras palavras, o transcodificador 225 do aparelho de decodificação de áudio 220 ob-tém informação complementar com base em canal considerando M canais da informação deparâmetro com base em objeto considerando N sinais de objetos, e transmite a informaçãocomplementar com base em canal e informação 3D, que é aplicada em cada um dos N si-nais de objetos, ao decodificador multicanais 223, enquanto que o transcodificador 217 doaparelho de decodificação de áudio 210 transmite informação complementar com base emcanal, incluindo informação 3D, ao decodificador multicanais 213.
Em relação à figura 14, informação complementar com base em canal e informação3D podem incluir uma pluralidade de índices de quadro. Assim, o decodificador multicanais223 pode sincronizar a informação complementar com base em canal e a informação 3D emrelação aos índices de quadro de cada uma da informação complementar com base em ca-nal e da informação 3D e, assim, pode aplicar informação 3D em um quadro de um fluxocontínuo de bits correspondente à informação 3D. Por exemplo, informação 3D com índice 2pode ser aplicada no início do quadro 2 com o índice 2.
Já que tanto informação complementar com base em canal quanto informação 3Dincluem índices de quadro, é possível determinar efetivamente uma posição temporal dainformação complementar com base em canal na qual a informação 3D deve ser aplicada,mesmo se a informação 3D for atualizada durante o tempo. Em outras palavras, o transcodi-ficador 225 inclui informação 3D e inúmeros índices de quadro na informação complementarcom base em canal e, assim, o decodificador multicanais 223 pode sincronizar facilmente ainformação complementar com base em canal e a informação 3D.
O processador de conversão para menos canais 231, o transcodificador 235, o ren-derizador 237 e a base de dados de informação 3D podem ser substituídos por um únicomódulo 239.
A figura 15 é um diagrama de blocos de um aparelho de decodificação de áudio230 de acordo com uma nona modalidade da presente invenção. Em relação à figura 15, oaparelho de decodificação de áudio 230 é diferenciado do aparelho de decodificação de áu-dio 220 ilustrado na figura 14 pela inclusão adicional de um processador de conversão paramenos canais 231.
Mais especificamente, o aparelho de decodificação de áudio 230 inclui um transco-dificador 235, um renderizador 237, uma base de dados de informação 3D 239, um decodifi-cador multicanais 233 e o processador de conversão para menos canais 231. O transcodifi-cador 235, o renderizador 237, a base de dados de informação 3D 239 e o decodificadormulticanais 233 são os mesmos das suas respectivas contrapartes ilustradas na figura 14. Oprocessador de conversão para menos canais 231 realiza uma operação de pré-processamento em um sinal convertido para menos canais estéreo para ajuste de posição.A base de dados de informação 3D 239 pode ser incorporada no renderizador 237. Um mó-dulo para aplicar um efeito pré-determinado em um sinal convertido para menos canais tam-bém pode ser fornecido no aparelho de decodificação de áudio 230.
A figura 16 ilustra um diagrama de blocos de um aparelho de decodificação de áu-dio 240 de acordo com uma décima modalidade da presente invenção. Em relação à figura16, o aparelho de decodificação de áudio 240 é diferenciado do aparelho de decodificaçãode áudio 230 ilustrado na figura 15 pela inclusão de um combinador de unidade de controlemultipontos 241.
Isto é, o aparelho de decodificação de áudio 240, como o aparelho de decodificaçãode áudio 230, inclui um processador de conversão para menos canais 243, um decodificadormulticanais 244, um transcodificador 245, um renderizador 247 e uma base de dados deinformação 3D 249. O combinador de unidade de controle multipontos 241 combina umapluralidade de fluxos contínuos de bits obtida pela codificação com base em objeto, dessemodo, obtendo um único fluxo contínuo de bits. Por exemplo, quando um primeiro fluxo con-tínuo de bits para um primeiro sinal de áudio e um segundo fluxo contínuo de bits para umsegundo sinal de áudio forem inseridos, o combinador de unidade de controle multipontos241 extrai um primeiro sinal convertido para menos canais do primeiro fluxo contínuo de bits,extrai um segundo sinal convertido para menos canais do segundo fluxo contínuo de bits egera um terceiro sinal convertido para menos canais pela combinação dos primeiro e se-gundo sinais convertidos para menos canais. Além do mais, o combinador de unidade decontrole multipontos 241 extrai a primeira informação complementar com base em objeto doprimeiro fluxo contínuo de bits, extrai a segunda informação complementar com base emobjeto do segundo fluxo contínuo de bits, e gera a terceira informação complementar combase em objeto pela combinação da primeira informação complementar com base em objetoe da segunda informação complementar com base em objeto. Posteriormente, o combinadorde unidade de controle multipontos 241 gera um fluxo contínuo de bits pela combinação doterceiro sinal convertido para menos canais e da terceira informação complementar combase em objeto, e transmite o fluxo contínuo de bits gerado.
Portanto, de acordo com a décima modalidade da presente invenção, é possívelprocessar eficientemente sinais uniformes transmitidos por dois ou mais parceiros de comu-nicação, se comparado com o caso da codificação e decodificação de cada sinal de objeto.
A fim de que o combinador de unidade de controle multipontos 241 incorpore umapluralidade de sinais convertidos para menos canais, que são respectivamente extraídos deuma pluralidade de fluxos contínuos de bits e são associados com diferentes codecs decompressão, em um único sinal convertido para menos canais, os sinais convertidos paramenos canais podem precisar ser convertidos em sinais de modulação por código de pulso(PCM) ou sinais em um domínio de freqüência pré-determinado de acordo com os tipos decodecs de compressão dos sinais convertidos para menos canais, os sinais PCM ou os si-nais obtidos pela conversão podem precisar ser juntamente combinados, e um sinal obtidopela combinação pode precisar ser convertido usando um codec de compressão pré-determinado. Neste caso, pode ocorrer um atraso de acordo com se os sinais convertidospara menos canais estão incorporados em um sinal PCM ou em um sinal no domínio defreqüência pré-determinado. Entretanto, o atraso pode não ser capaz de ser apropriadamen-te estimado por um decodificador. Portanto, o atraso pode precisar ser incluído em um fluxocontínuo de bits e transmitido juntamente com o fluxo contínuo de bits. O atraso pode indicaro número de amostras de atraso em um sinal PCM ou o número de amostras de atraso nodomínio de freqüência pré-determinado.
Durante a operação de codificação de áudio com base em objeto, algumas vezes,um número considerável de sinais de entrada pode precisar ser processado, se comparadocom o número de sinais de entrada, no geral, processados durante uma operação típica decodificação multicanais (por exemplo, uma operação de codificação de 5.1 canais ou de 7.1canais). Portanto, um método de codificação de áudio com base em objeto exige taxas debit muito maiores do que as de um método típico de codificação de áudio multicanais combase em canal. Entretanto, já que um método de codificação de áudio com base em objetoenvolve o processamento de sinais de objetos que são menores do que os sinais de canal, épossível gerar sinais de saída dinâmicos usando um método de codificação de áudio combase em objeto.Um método de codificação de áudio de acordo com uma modalidade da presenteinvenção será descrito com detalhes a seguir em relação às figuras 17 até 20.
Em um método de codificação de áudio com base em objeto, sinais de objetos po-dem ser definidos para representar sons individuais, tais como a voz de um ser humano ouo som de um instrumento musical. Alternativamente, sons com características similares, taiscomo os sons de instrumentos musicais de cordas (por exemplo, um violino, uma viola e umvioloncelo), sons que pertencem à mesma faixa de freqüência ou sons classificados namesma categoria de acordo com as direções e ângulos das suas fontes de som, podem serjuntamente agrupados e definidos pelos mesmos sinais de objetos. Ainda alternativamente,sinais de objetos podem ser definidos usando a combinação dos métodos supradescritos.
Inúmeros sinais de objetos podem ser transmitidos como um sinal convertido paramenos canais e informação complementar. Durante a criação da informação a ser transmiti-da, a energia ou potência de um sinal convertido para menos canais ou de cada um de umapluralidade de sinais de objetos do sinal convertido para menos canais são originalmentecalculadas com o propósito de detectar o envelope do sinal convertido para menos canais.Os resultados do cálculo podem ser usados para transmitir os sinais de objetos ou o sinalconvertido para menos canais ou para calcular a taxa dos níveis dos sinais de objetos.
Um algoritmo de codificação preditiva linear (LPC) pode ser usado em taxas de bitmais baixas. Mais especificamente, inúmeros coeficientes LPC, que representam o envelopede um sinal, são gerados por meio da análise do sinal, e os coeficientes LPC são transmiti-dos, em vez de transmitir informação de envelope relacionada ao sinal. Este método é efici-ente em termos de taxas de bit. Entretanto, já que é muito provável que os coeficientes LPCsejam discrepantes do envelope atual do sinal, este método exige um processo adicional, talcomo correção de erro. Em resumo, um método que envolve transmitir informação de enve-lope de um sinal pode garantir uma alta qualidade de som, mas resulta em um considerávelaumento na quantidade de informação que precisa ser transmitida. Por outro lado, um mé-todo que envolve o uso dos coeficientes LPC pode reduzir a quantidade de informação queprecisa ser transmitida, mas exige um processo adicional, tal como correção de erro, e re-sulta em uma diminuição na qualidade do som.
De acordo com uma modalidade da presente invenção, uma combinação destesmétodos pode ser usada. Em outras palavras, o envelope de um sinal pode ser representa-do pela energia ou pela potência do sinal ou por um valor de índice ou por um outro valor, talcomo um coeficiente LPC correspondente à energia ou à potência do sinal.
Informação de envelope relacionada a um sinal pode ser obtida em unidades deseções temporais ou de seções de freqüência. Mais especificamente, em relação à figura17, informação de envelope relacionada a um sinal pode ser obtida em unidades de quadro.Alternativamente, se um sinal for representado por uma estrutura de faixa de freqüência u-sando um banco de filtro, tal como um banco de filtro em espelho de quadratura (QMF), in-formação de envelope relacionada a um sinal pode ser obtida em unidades de sub-bandasde freqüência, de partições de sub-banda de freqüência, que são entidades menores do quesub-bandas de freqüência, de grupos de sub-bandas de freqüência ou de grupos de parti-ções de sub-banda de freqüência. Ainda alternativamente, uma combinação do método combase em quadro, do método com base em sub-banda de freqüência, e do método com baseem partição de sub-banda de freqüência pode ser usada no escopo da presente invenção.
Ainda alternativamente, dado que, no geral, os componentes de baixa freqüênciade um sinal têm mais informação do que os componentes de alta freqüência do sinal, infor-mação de envelope relacionada aos componentes de baixa freqüência de um sinal pode sertransmitida como ela está, enquanto que informação de envelope relacionada aos compo-nentes de alta freqüência do sinal pode ser representada pelos coeficientes LPC ou por ou-tros valores, e os coeficientes LPC ou outros valores podem ser transmitidos em vez da in-formação de envelope relacionada aos componentes de alta freqüência do sinal. Entretanto,componentes de baixa freqüência de um sinal podem, não necessariamente, ter mais infor-mação do que componentes de alta freqüência do sinal. Portanto, o método supradescritodeve ser flexivelmente aplicado de acordo com as circunstâncias.
De acordo com uma modalidade da presente invenção, informação de envelope oudados de índice correspondentes a uma parte (doravante referida como a parte dominante)de um sinal que aparece dominante em um eixo geométrico de tempo / freqüência podemser transmitidos, e nenhum da informação de envelope e dos dados de índice corresponden-tes a uma parte não dominante do sinal pode ser transmitido. Alternativamente, valores (porexemplo, coeficientes LPC) que representam a energia e a potência da parte dominante dosinal podem ser transmitidos, e nenhum de tais valores correspondentes à parte não domi-nante do sinal pode ser transmitido. Ainda alternativamente, informação de envelope ou da-dos de índice correspondentes à parte dominante do sinal podem ser transmitidos, e valoresque representam a energia ou a potência da parte não dominante do sinal podem ser trans-mitidos. Ainda alternativamente, informação relacionada somente à parte dominante do sinalpode ser transmitida para que a parte não dominante do sinal possa ser estimada com basena informação relacionada à parte dominante do sinal. Ainda alternativamente, uma combi-nação dos métodos supradescritos pode ser usada.
Por exemplo, em relação à figura 18, se um sinal for dividido em um período domi-nante e em um período não dominante, informação relacionada ao sinal pode ser transmiti-da de quatro maneiras diferentes, indicadas por (a) até (d).
A fim de transmitir inúmeros sinais de objetos como a combinação de um sinal con-vertido para menos canais e de informação complementar, o sinal convertido para menoscanais precisa ser dividido em uma pluralidade de elementos como parte de uma operaçãode decodificação, por exemplo, em consideração à taxa dos níveis dos sinais de objetos. Afim de garantir independência entre os elementos do sinal convertido para menos canais,uma operação de decorrelação precisa ser adicionalmente realizada.
Outros sinais, que são as unidades de codificação em um método de codificaçãocom base em objeto, têm mais independência do que sinais de canal, que são as unidadesde codificação em um método de corpo de medição. Em outras palavras, um sinal de canalinclui inúmeros sinais de objetos e, assim, precisa ser decorrelacionado. Por outro lado, si-nais de objetos são independentes entre si e, assim, a separação de canal pode ser facil-mente realizada simplesmente pelo uso das características dos sinais de objetos sem umaexigência de uma operação de decorrelação.
Mais especificamente, em relação à figura 19, sinais de objetos A, B e C alternamentre si para aparecer dominantes em um eixo geométrico de freqüência. Neste caso, nãohá necessidade de dividir um sinal convertido para menos canais em inúmeros sinais deacordo com a taxa de níveis dos sinais de objetos A, B e C e de realizar decorrelação. Emvez disto, informação relacionada aos períodos dominantes dos sinais de objetos A, B e Cpode ser transmitida, ou um valor de ganho pode ser aplicado em cada componente de fre-qüência de cada um dos sinais de objetos A, B e C1 desse modo, pulando a decorrelação.Portanto, é possível reduzir a quantidade de computação e reduzir a taxa de bit pela quanti-dade que, em outras circunstâncias, teriam sido exigidas pela informação complementarnecessária para decorrelação.
Em resumo, a fim de pular a decorrelação, que é realizada para garantir indepen-dência entre inúmeros sinais obtidos pela divisão de um sinal convertido para menos canaisde acordo com a taxa das taxas dos sinais de objetos do sinal convertido para menos ca-nais, informação relacionada a um domínio de freqüência que inclui cada sinal de objetopode ser transmitida como informação complementar. Alternativamente, diferentes valoresde ganho podem ser aplicados a um período dominante, durante o qual cada sinal de objetoaparece dominante, e um período não dominante, durante o qual cada sinal de objeto apa-rece menos dominante, e, assim, informação relacionada ao período dominante pode serfornecida principalmente como informação complementar. Ainda alternativamente, a infor-mação relacionada ao período dominante pode ser transmitida como informação comple-mentar, e nenhuma informação relacionada ao período não dominante pode ser transmitida.Ainda alternativamente, uma combinação dos métodos supradescritos, que são alternativasa um método de decorrelação, pode ser usada.
Os métodos supradescritos, que são alternativas a um método de decorrelação,podem ser aplicados a todos os sinais de objetos ou somente a alguns sinais de objetoscom períodos dominantes facilmente distinguíveis. Também, os métodos supradescritos,que são alternativas a um método de decorrelação, podem ser variavelmente aplicados emunidades de quadros.
A codificação dos sinais de áudio de objeto usando um sinal residual será descritacom detalhes a seguir.
No geral, em um método de codificação de áudio com base em objeto, inúmeros si-nais de objetos são codificados, e os resultados da codificação são transmitidos como acombinação de um sinal convertido para menos canais e de informação complementar. En-tão, inúmeros sinais de objetos são restaurados a partir do sinal convertido para menos ca-nais por meio de decodificação de acordo com a informação complementar, e os sinais deobjetos restaurados são apropriadamente convertidos, por exemplo, na solicitação de umusuário de acordo com a informação de controle, desse modo, gerando um primeiro sinal decanal. No geral, um método de codificação de áudio com base em objeto alveja variar livre-mente um sinal de canal de saída de acordo com a informação de controle com o auxílio deum conversor de canais. Entretanto, um método de codificação de áudio com base em obje-to também pode ser usado para gerar uma saída de canal de uma maneira pré-definida,independente da informação de controle.
Para isto, informação complementar pode incluir não somente informação necessá-ria para obter inúmeros sinais de objetos de um sinal convertido para menos canais, mastambém informação de parâmetro de conversão de canais necessária para gerar um sinalde canal. Assim, é possível gerar um sinal de saída de canal final sem o auxílio de um con-versor de canais. Neste caso, um algoritmo, tal como codificação residual, pode ser usadopara melhorar a qualidade do som.
Um método típico de codificação residual inclui codificar um sinal e codificar o erroentre o sinal codificado e o sinal original, isto é, um sinal residual. Durante uma operação dedecodificação, o sinal codificado é decodificado durante a compensação do erro entre o si-nal codificado e o sinal original, desse modo, restaurando um sinal que é tão similar ao sinaloriginal quanto possível. Já que, no geral, o erro entre o sinal codificado e o sinal original éinsignificante, é possível reduzir a quantidade de informação adicionalmente necessária pa-ra realizar codificação residual.
Se uma saída de canal final de um decodificador for fixa, não somente a informaçãode parâmetro de conversão de canais necessária para gerar um sinal de canal final, mastambém informação de codificação residual, pode ser fornecida como informação comple-mentar. Neste caso, é possível melhorar a qualidade do som.
A figura 20 é um diagrama de blocos de um aparelho de codificação de áudio 310de acordo com uma modalidade da presente invenção. Em relação à figura 20, o aparelhode codificação de áudio 310 é caracterizado pelo uso de um sinal residual.
Mais especificamente, o aparelho de codificação de áudio 310 inclui um codificador311, um decodificador 313, um primeiro conversor de canais 315, um segundo conversor decanais 319, um somador 317 e um gerador de fluxo contínuo de bits 321.
O primeiro conversor de canais 315 realiza uma operação de conversão de canaisem um sinal original, e o segundo conversor de canais 319 realiza uma operação de conver-são de canais em um sinal obtido pela realização de uma operação de codificação e, então,uma operação de decodificação no sinal original. O somador 317 calcula um sinal residualentre uma saída de sinal pelo primeiro conversor de canais 315 e uma saída de sinal pelosegundo conversor de canais 319. O gerador de fluxo contínuo de bits 321 adiciona o sinalresidual à informação complementar e transmite o resultado da adição. Desta maneira, épossível melhorar a qualidade do som.
O cálculo de um sinal residual pode ser aplicado a todas as partes de um sinal ousomente às partes de baixa freqüência de um sinal. Alternativamente, o cálculo de um sinalresidual pode ser variavelmente aplicado somente em domínios de freqüência que incluemsinais dominantes em uma base quadro a quadro. Ainda alternativamente, uma combinaçãodos métodos supradescritos pode ser usada.
Já que a quantidade de informação complementar que inclui informação de sinalresidual é muito maior do que a quantidade de informação complementar que não inclui ne-nhuma informação de sinal residual, o cálculo de um sinal residual pode ser aplicado so-mente a algumas partes de um sinal que afeta diretamente a qualidade do som, desse mo-do, impedindo um aumento excessivo na taxa de bit. A presente invenção pode ser realiza-da como um código legível por computador escrito em uma mídia de gravação legível porcomputador. A mídia de gravação legível por computador pode ser qualquer tipo de disposi-tivo de gravação no qual dados são armazenados de uma maneira legível por computador.Exemplos da mídia de gravação legível por computador incluem uma ROM, uma RAM, umCD-ROM, uma fita magnética, um disco flexível, um armazenamento ótico de dados e umaonda portadora (por exemplo, transmissão de dados por meio da Internet). A mídia de gra-vação legível por computador pode ser distribuída por uma pluralidade de sistemas de com-putador conectada em uma rede para que o código legível por computador seja ali escrito eexecutado a partir dali de uma maneira descentralizada. Programas, código e segmentos decódigo funcionais necessários para realizar a presente invenção podem ser facilmente inter-pretados pelos versados na técnica.
APLICABILIDADE INDUSTRIAL
Da forma descrita anteriormente, de acordo com a presente invenção, imagens desom são localizadas para cada sinal de áudio de objeto pelo benefício proveniente das van-tagens dos métodos de codificação e de decodificação de áudio com base em objeto. As-sim, é possível oferecer sons mais realísticos por meio da reprodução dos sinais de áudiode objetos. Além do mais, a presente invenção pode ser aplicada a jogos interativos e, as-sim, pode fornecer a um usuário experiência de realidade virtual mais realística.Embora a presente invenção tenha sido particularmente mostrada e descrita em re-lação às suas modalidades exemplares, versados na técnica entendem que várias mudan-ças na forma e nos detalhes podem ser feitas sem fugir do espírito e do escopo da presenteinvenção, definidos pelas seguintes reivindicações.

Claims (20)

1. Método de decodificação de áudio, CARACTERIZADO pelo fato de que compre-ende:gerar um terceiro sinal convertido para menos canais pela combinação de um pri-meiro sinal convertido para menos canais extraído de um primeiro sinal de áudio e de umsegundo sinal convertido para menos canais extraído de um segundo sinal de áudio;gerar terceira informação complementar com base em objeto pela combinação daprimeira informação complementar com base em objeto extraída do primeiro sinal de áudio eda segunda informação complementar com base em objeto extraída do segundo sinal deáudio;converter a terceira informação complementar com base em objeto em informaçãocomplementar com base em canal; egerar um sinal de áudio multicanais usando o terceiro sinal convertido para menoscanais e a informação complementar com base em canal.
2. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que compreende adicionalmente gerar um sinal de áudiomulticanais com um efeito tridimensional (3D) virtual nele aplicado pela aplicação de infor-mação 3D no sinal de áudio multicanais.
3. Método de decodificação de áudio, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a informação complementar com base em canal com-preende a informação 3D.
4. Método de decodificação de áudio, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a informação 3D compreende informação para sincro-nia com a informação complementar com base em canal.
5. Método de decodificação de áudio, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a informação 3D é selecionada de uma base de dadosde informação 3D com base na informação de controle, a base de dados de informação 3Darmazenando uma pluralidade de partes de informação 3D.
6. Método de decodificação de áudio, de acordo com a reivindicação 2,CARACTERIZADO pelo fato de que a informação 3D compreende uma função de transfe-rência relacionada a cabeçalho (HRTF).
7. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que compreende adicionalmente, se o terceiro sinal conver-tido para menos canais for um sinal convertido para menos canais estéreo, modificar os si-nais de canal do terceiro sinal convertido para menos canais.
8. Método de decodificação de áudio, de acordo com a reivindicação 1,CARACTERIZADO pelo fato de que compreende adicionalmente aplicar um efeito pré-determinado no sinal de áudio multicanais.
9. Aparelho de decodificação de áudio, CARACTERIZADO pelo fato de que com-preende:um combinador de unidade de controle multipontos que gera um terceiro sinal con-vertido para menos canais pela combinação de um primeiro sinal convertido para menoscanais extraído de um primeiro sinal de áudio e de um segundo sinal convertido para menoscanais extraído de um segundo sinal de áudio, e gera terceira informação complementarcom base em objeto pela combinação da primeira informação complementar com base emobjeto extraída do primeiro sinal de áudio e da segunda informação complementar com baseem objeto extraída do segundo sinal de áudio;um transcodificador que converte a terceira informação complementar com base emobjeto em informação complementar com base em canal; eum decodificador multicanais que gera um sinal de áudio multicanais usando o ter-ceiro sinal convertido para menos canais e a informação complementar com base em canal.
10. Aparelho de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que o decodificador multicanais gera um sinal de áudio mul-ticanais no qual um efeito 3D virtual é aplicado pela aplicação de informação 3D no sinal deáudio multicanais.
11. Aparelho de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que o transcodificador gera informação complementar combase em canal, a informação complementar com base em canal compreendendo a informa-ção 3D.
12. Aparelho de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que o transcodificador gera informação para sincronia coma informação complementar com base em canal, a informação compreendendo a informa-ção 3D.
13. Aparelho de decodificação de áudio, de acordo com a reivindicação 12,CARACTERIZADO pelo fato de que compreende adicionalmente um renderizador que sele-ciona a informação 3D de uma base de dados de informação 3D com base em informaçãode controle, e fornece a informação 3D ao transcodificador.
14. Aparelho de decodificação de áudio, de acordo com a reivindicação 13,CARACTERIZADO pelo fato de que a base de dados de informação 3D armazena uma plu-ralidade de partes de informação 3D.
15. Aparelho de decodificação de áudio, de acordo com a reivindicação 14,CARACTERIZADO pelo fato de que o renderizador compreende a base de dados de infor-mação 3D.
16. Aparelho de decodificação de áudio, de acordo com a reivindicação 10,CARACTERIZADO pelo fato de que a informação 3D compreende uma HRTF.
17. Aparelho de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que compreende adicionalmente, se o terceiro sinal conver-tido para menos canais for um sinal convertido para menos canais estéreo, um processadorde conversão para menos canais que modifica sinais de canal do terceiro sinal convertidopara menos canais pelos sinais decorrelacionados.
18. Aparelho de decodificação de áudio, de acordo com a reivindicação 9,CARACTERIZADO pelo fato de que compreende adicionalmente um processador de canalque aplica um efeito pré-determinado no sinal de áudio multicanais.
19. Mídia de gravação legível por computador com um método de decodificação deáudio nela gravado, CARACTERIZADA pelo fato de que compreende:gerar um terceiro sinal convertido para menos canais pela combinação de um pri-meiro sinal convertido para menos canais extraído de um primeiro sinal de áudio e de umsegundo sinal convertido para menos canais extraído de um segundo sinal de áudio;gerar terceira informação complementar com base em objeto pela combinação daprimeira informação complementar com base em objeto extraída do primeiro sinal de áudio eda segunda informação complementar com base em objeto extraída do segundo sinal deáudio;converter a terceira informação complementar com base em objeto em informaçãocomplementar com base em canal; egerar um sinal de áudio multicanais usando o terceiro sinal convertido para menoscanais e a informação complementar com base em canal.
20. Mídia de gravação legível por computador, de acordo com a reivindicação 19,CARACTERIZADA pelo fato de que o método de decodificação de áudio compreende adi-cionalmente gerar um sinal de áudio multicanais no qual um efeito 3D virtual é aplicado pelaaplicação de informação 3D no sinal de áudio multicanais.
BRPI0711102-9A 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto BRPI0711102A2 (pt)

Applications Claiming Priority (15)

Application Number Priority Date Filing Date Title
US84829306P 2006-09-29 2006-09-29
US60/848.293 2006-09-29
US82980006P 2006-10-17 2006-10-17
US60/829.800 2006-10-17
US86330306P 2006-10-27 2006-10-27
US60/863.303 2006-10-27
US86082306P 2006-11-24 2006-11-24
US60/860.823 2006-11-24
US88071407P 2007-01-17 2007-01-17
US60/880.714 2007-01-17
US88094207P 2007-01-18 2007-01-18
US60/880.942 2007-01-18
US94837307P 2007-07-06 2007-07-06
US60/948.373 2007-07-06
PCT/KR2007/004797 WO2008039039A1 (en) 2006-09-29 2007-10-01 Methods and apparatuses for encoding and decoding object-based audio signals

Publications (1)

Publication Number Publication Date
BRPI0711102A2 true BRPI0711102A2 (pt) 2011-08-23

Family

ID=39230400

Family Applications (4)

Application Number Title Priority Date Filing Date
BRPI0711104-5A BRPI0711104A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto
BRPI0711102-9A BRPI0711102A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto
BRPI0711185-1A BRPI0711185A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
BRPI0710923-7A BRPI0710923A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto

Family Applications Before (1)

Application Number Title Priority Date Filing Date
BRPI0711104-5A BRPI0711104A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhos para codificar e decodificar sinais de áudio com base em objeto

Family Applications After (2)

Application Number Title Priority Date Filing Date
BRPI0711185-1A BRPI0711185A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto
BRPI0710923-7A BRPI0710923A2 (pt) 2006-09-29 2007-10-01 métodos e aparelhagens para codificação e decodificação de sinais de áudio orientados a objeto

Country Status (10)

Country Link
US (7) US7979282B2 (pt)
EP (4) EP2071564A4 (pt)
JP (4) JP5238707B2 (pt)
KR (4) KR100987457B1 (pt)
AU (4) AU2007300810B2 (pt)
BR (4) BRPI0711104A2 (pt)
CA (4) CA2646045C (pt)
MX (4) MX2008012251A (pt)
RU (1) RU2551797C2 (pt)
WO (4) WO2008039041A1 (pt)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4988717B2 (ja) 2005-05-26 2012-08-01 エルジー エレクトロニクス インコーポレイティド オーディオ信号のデコーディング方法及び装置
WO2006126843A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
US8208641B2 (en) * 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8285556B2 (en) 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
EP2071564A4 (en) 2006-09-29 2009-09-02 Lg Electronics Inc METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS
BRPI0715312B1 (pt) 2006-10-16 2021-05-04 Koninklijke Philips Electrnics N. V. Aparelhagem e método para transformação de parâmetros multicanais
MY145497A (en) * 2006-10-16 2012-02-29 Dolby Sweden Ab Enhanced coding and parameter representation of multichannel downmixed object coding
JP5023662B2 (ja) * 2006-11-06 2012-09-12 ソニー株式会社 信号処理システム、信号送信装置、信号受信装置およびプログラム
EP2092516A4 (en) * 2006-11-15 2010-01-13 Lg Electronics Inc METHOD AND APPARATUS FOR AUDIO SIGNAL DECODING
EP2095365A4 (en) * 2006-11-24 2009-11-18 Lg Electronics Inc METHOD FOR ENCODING AND DECODING AUDIO SIGNALS BASED ON OBJECTS AND APPARATUS THEREOF
EP2122613B1 (en) 2006-12-07 2019-01-30 LG Electronics Inc. A method and an apparatus for processing an audio signal
CN101632117A (zh) * 2006-12-07 2010-01-20 Lg电子株式会社 用于解码音频信号的方法和装置
EP2595152A3 (en) * 2006-12-27 2013-11-13 Electronics and Telecommunications Research Institute Transkoding apparatus
US8200351B2 (en) * 2007-01-05 2012-06-12 STMicroelectronics Asia PTE., Ltd. Low power downmix energy equalization in parametric stereo encoders
EP2109861B1 (en) 2007-01-10 2019-03-13 Koninklijke Philips N.V. Audio decoder
US8639498B2 (en) * 2007-03-30 2014-01-28 Electronics And Telecommunications Research Institute Apparatus and method for coding and decoding multi object audio signal with multi channel
KR100942142B1 (ko) * 2007-10-11 2010-02-16 한국전자통신연구원 객체기반 오디오 콘텐츠 송수신 방법 및 그 장치
BRPI0816557B1 (pt) * 2007-10-17 2020-02-18 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Codificação de áudio usando upmix
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
KR101061128B1 (ko) 2008-04-16 2011-08-31 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
WO2009128663A2 (en) 2008-04-16 2009-10-22 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8326446B2 (en) 2008-04-16 2012-12-04 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101061129B1 (ko) * 2008-04-24 2011-08-31 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
JP5174527B2 (ja) * 2008-05-14 2013-04-03 日本放送協会 音像定位音響メタ情報を付加した音響信号多重伝送システム、制作装置及び再生装置
WO2010008198A2 (en) 2008-07-15 2010-01-21 Lg Electronics Inc. A method and an apparatus for processing an audio signal
CN102100009B (zh) * 2008-07-15 2015-04-01 Lg电子株式会社 处理音频信号的方法和装置
KR101614160B1 (ko) * 2008-07-16 2016-04-20 한국전자통신연구원 포스트 다운믹스 신호를 지원하는 다객체 오디오 부호화 장치 및 복호화 장치
WO2010013450A1 (ja) * 2008-07-29 2010-02-04 パナソニック株式会社 音響符号化装置、音響復号化装置、音響符号化復号化装置および会議システム
US8233629B2 (en) * 2008-09-04 2012-07-31 Dts, Inc. Interaural time delay restoration system and method
WO2010042024A1 (en) * 2008-10-10 2010-04-15 Telefonaktiebolaget Lm Ericsson (Publ) Energy conservative multi-channel audio coding
MX2011011399A (es) 2008-10-17 2012-06-27 Univ Friedrich Alexander Er Aparato para suministrar uno o más parámetros ajustados para un suministro de una representación de señal de mezcla ascendente sobre la base de una representación de señal de mezcla descendete, decodificador de señal de audio, transcodificador de señal de audio, codificador de señal de audio, flujo de bits de audio, método y programa de computación que utiliza información paramétrica relacionada con el objeto.
GB2466669B (en) * 2009-01-06 2013-03-06 Skype Speech coding
GB2466675B (en) 2009-01-06 2013-03-06 Skype Speech coding
GB2466671B (en) * 2009-01-06 2013-03-27 Skype Speech encoding
GB2466673B (en) 2009-01-06 2012-11-07 Skype Quantization
GB2466674B (en) 2009-01-06 2013-11-13 Skype Speech coding
GB2466670B (en) * 2009-01-06 2012-11-14 Skype Speech encoding
GB2466672B (en) * 2009-01-06 2013-03-13 Skype Speech coding
US20100191534A1 (en) * 2009-01-23 2010-07-29 Qualcomm Incorporated Method and apparatus for compression or decompression of digital signals
KR101137361B1 (ko) * 2009-01-28 2012-04-26 엘지전자 주식회사 오디오 신호 처리 방법 및 장치
WO2010087631A2 (en) * 2009-01-28 2010-08-05 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US8139773B2 (en) * 2009-01-28 2012-03-20 Lg Electronics Inc. Method and an apparatus for decoding an audio signal
WO2010090019A1 (ja) * 2009-02-04 2010-08-12 パナソニック株式会社 結合装置、遠隔通信システム及び結合方法
EP2395504B1 (en) * 2009-02-13 2013-09-18 Huawei Technologies Co., Ltd. Stereo encoding method and apparatus
US8666752B2 (en) * 2009-03-18 2014-03-04 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding multi-channel signal
KR101387808B1 (ko) * 2009-04-15 2014-04-21 한국전자통신연구원 가변 비트율을 갖는 잔차 신호 부호화를 이용한 고품질 다객체 오디오 부호화 및 복호화 장치
EP2249334A1 (en) * 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
US20100324915A1 (en) * 2009-06-23 2010-12-23 Electronic And Telecommunications Research Institute Encoding and decoding apparatuses for high quality multi-channel audio codec
KR101123698B1 (ko) 2009-07-30 2012-03-15 삼성전자주식회사 프로세스 카트리지 및 이를 구비한 화상형성장치
KR101842411B1 (ko) 2009-08-14 2018-03-26 디티에스 엘엘씨 오디오 객체들을 적응적으로 스트리밍하기 위한 시스템
KR101599884B1 (ko) * 2009-08-18 2016-03-04 삼성전자주식회사 멀티 채널 오디오 디코딩 방법 및 장치
BR112012007138B1 (pt) 2009-09-29 2021-11-30 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Decodificador de sinal de áudio, codificador de sinal de áudio, método para prover uma representação de mescla ascendente de sinal, método para prover uma representação de mescla descendente de sinal e fluxo de bits usando um valor de parâmetro comum de correlação intra- objetos
US8452606B2 (en) * 2009-09-29 2013-05-28 Skype Speech encoding using multiple bit rates
KR101710113B1 (ko) * 2009-10-23 2017-02-27 삼성전자주식회사 위상 정보와 잔여 신호를 이용한 부호화/복호화 장치 및 방법
US9305550B2 (en) * 2009-12-07 2016-04-05 J. Carl Cooper Dialogue detector and correction
CN102792378B (zh) * 2010-01-06 2015-04-29 Lg电子株式会社 处理音频信号的设备及其方法
US10326978B2 (en) 2010-06-30 2019-06-18 Warner Bros. Entertainment Inc. Method and apparatus for generating virtual or augmented reality presentations with 3D audio positioning
US9591374B2 (en) 2010-06-30 2017-03-07 Warner Bros. Entertainment Inc. Method and apparatus for generating encoded content using dynamically optimized conversion for 3D movies
KR101697550B1 (ko) * 2010-09-16 2017-02-02 삼성전자주식회사 멀티채널 오디오 대역폭 확장 장치 및 방법
CN103119846B (zh) * 2010-09-22 2016-03-30 杜比实验室特许公司 利用对白水平归一化对音频流进行混合
WO2012040897A1 (en) * 2010-09-28 2012-04-05 Huawei Technologies Co., Ltd. Device and method for postprocessing decoded multi-channel audio signal or decoded stereo signal
GB2485979A (en) * 2010-11-26 2012-06-06 Univ Surrey Spatial audio coding
KR20120071072A (ko) * 2010-12-22 2012-07-02 한국전자통신연구원 객체 기반 오디오를 제공하는 방송 송신 장치 및 방법, 그리고 방송 재생 장치 및 방법
US9165558B2 (en) 2011-03-09 2015-10-20 Dts Llc System for dynamically creating and rendering audio objects
KR20120132342A (ko) * 2011-05-25 2012-12-05 삼성전자주식회사 보컬 신호 제거 장치 및 방법
US9754595B2 (en) 2011-06-09 2017-09-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding and decoding 3-dimensional audio signal
KR101783962B1 (ko) * 2011-06-09 2017-10-10 삼성전자주식회사 3차원 오디오 신호를 부호화 및 복호화하는 방법 및 장치
TW202339510A (zh) * 2011-07-01 2023-10-01 美商杜比實驗室特許公司 用於適應性音頻信號的產生、譯碼與呈現之系統與方法
AU2012279349B2 (en) 2011-07-01 2016-02-18 Dolby Laboratories Licensing Corporation System and tools for enhanced 3D audio authoring and rendering
JP5856295B2 (ja) * 2011-07-01 2016-02-09 ドルビー ラボラトリーズ ライセンシング コーポレイション 適応的オーディオシステムのための同期及びスイッチオーバ方法及びシステム
WO2013192111A1 (en) 2012-06-19 2013-12-27 Dolby Laboratories Licensing Corporation Rendering and playback of spatial audio using channel-based audio systems
AU2013284703B2 (en) 2012-07-02 2019-01-17 Sony Corporation Decoding device and method, encoding device and method, and program
AU2013284705B2 (en) 2012-07-02 2018-11-29 Sony Corporation Decoding device and method, encoding device and method, and program
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
US9564138B2 (en) * 2012-07-31 2017-02-07 Intellectual Discovery Co., Ltd. Method and device for processing audio signal
KR101660004B1 (ko) 2012-08-03 2016-09-27 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 멀티채널 다운믹스/업믹스 케이스들에 대해 매개변수 개념을 이용한 멀티-인스턴스 공간-오디오-오브젝트-코딩을 위한 디코더 및 방법
KR102033985B1 (ko) * 2012-08-10 2019-10-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 공간적 오디오 객체 코딩에 오디오 정보를 적응시키기 위한 장치 및 방법
US20140114456A1 (en) * 2012-10-22 2014-04-24 Arbitron Inc. Methods and Systems for Clock Correction and/or Synchronization for Audio Media Measurement Systems
EP2757559A1 (en) * 2013-01-22 2014-07-23 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for spatial audio object coding employing hidden objects for signal mixture manipulation
CN105074818B (zh) 2013-02-21 2019-08-13 杜比国际公司 音频编码系统、用于产生比特流的方法以及音频解码器
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
CN105264600B (zh) 2013-04-05 2019-06-07 Dts有限责任公司 分层音频编码和传输
KR20140123015A (ko) 2013-04-10 2014-10-21 한국전자통신연구원 다채널 신호를 위한 인코더 및 인코딩 방법, 다채널 신호를 위한 디코더 및 디코딩 방법
KR102058619B1 (ko) * 2013-04-27 2019-12-23 인텔렉추얼디스커버리 주식회사 예외 채널 신호의 렌더링 방법
CN110223702B (zh) 2013-05-24 2023-04-11 杜比国际公司 音频解码系统和重构方法
CN109712630B (zh) 2013-05-24 2023-05-30 杜比国际公司 包括音频对象的音频场景的高效编码
RU2630754C2 (ru) 2013-05-24 2017-09-12 Долби Интернешнл Аб Эффективное кодирование звуковых сцен, содержащих звуковые объекты
EP2830050A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for enhanced spatial audio object coding
EP2830045A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
EP2830047A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for low delay object metadata coding
WO2015012594A1 (ko) * 2013-07-23 2015-01-29 한국전자통신연구원 잔향 신호를 이용한 다채널 오디오 신호의 디코딩 방법 및 디코더
EP3055998A1 (en) 2013-10-11 2016-08-17 Telefonaktiebolaget LM Ericsson (publ) Method and arrangement for video transcoding using mode or motion or in-loop filter information
JP6299202B2 (ja) * 2013-12-16 2018-03-28 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム及びオーディオ復号装置
WO2015150384A1 (en) 2014-04-01 2015-10-08 Dolby International Ab Efficient coding of audio scenes comprising audio objects
US10373711B2 (en) 2014-06-04 2019-08-06 Nuance Communications, Inc. Medical coding system with CDI clarification request notification
KR101641645B1 (ko) * 2014-06-11 2016-07-22 전자부품연구원 오디오 소스 분리 방법 및 이를 적용한 오디오 시스템
JP6306958B2 (ja) * 2014-07-04 2018-04-04 日本放送協会 音響信号変換装置、音響信号変換方法、音響信号変換プログラム
US10341799B2 (en) * 2014-10-30 2019-07-02 Dolby Laboratories Licensing Corporation Impedance matching filters and equalization for headphone surround rendering
EP3254456B1 (en) 2015-02-03 2020-12-30 Dolby Laboratories Licensing Corporation Optimized virtual scene layout for spatial meeting playback
CN111866022B (zh) 2015-02-03 2022-08-30 杜比实验室特许公司 感知质量比会议中原始听到的更高的后会议回放系统
US10366687B2 (en) * 2015-12-10 2019-07-30 Nuance Communications, Inc. System and methods for adapting neural network acoustic models
US10325610B2 (en) 2016-03-30 2019-06-18 Microsoft Technology Licensing, Llc Adaptive audio rendering
US10863297B2 (en) 2016-06-01 2020-12-08 Dolby International Ab Method converting multichannel audio content into object-based audio content and a method for processing audio content having a spatial position
EP3516560A1 (en) 2016-09-20 2019-07-31 Nuance Communications, Inc. Method and system for sequencing medical billing codes
US11133091B2 (en) 2017-07-21 2021-09-28 Nuance Communications, Inc. Automated analysis system and method
US11024424B2 (en) 2017-10-27 2021-06-01 Nuance Communications, Inc. Computer assisted coding systems and methods
GB201808897D0 (en) * 2018-05-31 2018-07-18 Nokia Technologies Oy Spatial audio parameters
EP3869826A4 (en) 2018-10-16 2022-03-16 Sony Group Corporation SIGNAL PROCESSING DEVICE AND METHOD AND PROGRAM
JP7326824B2 (ja) 2019-04-05 2023-08-16 ヤマハ株式会社 信号処理装置、及び信号処理方法

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3882280A (en) * 1973-12-19 1975-05-06 Magnavox Co Method and apparatus for combining digitized information
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
EP0520068B1 (en) * 1991-01-08 1996-05-15 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US6505160B1 (en) 1995-07-27 2003-01-07 Digimarc Corporation Connected audio and other media objects
IT1281001B1 (it) 1995-10-27 1998-02-11 Cselt Centro Studi Lab Telecom Procedimento e apparecchiatura per codificare, manipolare e decodificare segnali audio.
RU2121718C1 (ru) 1998-02-19 1998-11-10 Яков Шоел-Берович Ровнер Портативная музыкальная система для караоке и картридж для нее
US20050120870A1 (en) 1998-05-15 2005-06-09 Ludwig Lester F. Envelope-controlled dynamic layering of audio signal processing and synthesis for music applications
JP3173482B2 (ja) 1998-11-16 2001-06-04 日本ビクター株式会社 記録媒体、及びそれに記録された音声データの音声復号化装置
KR100416757B1 (ko) 1999-06-10 2004-01-31 삼성전자주식회사 위치 조절이 가능한 가상 음상을 이용한 스피커 재생용 다채널오디오 재생 장치 및 방법
US7020618B1 (en) * 1999-10-25 2006-03-28 Ward Richard E Method and system for customer service process management
US6845163B1 (en) * 1999-12-21 2005-01-18 At&T Corp Microphone array for preserving soundfield perceptual cues
US6351733B1 (en) 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7006636B2 (en) 2002-05-24 2006-02-28 Agere Systems Inc. Coherence-based audio coding and synthesis
US7292901B2 (en) 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7116787B2 (en) 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US6849794B1 (en) * 2001-05-14 2005-02-01 Ronnie C. Lau Multiple channel system
US6658383B2 (en) 2001-06-26 2003-12-02 Microsoft Corporation Method for coding speech and music signals
JP2003186500A (ja) 2001-12-17 2003-07-04 Sony Corp 情報伝達システム、情報符号化装置および情報復号装置
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
CN100508026C (zh) 2002-04-10 2009-07-01 皇家飞利浦电子股份有限公司 立体声信号编码
BRPI0304542B1 (pt) 2002-04-22 2018-05-08 Koninklijke Philips Nv “Método e codificador para codificar um sinal de áudio de multicanal, sinal de áudio multicanal codificado, e, método e decodificador para decodificar um sinal de áudio de multicanal codificado”
EP1500084B1 (en) * 2002-04-22 2008-01-23 Koninklijke Philips Electronics N.V. Parametric representation of spatial audio
JP4187719B2 (ja) * 2002-05-03 2008-11-26 ハーマン インターナショナル インダストリーズ インコーポレイテッド マルチチャネル・ダウンミキシング装置
KR20050021484A (ko) 2002-07-16 2005-03-07 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
JP2004064363A (ja) 2002-07-29 2004-02-26 Sony Corp デジタルオーディオ処理方法、デジタルオーディオ処理装置およびデジタルオーディオ記録媒体
WO2004036549A1 (en) 2002-10-14 2004-04-29 Koninklijke Philips Electronics N.V. Signal filtering
US7395210B2 (en) 2002-11-21 2008-07-01 Microsoft Corporation Progressive to lossless embedded audio coder (PLEAC) with multiple factorization reversible transform
AU2003298146B2 (en) 2002-12-02 2009-04-09 Interdigital Ce Patent Holdings Method for describing the composition of audio signals
KR20050121733A (ko) 2003-04-17 2005-12-27 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 신호 발생
US7394903B2 (en) 2004-01-20 2008-07-01 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Apparatus and method for constructing a multi-channel output signal or for generating a downmix signal
CN1906664A (zh) 2004-02-25 2007-01-31 松下电器产业株式会社 音频编码器和音频解码器
SE0400998D0 (sv) 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
CN1981326B (zh) 2004-07-02 2011-05-04 松下电器产业株式会社 音频信号解码装置和方法及音频信号编码装置和方法
KR100663729B1 (ko) * 2004-07-09 2007-01-02 한국전자통신연구원 가상 음원 위치 정보를 이용한 멀티채널 오디오 신호부호화 및 복호화 방법 및 장치
JP4466242B2 (ja) 2004-07-13 2010-05-26 株式会社サタケ ペレット選別機
KR100658222B1 (ko) 2004-08-09 2006-12-15 한국전자통신연구원 3차원 디지털 멀티미디어 방송 시스템
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
SE0402652D0 (sv) 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
EP1817767B1 (en) 2004-11-30 2015-11-11 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
KR100682904B1 (ko) 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7573912B2 (en) 2005-02-22 2009-08-11 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschunng E.V. Near-transparent or transparent multi-channel encoder/decoder scheme
DE102005008342A1 (de) * 2005-02-23 2006-08-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Speichern von Audiodateien
WO2006126843A2 (en) 2005-05-26 2006-11-30 Lg Electronics Inc. Method and apparatus for decoding audio signal
EP1946294A2 (en) 2005-06-30 2008-07-23 LG Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US8359341B2 (en) 2005-12-10 2013-01-22 International Business Machines Corporation Importing content into a content management system using an e-mail application
EP1971978B1 (en) * 2006-01-09 2010-08-04 Nokia Corporation Controlling the decoding of binaural audio signals
CN101410891A (zh) * 2006-02-03 2009-04-15 韩国电子通信研究院 使用空间线索控制多目标或多声道音频信号的渲染的方法和装置
EP1989920B1 (en) * 2006-02-21 2010-01-20 Koninklijke Philips Electronics N.V. Audio encoding and decoding
DE102007003374A1 (de) 2006-02-22 2007-09-20 Pepperl + Fuchs Gmbh Induktiver Näherungsschalter sowie Verfahren zum Betreiben eines solchen
ES2362920T3 (es) 2006-03-28 2011-07-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Método mejorado para la conformación de señales en reconstrucción de audio multicanal.
RU2407227C2 (ru) * 2006-07-07 2010-12-20 Фраунхофер-Гезелльшафт Цур Фердерунг Дер Ангевандтен Форшунг Е.Ф. Концепция для объединения множества параметрически кодированных аудиоисточников
BRPI0716854B1 (pt) * 2006-09-18 2020-09-15 Koninklijke Philips N.V. Codificador para codificar objetos de áudio, decodificador para decodificar objetos de áudio, centro distribuidor de teleconferência, e método para decodificar sinais de áudio
EP2071564A4 (en) 2006-09-29 2009-09-02 Lg Electronics Inc METHOD AND DEVICES FOR CODING AND DECODING OBJECT-BASED AUDIO SIGNALS
US8295494B2 (en) * 2007-08-13 2012-10-23 Lg Electronics Inc. Enhancing audio with remixing capability
TW200930042A (en) * 2007-12-26 2009-07-01 Altek Corp Method for capturing image

Also Published As

Publication number Publication date
MX2008012315A (es) 2008-10-10
US20090164222A1 (en) 2009-06-25
WO2008039043A1 (en) 2008-04-03
KR20090013178A (ko) 2009-02-04
KR101065704B1 (ko) 2011-09-19
CA2645908A1 (en) 2008-04-03
WO2008039039A1 (en) 2008-04-03
US8762157B2 (en) 2014-06-24
CA2645910A1 (en) 2008-04-03
BRPI0711104A2 (pt) 2011-08-23
US9792918B2 (en) 2017-10-17
AU2007300812B2 (en) 2010-06-10
CA2645909A1 (en) 2008-04-03
AU2007300814B2 (en) 2010-05-13
EP2070080A4 (en) 2009-10-14
AU2007300812A1 (en) 2008-04-03
CA2646045A1 (en) 2008-04-03
US20080140426A1 (en) 2008-06-12
KR20090013177A (ko) 2009-02-04
US8625808B2 (en) 2014-01-07
CA2645909C (en) 2012-12-11
RU2551797C2 (ru) 2015-05-27
CA2645908C (en) 2013-11-26
JP2010505140A (ja) 2010-02-18
US20090157411A1 (en) 2009-06-18
EP2071563A4 (en) 2009-09-02
WO2008039041A1 (en) 2008-04-03
JP5238706B2 (ja) 2013-07-17
AU2007300813A1 (en) 2008-04-03
KR100987457B1 (ko) 2010-10-13
CA2645910C (en) 2015-04-07
MX2008012246A (es) 2008-10-07
KR101069266B1 (ko) 2011-10-04
JP2010505328A (ja) 2010-02-18
KR20090026121A (ko) 2009-03-11
AU2007300814A1 (en) 2008-04-03
US20110196685A1 (en) 2011-08-11
US7987096B2 (en) 2011-07-26
JP2010505141A (ja) 2010-02-18
AU2007300810A1 (en) 2008-04-03
CA2646045C (en) 2012-12-11
JP2010505142A (ja) 2010-02-18
JP5238707B2 (ja) 2013-07-17
EP2071564A1 (en) 2009-06-17
US20160314793A1 (en) 2016-10-27
EP2071564A4 (en) 2009-09-02
MX2008012250A (es) 2008-10-07
JP4787362B2 (ja) 2011-10-05
US20090164221A1 (en) 2009-06-25
US8504376B2 (en) 2013-08-06
EP2070081A1 (en) 2009-06-17
MX2008012251A (es) 2008-10-07
AU2007300810B2 (en) 2010-06-17
AU2007300813B2 (en) 2010-10-14
JP5232789B2 (ja) 2013-07-10
EP2070081A4 (en) 2009-09-30
BRPI0711185A2 (pt) 2011-08-23
KR20090009842A (ko) 2009-01-23
RU2010141970A (ru) 2012-04-20
US20140303985A1 (en) 2014-10-09
WO2008039042A1 (en) 2008-04-03
US7979282B2 (en) 2011-07-12
BRPI0710923A2 (pt) 2011-05-31
US9384742B2 (en) 2016-07-05
EP2070080A1 (en) 2009-06-17
EP2071563A1 (en) 2009-06-17

Similar Documents

Publication Publication Date Title
US9792918B2 (en) Methods and apparatuses for encoding and decoding object-based audio signals
RU2455708C2 (ru) Способы и устройства кодирования и декодирования объектно-ориентированных аудиосигналов

Legal Events

Date Code Title Description
B08F Application dismissed because of non-payment of annual fees [chapter 8.6 patent gazette]

Free format text: REFERENTE A 11A ANUIDADE.

B08K Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette]

Free format text: EM VIRTUDE DO ARQUIVAMENTO PUBLICADO NA RPI 2481 DE 24-07-2018 E CONSIDERANDO AUSENCIA DE MANIFESTACAO DENTRO DOS PRAZOS LEGAIS, INFORMO QUE CABE SER MANTIDO O ARQUIVAMENTO DO PEDIDO DE PATENTE, CONFORME O DISPOSTO NO ARTIGO 12, DA RESOLUCAO 113/2013.