BRPI0806228A2 - dispositivo de sintetização de fluxo, unidade de decodificação e método - Google Patents

dispositivo de sintetização de fluxo, unidade de decodificação e método Download PDF

Info

Publication number
BRPI0806228A2
BRPI0806228A2 BRPI0806228-5A BRPI0806228A BRPI0806228A2 BR PI0806228 A2 BRPI0806228 A2 BR PI0806228A2 BR PI0806228 A BRPI0806228 A BR PI0806228A BR PI0806228 A2 BRPI0806228 A2 BR PI0806228A2
Authority
BR
Brazil
Prior art keywords
signal
signals
extended
downmix
coded
Prior art date
Application number
BRPI0806228-5A
Other languages
English (en)
Inventor
Tomokazu Ishikawa
Takeshi Norimatsu
Takashi Katayama
Original Assignee
Panasonic Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp filed Critical Panasonic Corp
Publication of BRPI0806228A2 publication Critical patent/BRPI0806228A2/pt
Publication of BRPI0806228A8 publication Critical patent/BRPI0806228A8/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M3/00Automatic or semi-automatic exchanges
    • H04M3/42Systems providing special services or facilities to subscribers
    • H04M3/56Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities
    • H04M3/568Arrangements for connecting several subscribers to a common circuit, i.e. affording conference facilities audio processing specific to telephonic conferencing, e.g. spatial distribution, mixing of participants
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L65/00Network arrangements, protocols or services for supporting real-time applications in data packet communication
    • H04L65/60Network streaming of media packets
    • H04L65/70Media network packetisation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/12Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being prediction coefficients

Abstract

DISPOSITIVO DE SINTETIZAçãO DE FLUXO, UNIDADE DE DECODIFICAçãO E MéTODO. Prover uma atmosfera melhorada fiel à realidade melhorada desfrutada em uma conexão de multiponto, e reduzir uma carga de cálculo em uma unidade de conexão de multiponto, também. Um dispositivo de sintetização de fluxo inclui uma unidade de entrada a qual introduz pelo menos dois sinais codificados, cada um incluindo um primeiro sinal acústico de downmix e um sinal estendido, cada um dos primeiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do primeiro sinal acústico de downmix; uma unidade de geração de sinal codificado a qual gera: um segundo sinal acústico de downmix e um sinal estendido com base em cada um dos sinais codificados introduzidos pela unidade de entrada, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido gerado sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix do segundo sinal acústico de downmix; e a geração de um sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado e cada um dos sinais estendidos incluídos no sinal codificado introduzido correspondente; e uma unidade de saída, a qual extrai o sinal codificado gerado.

Description

Relatório Descritivo da Patente de Invenção para "DISPOSITIVO DE SINTETIZAÇÃO DE FLUXO, UNIDADE DE DECODIFICAÇÃO E MÉ- TODO".
Campo Técnico
A presente invenção se refere a sistemas de teleconferência de multiponto utilizando uma técnica de codificação - decodificação de áudio para o estabelecimento de comunicações e, em particular, para uma unidade de conexão de multiponto.
Técnica Antecedente
Os últimos anos viram uma introdução de sistemas de teleconfe- rência para o estabelecimento de conexões entre pontos plurais via o IP (Protocolo de Internet). Um sistema de conferência convencional usa uma técnica de codificação de fala incluindo G. 726 para o estabelecimento de conexões entre cada um dos pontos em uma base um para um.
A provisão de um sinal acústico monofônico com base em uma técnica de codificação de fala monofônica incluindo o G. 726 descrito na Re- ferência Não de Patente 1 carece da apresentação de uma atmosfera fiel à realidade em cada um dos pontos. Assim, é difícil que os ouvintes especifi- quem um orador quando várias pessoas simultaneamente falam em cada um dos pontos. Isto resulta da deterioração da performance de separação de som.
Assim, uma introdução de uma técnica de codificação de multi- canal, tal como a técnica MPEG-AAC descrita na Referência Não de Patente 2, pode melhorar a performance de separação. Embora proveja uma atmos- fera fiel à realidade em cada um dos pontos, a técnica de MPEG-AAC so- brecarrega a rede, devido a uma quantidade de transmissão (taxa de bit) crescente. Se comparada com uma técnica de codificação de fala, uma téc- nica de codificação de multicanal típica sofre um aumento de aproximada- mente 100 vezes na taxa de bit.
Ao invés da técnica de MPEG-AAC, a técnica de MPEG- Surround descrita na Referência Não de Patente 3 utiliza uma técnica de codificação de multicanal de taxa de bit baixa para se evitar um aumento na taxa de bit.
Referência Não de Patente 1: norma ITU-T G.726
Referência Não de Patente 2: norma ISO/IEC 13818-3 para MPEG-AAC.
Referência Não de Patente 3: norma ISO/IEC 23003-3 para MPEG-Surround
Referência Não de Patente 4: URL:http://winnie.kuis.kvoto- u.ac.jp/~oqata/le4-pr/node2.html buscado na internet em 15 de julho de 2007.
Referência Não de Patente 5: 2000. vol. J83-A. "Scalable Audio Coding Ba- sed on Hierarchical Transform Coding Modules." IEICE The Transactions of the Institute of Electronics, Information and Communication Engineers. A. no. 3(20000325), pp. 241-252.
Referência Não de Patente 6:
URL:http://www.murata.elec.waseda.ac.ip/~mura/Research/ICA/ieice99/mld. m buscado na internet em 15 de julho de 2007.
Exposição da Invenção
Problemas a Serem Resolvidos pela Invenção
A técnica de MPEG-Surround tem problemas consideráveis no uso, tal como em um sistema de teleconferência.
Conforme mostrado nas FIG. 1 e 2, a rede de malha (FIG. 1) e a rede em estrela (FIG. 2) são utilizadas para o estabelecimento de uma rede em um sistema de teleconferência. Quando vários pontos são conectados na rede de malha (FIG. 1), um aumento nos pontos conectados significa uma quantidade significativa de processamento de codificação simultâneo em um aparelho terminal de transmissão - recepção em cada um dos pontos. Quando há η pontos, o terminal em cada ponto precisa realizar η vezes um processamento de decodificação. No caso de codificação e de decodificação em uma técnica de codificação de multicanal, tal como a técnica de MPEG- Surround, uma quantidade significativa de cálculo é requerida. Assim, a exe- cução das vezes simultâneas e plurais de processamento de decodificação, conforme descrito acima, requer uma performance de cálculo alta para um processador de codificação e de decodificação; especificamente, um pro- cessador de escala consideravelmente larga. Infelizmente, um processador de processamento típico para um processamento de decodificação simultâ- neo, conforme descrito acima, tende a ser dispendioso e sofrer de um alto custo. Ainda, o projeto de uma em aritmética tendo uma capacidade de re- serva leva a um aumento adicional no alto custo. Este problema é fatal para um terminal portátil, uma vez que o terminal portátil deve conservar eletrici- dade.
Nesse ínterim, a rede em estrela (FIG. 2) que estabelece uma conexão através de uma unidade de conexão de multiponto (MCU) 403 tam- bém tem um problema. Um aparelho terminal de transmissão - recepção em cada um dos pontos meramente executa o processamento de transmissão - recepção entre a MCU e o aparelho sozinho, o qual torna desnecessária uma capacidade de processamento excessiva ou uma memória aritmética. Contudo, é requerido que a unidade de conexão de multiponto (MCU) tenha uma performance de cálculo significativa. A FIG. 3 ilustra três pontos estabe- Iecendo conexões através e uma unidade de conexão de multiponto 403 e comunicações com cada outro através de uma técnica de codificação de multicanal convencional, tal como MPEG-Surround. A FIG. 3 exemplifica ca- da ponto conduzindo comunicações de três canais. A unidade de conexão de multiponto 403 executa uma decodificação de multicanal na informação codificada 401 e na informação codificada 402 recebidas a partir dos pontos 1 e 2, respectivamente; faz um downmix em cada um dos canais; e provê, para transmissão para um ponto 3, uma codificação de três canais de novo nos canais que sofreram downmix. Em outras palavras, quando η pontos são conectados à unidade de conexão de multiponto (MCU), a unidade de cone- xão de multiponto precisa executar simultaneamente η vezes de processa- mento de codificação e η vezes de processamento de decodificação, de mo- do a decodificar uma vez fluxos codificados, cada um recebido a partir do ponto associado, e sintetizar os fluxos codificados em um sinal. Assim sen- do, o problema surgido no aparelho terminal de transmissão - recepção na rede de malha também surge na unidade de conexão de multiponto.
A presente invenção é concebida tendo em vista os problemas convencionais descritos acima. Meios para Resolução dos Problemas
De modo a resolver os problemas acima, um primeiro dispositivo de sintetização de fluxo na presente invenção inclui uma unidade de entrada, a qual introduz pelo menos dois sinais codificados, cada um incluindo um primeiro sinal acústico de downmix e um sinal estendido, cada um dos pri- meiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som a partir do primeiro sinal acústico de downmix; uma unidade de geração de sinal codificado a qual gera: um segundo sinal acústico de downmix e um sinal estendido com base em cada um dos sinais codificados introduzidos pela unidade de entrada, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido gerado sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix fora do segundo sinal acústico de downmix; e a gera- ção de um sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado, e cada um dos sinais estendidos incluídos no sinal codificado introduzido correspondente; e uma unidade de saída a qual extrai o sinal codificado gerado.
Um dispositivo de decodificação inclui uma unidade de entrada a qual introduz um sinal codificado incluindo um sinal acústico de downmix e um sinal estendido, o sinal acústico de downmix sendo provido de um sinal acústico codificado no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do sinal acústico de downmix, onde o sinal acústico de down- mix no sinal codificado a ser introduzido é um segundo sinal acústico de downmix para a obtenção de cada um dos sinais acústicos de downmix em pelo menos dois sinais codificados predeterminados, o sinal estendido no sinal codificado a ser introduzido é um sinal estendido para a obtenção de cada um dos primeiros sinais acústicos de downmix do segundo sinal acústi- co de downmix, e a unidade de decodificação inclui uma subunidade de de- codificação configurada para a geração de pelo menos dois sinais intermedi- ários com base em um coeficiente de correlação interaural (ICC) e uma dife- rença de nível interaural de freqüência (ILD) incluída no sinal estendido, e para a multiplicação dos pelo menos dois sinais intermediários gerados pela diferença de nível interaural de freqüência (ILD)1 pelo menos dois sinais in- termediários sendo não correlacionados de um sinal decodificado obtido a partir do segundo sinal acústico de downmix com um uso do coeficiente de correlação interaural (ICC). É notado que a unidade de decodificação gera cada um dos sinais intermediários com base pelo menos no coeficiente de correlação interaural (ICC) e na diferença de nível interaural de freqüência (ILD). A unidade de decodificação pode gerar cada um dos sinais intermedi- ários com base em um outro pedaço de dados além do coeficiente de corre- lação interaural (ICC), da diferença de nível interaural de freqüência (ILD), ou ambos o coeficiente de correlação interaural (ICC) e a diferença de nível interaural de freqüência (ILD).
Uma segunda unidade de sintetização de fluxo usa um sinal co- dificado como um sinal de entrada e de saída da mesma, cujo sinal codifica- do inclui: um sinal acústico de downmix provido de um sinal acústico codifi- cado no qual não menos do que um sinal monofônico sofre um downmix; e um sinal estendido para a decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A segunda unidade de sintetização de fluxo é caracterizada por receber não menos do que dois sinais codifica- dos para conformação: uma porção de sinal acústico de downmix em não menos do que um sinal codificado em um sinal acústico de downmix; e o sinal acústico de downmix em um sinal estendido para decodificação de não menos do que o sinal monofônico.
Uma terceira unidade de sintetização de fluxo usa um sinal codi- ficado como um sinal de entrada e de saída da mesma, cujo sinal codificado inclui: um sinal acústico de downmix provido de um sinal acústico codificado no qual não menos do que um sinal monofônico sofre um downmix; e um sinal estendido para decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A terceira unidade de sintetização de fluxo é caracterizada para: receber não menos do que dois dos sinais codifi- cados incluindo o sinal codificado, e transmitir um dos sinais codificados; e sintetizar os sinais estendidos, tendo o sinal estendido, incluídos nos sinais codificados recebidos em um sinal codificado.
Uma quarta unidade de sintetização de fluxo usa um sinal codifi- cado como um sinal de entrada e de saída da mesma, cujo sinal codificado inclui: um sinal acústico de downmix provido de um sinal acústico codificado no qual não menos do que um sinal monofônico sofre um downmix; e um sinal estendido para decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A quarta unidade de sintetização de fluxo é caracterizada para sintetizar em um sinal incluindo uma informação indicando fontes de transmissão de não menos do que dois dos sinais codifi- cados.
Uma primeira unidade de decodificação recebe um sinal codifi- cado como uma entrada da mesma, cujo sinal codificado inclui: um sinal a- cústico de downmix provido de um sinal acústico codificado no qual não me- nos do que um sinal monofônico sofre um downmix; e um sinal estendido para decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A primeira unidade de decodificação recebe um sinal con- formado em um sinal estendido para decodificação, de não menos do que dois sinais codificados, uma porção de sinal acústico de downmix em não menos do que um sinal codificado em um sinal de downmix e o sinal acústi- co de downmix em não menos do que um sinal monofônico. O sinal estendi- do inclui uma relação de potência de freqüência (ILD) de não menos do que um sinal monofônico e um coeficiente de correlação interaural (ICC) de não menos do que um sinal monofônico. A primeira unidade de decodificação descorrelaciona um sinal com o sinal acústico de downmix decodificado, u- sando os coeficientes de correlação interaural (ICC), e gera não menos do que dois sinais intermediários. Então, a primeira unidade de decodificação multiplica não menos do que dois sinais intermediários com a relação de po- tência de freqüência (ILD).
Uma segunda unidade de decodificação recebe um sinal codifi- cado como uma entrada da mesma, cujo sinal codificado inclui: um sinal a- cústico de downmix provido de um sinal acústico codificado no qual não me- nos do que um sinal monofônico sofre um downmix; e um sinal estendido para decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A segunda unidade de decodificação recebe um sinal con- formado em um sinal estendido para decodificação, de não menos do que dois sinais codificados, uma porção de sinal acústico de downmix em não menos do que um sinal codificado em um sinal de downmix e o sinal acústi- co de downmix em não menos do que um sinal monofônico. O sinal estendi- do inclui a relação da potência entre as potências da freqüência e um sinal monofônico ao quadrado de não menos do que um sinal monofônico. A se- gunda unidade de codificação é caracterizada para suspender a decodifica- ção, quando a relação da potência entre as potências da freqüência e um sinal monofônico ao quadrado for maior do que um limite predeterminado.
Uma quinta unidade de sintetização de fluxo usa um sinal codifi- cado como um sinal de entrada e de saída da mesma, cujo sinal codificado inclui: um sinal acústico de downmix provido de um sinal acústico codificado no qual não menos do que um sinal monofônico sofre um downmix; e um sinal estendido para decodificação do sinal acústico de downmix em não menos do que um sinal monofônico. A quinta unidade de sintetização de flu- xo é caracterizada para receber não menos do que dois sinais codificados para conformação: uma porção de sinal acústico de downmix em não menos do que um sinal codificado em um sinal acústico de downmix; e o sinal acús- tico de downmix em um sinal estendido para decodificação de não menos do que um sinal monofônico.
Quando se usa uma técnica de codificação de fala monofônica incluindo G. 726, a quinta unidade de sintetização de fluxo pode prover uma solução para os problemas de a performance de separação de som se dete- riorar devido aos sinais acústicos monofônicos, quando várias pessoas falam simultaneamente em cada um dos pontos, e, assim, é difícil que os ouvintes especifiquem um orador. Efeitos da Invenção
A unidade de sintetização de fluxo descrita acima pode prover uma atmosfera fiel à realidade melhorada desfrutada em uma conexão de multiponto, e reduzir uma carga de cálculo em uma unidade de conexão de multiponto, também.
Breve Descrição dos Desenhos
[FIG. 1] A FIG. 1 ilustra um tipo de percurso de comunicações.
[FIG. 2] A FIG. 2 ilustra um tipo de percurso de comunicações.
[FIG. 3] A FIG. 3 mostra um problema em comunicações de mul- tiponto de multicanal.
[FIG. 4] A FIG. 4 ilustra uma unidade de sintetização de fluxo na primeira modalidade da presente invenção.
[FIG. 5] A FIG. 5 exemplifica uma conexão de multiponto na pri- meira modalidade da presente invenção.
[FIG. 6] A FIG. 6 mostra um circuito de conformação de downmix na primeira modalidade da presente invenção.
[FIG. 7] A FIG. 7 mostra uma unidade de decodificação na pri- meira modalidade da presente invenção.
[FIG. 8] A FIG. 8 mostra um circuito de separação na primeira modalidade da presente invenção.
[FIG. 9] A FIG. 9 exemplifica uma conexão de multiponto em uma segunda modalidade da presente invenção.
[FIG. 10] A FIG. 10 exemplifica um fluxo codificado na segunda modalidade da presente invenção.
[FIG. 11] A FIG. 11 mostra um circuito de conformação de downmix na terceira modalidade da presente invenção.
[FIG. 12] A FIG. 12 exemplifica uma conexão de multiponto em uma quarta modalidade da presente invenção.
[FIG. 13] A FIG. 13 exemplifica um fluxo codificado na quarta modalidade da presente invenção.
[FIG. 14] A FIG. 14 exemplifica uma conexão de multiponto na primeira modalidade da presente invenção.
[FIG. 15] A FIG. 15 exemplifica uma outra conexão de multiponto na primeira modalidade da presente invenção. [FIG. 16] A FIG. 16 é um fluxograma para mostrar como a uni- dade de sintetização de fluxo detecta o número de pontos de recepção.
[FIG. 17] A FIG. 17 é um fluxograma para mostrar como a uni- dade de sintetização de fluxo calcula um coeficiente de separação de downmix.
[FIG. 18] A FIG. 18 é um outro fluxograma para mostrar como calcular o coeficiente de separação de downmix.
[FIG. 19] A FIG. 19 exemplifica um fluxo codificado na primeira modalidade da presente invenção.
[FIG. 20] A FIG. 20 exemplifica uma informação de árvore de divisão mantida no fluxo codificado.
[FIG. 21] A FIG. 21 é um fluxograma para mostrar um processo para cálculo de uma prioridade na unidade de sintetização de fluxo.
[FIG. 22] A FIG. 22 é um diagrama que mostra um processo da unidade de sintetização de fluxo transmitindo cada pedaço de informação codificada para um ponto associado.
Referências Numéricas
100 Dispositivo de sintetização de fluxo
101, 102, e 107 Informação codificada
103 Circuito de separação
104 Circuito de conformação de downmix
105 Circuito de cálculo de informação estendida
106 Circuito de multiplexação
201 e 204 Sinal codificado de downmix
202, 203, 205, e 206 Informação estendida
207 Sinal codificado de downmix
208 Informação de separação de downmix
401, 402, e 407 Informação codificada
501 e 502 Circuito de decodificação
503 Circuito de downmix
504 Circuito de decodificação
601 Sinal codificado de downmix 602 Informação estendida
603 e 604 Circuito de separação
701 Sinal de entrada
702 Informação de separação (valor de correlação)
703 Informação de separação (diferença de nível interaural)
704 Circuito de descorrelação
705 e 706 Circuito de controle de ganho
707 Primeiro sinal separado
708 Segundo sinal separado
801 Sinal codificado de downmix de um ponto 1
802 e 803 Informação estendida do ponto 1
804 Sinal codificado de downmix de um ponto 2
805, 806, e 807 Informação estendida do ponto 2
808 Sinal codificado de downmix de um ponto 3
809 Informação de separação de downmix do ponto 3
901 Informação de árvore
902 Sinal codificado de downmix do ponto 3
903 Informação de separação de downmix do ponto 3
904, 905, e 906 Informação estendida
907 Informação de determinação
908 Informação de ponto
909 O número de sinais
910 Informação de profundidade de árvore
911 Coeficiente de árvore de um sinal 1
912 Coeficiente de árvore de um sinal 2
913 Coeficiente de árvore de um sinal 3
914 Informação de fim
1001 Unidade de quantificação inversa
1101 Sinaldedownmix
1102, 1103, 1104 Informação estendida
1105 Sinaldedownmix
1106, 1107, 1108, e 1109 Informação estendida 1110 Sinaldedownmix
1111 Informação de separação de downmix
1112 e 1113 Informação estendida
1114, 1115, e 1116 Informação codificada 1301 O número de sinais de entrada
1401 Informação de prioridade
1402 Sinal estendido de sinal de entrada 1 do ponto 1 (Priori- dade máxima)
1403 Sinal estendido de sinal de entrada 2 do ponto 2 (Priori- dade mínima)
Melhor Modo para Realização da Invenção
A partir deste ponto, as modalidades da presente invenção de- vem ser descritas com referência aos desenhos.
(Primeira Modalidade) A FIG. 4 é um diagrama estrutural de uma unidade de sintetiza- ção de fluxo 100 na presente invenção. Ainda, a FIG. 5 ilustra os pontos 1, 2 e 3 estabelecendo conexões com cada outro através da unidade de sinteti- zação de fluxo (unidade de conexão de multiponto) 100 na presente inven- ção. A partir deste ponto, o sistema de teleconferência de multiponto incluin- do os pontos 1 a 3 e a unidade de sintetização de fluxo 100 é referido como um sistema 1 (FIG. 5). Em primeiro lugar, a FIG. 5 mostra uma visão geral do sistema 1.
A FIG. 5 é um diagrama de blocos do sistema 1.
Cada um dos pontos captura dois ou mais sinais acústicos inde- pendentes em um microfone para a obtenção de um sinal de PCM (Modula- ção de Código de Pulso) de multicanal. Na FIG. 5, o ponto 1 captura os si- nais 1 a 3, e o ponto 2 captura os sinais 4 a 6. A expressão 1 provê um sinal de PCM de downmix estereofônico ou monofônico do sinal de PCM obtido.
(Expressão 1) DMX (n) = Σa (i, n)*Input(i) n = 1 ou 2 onde a (i, n) é um coeficiente de downmix de cada um dos sinais de entra- da. Quando cinco sinais são capturados, o coeficiente de downmix mostrado na norma da ITU-R BS. 775-1 é utilizado. É notado que "Σ" representa o somatório total de seqüência. Em outras palavras, "Σ" significa o "Σ" em ma- temática.
Aqui, os sinais acústicos independentes plurais servem como um sinal de multicanal regular.
Então, o sinal de downmix monofônico ou estereofônico calcula- do conforme descrito acima recebe um processamento de codificação acús- tica monofônico ou estereofônico, respectivamente. O sinal de downmix es- tereofônico recebe o processamento de codificação acústica pela técnica de MPEG AAC descrita na Referência Não de Patente 2. O sinal de downmix monofônico recebe um processamento de codificação acústica pela técnica de G. 726 e a codificação monofônica na MPEG AAC descrita na Referência Não de Patente 1. É notado que uma técnica para codificação de um sinal de downmix não está limitada à MPEG-AAC e à G. 726. Ao invés disso, a técnica de MPEG - Camada 3 de Dolby Digital (AC-3), e a técnica de TwinVQ também podem ser utilizadas.
A FIG. 5 mostra sinais providos pela codificação dos sinais de PCM de downmix como um sinal de DMX 201 e um sinal de DMX 204. <0} Estes são geralmente referidos como sinais codificados de downmix.
Por uma questão de conveniência, este pedido se refere a um processamento inteiro como uma codificação de downmix, cujo processa- mento inteiro envolve um downmixing de sinais originais, tais como vários sinais acústicos, e a codificação dos sinais de PCM de downmix que sofre- ram um downmix em um sinal de DMX. Aqui, uma codificação de downmix é simplesmente referida como uma "codificação", conforme necessário. Ao contrário, um processamento para a geração dos sinais originais plurais dos sinais de DMX é referido como uma decodificação de downmix. Aqui, uma decodificação de downmix é simplesmente referida como uma "decodifica- ção", conforme necessário.
Em seguida, um sinal referido como um sinal estendido é deter- minado. Este sinal inclui uma informação para a decodificação dos sinais de downmix (tais com o sinal de DMX 201 e o sinal de DMX 204) em sinais in- dependentes plurais. O ponto 1 exemplifica o cálculo do sinal estendido. Em primeiro lugar, uma diferença de nível interaural (ILD) e um coeficiente de correlação interaural (ICC) são derivados a partir de entre sinais de entrada (no caso em que um sinal 1 e um sinal 2 são ambos sinais monofônicos) em uma base de quadro, conforme se segue:
(Expressão 2) Gain(n) = 10*log(lnput1 (n) / Input2(n)).
(Expressão 3) Cor(n) = I(lnput1(n)*lnput2(n) / Input2(i) Λ 2) onde o sinal 1 é Inputl (n) e o sinal 2 é Input2(n).<0} É notado que o símbolo "^" denota um cálculo exponencial neste pedido. Especificamente, "ΑΛΒ" incluindo o símbolo "^" denota A elevado à B-ésima potência.
A diferença de nível interaural (ILD) e o coeficiente de correlação interaural (ICC) são quantificados e codificados por Huffman para a geração de um sinal estendido 203. O circuito de OTT (um circuito que gera o sinal estendido acima de dois sinais) usado para a codificação de MPEG- Surround descrita na Referência Não de Patente 3 deve prover um processo detalhado do cálculo. É notado que a diferença de nível interaural (ILD) e o coeficiente de correlação interaural (ICC) são exemplificados como uma in- formação estendida; contudo, a informação estendida não deve ser limitada a estes. Ainda, o cálculo acima foi exemplificado para a geração da informa- ção estendida a partir de dois sinais independentes. Enquanto isso, uma ou- tra técnica pode ser utilizada na obtenção da informação estendida a partir de três sinais. O circuito de TTT usado para a codificação de MPEG- Surround descrita na Referência Não de Patente 3 deve prover os detalhes da técnica. No caso de quatro ou mais sinais independentes, circuitos de OTT conectados em série, cada um dos quais sendo um aparelho de sinal recebendo duas entradas, calculam o sinal estendido. Por exemplo, dois cir- cuitos de OTT são usados para o recebimento de quatro sinais independen- tes e para a geração de dois pares dos sinais de downmix via um circuito de OTT. Em outras palavras, três circuitos de OTT são usados.
É notado que a informação estendida pode incluir uma informa- ção de diferença de fase (IPD), bem como a diferença de nível interaural (ILD) e o coeficiente de correlação interaural (ICC). Em seguida, os sinais 1 e 2 sofrem um downmix para serem convertidos no sinal monofônico. A diferença de nível interaural (ILD) e o coeficiente de correlação interaural (ICC) são calculados, usando-se as Ex- pressões 2 e 3, a partir do sinal monofônico e do sinal 3, e quantificados e codificados por Huffman para a criação de um sinal estendido 202. A infor- mação codificada 101 inclui o sinal codificado de downmix 201, a informação estendida 202 e a informação estendida 203. Aqui, a informação estendida 202 separa o sinal 3 e um sinal sintetizado incluindo os sinais 1 e 2 do sinal codificado de downmix 201. A informação estendida 203 separa o sinal sin- tetizado, incluindo os sinais 1 e 2 e separados pela informação estendida 202, no sinal 1 e no sinal 2. Uma árvore de sinal 209 na FIG. 5 ilustra es- quematicamente o dito acima.
De modo similar ao ponto 1, o ponto 2 calcula a informação es- tendida 206 a partir dos sinais 4 e 5, e a informação estendida 205 a partir do sinal 6 e de um sinal sintetizado com o sinal 4 e o 5 tendo passado pelo downmix.
Os sinais codificados de downmix e os pedaços de informação estendida através do dito acima são sintetizados em uma base de ponto, e providos para a unidade de sintetização de fluxo 100 através de um percurso de comunicações incluindo a Internet.
A FIG. 4 ilustra a unidade de sintetização de fluxo 100 da pre- sente invenção em detalhes. A unidade de sintetização de fluxo 100 executa o cálculo a seguir.
Em primeiro lugar, um circuito de separação 103 separa os si- nais codificados de downmix e os pedaços de informação estendida da in- formação codificada 101 no ponto 1 e da informação codificada 102 no ponto 2, respectivamente. Na separação, um pedaço de informação para distinção entre os sinais de downmix e os pedaços de informação estendida é atribuí- do a cada ponto de começo do pedaço de informação estendida. O circuito de separação 103 executa a separação acima de acordo com o pedaço de informação.
A FIG. 6 ilustra uma estrutura de um circuito de conformação de downmix 104 (FIG. 4).
No circuito de conformação de downmix 104, os sinais codifica- dos de downmix separados são temporariamente decodificados nos sinais de PCM pelos circuitos de codificação 501 e 502 incluídos no circuito de conformação de downmix 104, seguindo-se um processo predeterminado. É notado que, quando os sinais codificados de downmix são codificados pela técnica de MPEG-AAC, a técnica de decodificação descrita na Referência de Não de Patente 2 é adotada para a decodificação dos sinais de downmix de modo a se obterem os sinais de PCM. Os sinais de PCM obtidos através do dito acima são referidos como PCM 1 e PCM 2.
O circuito de conformação de downmix 104 obtém um sinal codi- ficado de downmix 207 (FIG. 6) por ainda: passar por um downmix os sinais de PCM decodificados (PCMs 1 e 2) em um circuito de downmix 503; e codi- ficar os sinais de PCM decodificados que passaram pelo downmix em um circuito de codificação 504 de acordo com uma técnica de codificação prede- terminada (a técnica de MPEG-AAC, por exemplo). A Expressão 4 exemplifi- ca um processo de downmix descrito acima:
(Expressão 4) DMX = 0.5*PCM1 + 0.5*PCM2
É notado que o coeficiente representa 0,5. A propósito, o coeficiente não está limitado a isto, à medida que a relação a seguir se mantenha: (Expressão 5) a(i) + b(i) = 1
onde os coeficientes para os PCMS 1 e 2 são a(i) e b(i), respectivamente. Este processo é equivalente a uma operação do circuito de downmix 503 na FIG. 6.
Então, um circuito de cálculo de informação estendida 105 (FIG.
4) calcula a informação estendida a partir do PCM 1 e do PCM 2, de acordo com as Expressões 2 e 3 descritas acima. A informação estendida calculada é referida como uma informação de separação de downmix (informação es- tendida de downmix) 208 (separação de DMX na FIG. 5).
A informação de separação de downmix é calculada conforme se segue.
A FIG. 16 é um fluxograma para se determinar se a informação de separação de downmix deve ou não ser obtida.
O estabelecimento dos pontos na modalidade exemplifica a uni- dade de sintetização de fluxo 100 recebendo sinais a partir de dois pontos e transmitindo um sinal sintetizado para um ponto. Aqui, o número de pontos de recepção n é "2". A unidade de sintetização de fluxo 100 detecta o núme- ro de pontos de recepção (Etapa S11). Uma vez que o número detectado de pontos de recepção é maior do que 1 (Etapa S12: Sim), a unidade de sinteti- zação de fluxo 100 faz com que a circuito de cálculo de informação estendi- da 105 calcule um coeficiente de separação de sinal de ponto (informação de separação de downmix) (Etapa S13). O cálculo será descrito aqui adian- te. Mediante o cálculo do coeficiente de separação de sinal de ponto, um circuito de multiplexação 106 sintetiza o coeficiente e a informação estendida original em um fluxo (Etapa S14), e uma unidade de saída 12 extrai o fluxo para o terceiro ponto (Etapa S15). Conforme descrito acima, a Etapa S14 envolve o circuito de multiplexação 106 sobrepor o coeficiente de separação de sinal de ponto. Um processo de cálculo do coeficiente de separação de sinal de ponto deve ser descrito na FIG. 18.
A FIG. 18 é um fluxograma que descreve um cálculo de um pri- meiro coeficiente de separação de downmix.
De acordo com a Expressão 3, os coeficientes de correlação interaural (ICC) dos PCMS 1 e 2 são calculados a partir dos PCMS 1 e 2, em que os sinais de codificação de downmix 201 e 204 (FIG. 6) a partir dos res- pectivos pontos 1 e 2 são codificados (Etapa S32). A próxima etapa envolve detectar se o valor absoluto dos coeficientes de correlação interaural (ICC) calculados é maior ou menor do que um valor de limite predeterminado PJCC (Etapa S33). Quando o valor absoluto é menor do que o PJCC (Eta- pa S33: Sim), um sinal diferencial entre os PCMS 1 e 2 é calculado. É nota- do que o PJCC representa, por exemplo, 0,5. Este valor, previamente regu- lado no dispositivo de sintetização de fluxo 100 (FIG. 4 e 5) varia entre 0 e 1,0 e pode ser livremente mudado pelo usuário. Assim sendo, o valor regu- lado para 0,5 no dito acima não deve estar limitado a isto.
A Etapa S35 envolve uma análise de LPC de um sinal de PCM diferencial, usando-se uma ordem predeterminada, para o cálculo dos coefi- cientes de LPC e de um sinal diferencial. A Referência Não de Patente 4 descreve um exemplo da análise de LPC.
A Etapa S36 envolve a codificação dos coeficientes de correla- ção interaural (ICC), do coeficiente de LPC e da ordem de análise de LPC, todos os quais sendo calculados através do processo acima para a geração da informação de separação de downmix. Ainda, quando o valor absoluto dos coeficientes de correlação interaural (ICC) não é menor do que o limite predeterminado P_ICC, apenas uma informação de ICC deve ser transmitida como a informação de separação de downmix. Estes cálculos são repetidos quantas vezes for o número de combinações de todos os pontos de trans- missão (Etapa S31) para a obtenção de coeficientes de ICC e de LPC. A modalidade envolve a formação de um laço. É notado que a Etapa S31 en- volve determinar se cada uma das operações descritas acima nas Etapas S32 a S37 está terminada para cada e para todas as combinações dos pon- tos de transmissão. Então, na Etapa S31e, quando as operações são deter- minadas como tendo terminado para todas as combinações na Etapa S31 (Etapa S31: Sim), o processamento na FIG. 18 (o cálculo do primeiro coefi- ciente de separação de downmix) é terminado. Ainda, quando as operações são determinadas como não tendo terminado para todas as combinações na Etapa S31 (Etapa S31: Não), as operações nas Etapas S32 a S37 são inici- adas em uma das combinações não tendo terminado.
A FIG. 17 é um fluxograma que mostra um cálculo de um se- gundo coeficiente de separação de downmix na unidade de sintetização de fluxo 100.
A informação de separação de downmix também pode ser calcu- lada de acordo com o fluxograma na FIG. 17. De acordo com a Expressão 3 (referenciada acima), a Etapa S22 envolve o cálculo dos coeficientes de cor- relação interaural (ICC) dos PCMS 1 e 2 dos PCMS 1 e 2 nos quais os sinais de codificação de downmix 201 e 204 (FIG. 6) a partir dos respectivos pon- tos 1 e 2 são codificados. Em seguida, a Etapa S23 envolve detectar se o valor absoluto dos coeficientes de correlação interaural (ICC) é maior ou menor do que o limite predeterminado P_ICC. Quando o valor absoluto é menor do que o PJCC (Etapa S23: Sim), a Etapa S24 envolve o cálculo da diferença de nível interaural (ILD) a partir dos sinais de PCM 1 e 2, de acor- do com a Expressão 2. Os ILD e ICC calculados são transmitidos como a informação de separação de downmix. Quando o valor absoluto dos coefici- entes de correlação interaural (ICC) não é menor do que o limite predetermi- nado PJCC (Etapa S23: Não), apenas a informação de carcaças internas deve ser codificada e transmitida (Etapa S26). Estes cálculos são repetidos quantas vezes for o número de combinações de todos os pontos de trans- missão (Etapa S21: Não), de modo a se proverem os coeficientes de ICC, ILD e LPC. Quando um ponto de saída da unidade de sintetização de fluxo 100 é o ponto 3 na modalidade, o ICC e a ILD são calculados para a combi- nação dos pontos 1 e 2. De modo similar, quando um ponto de saída é o ponto 1, o ICC, a ILD e o LPC descritos acima são calculados para os sinais de downmix dos pontos 2 e 3. Os cálculos acima descreveram o caso tendo três pontos. Contudo, o número de pontos não deve estar limitado a três. Os cálculos são aplicáveis ao caso em que três ou mais pontos são encontra- dos.
É notado que a Etapa S21 envolve determinar se cada uma das operações descritas acima nas Etapas S21 a S26 está ou não finalizada pa- ra cada uma e para todas as combinações dos pontos de transmissão. En- tão, na Etapa S21, quando as operações são determinadas como tendo sido terminadas para todas as combinações na Etapa S21 (Etapa S21: Sim), o processamento na FIG. 17 (o cálculo do segundo coeficiente de separação de downmix) termina. Ainda, na Etapa S21, quando as operações são de- terminadas como não tendo sido terminadas para todas as combinações (Etapa S21: Não), as operações nas Etapas S32 a S37 são iniciadas em uma das combinações não tendo sido terminadas.
A FIG. 19 ilustra uma estrutura da informação de separação de downmix (separação de DMX).
A posição de começo da informação de separação de downmix é uma região que mostra que a informação subseqüente é uma informação de separação de downmix, a qual identifica a informação subseqüente como uma informação de separação de downmix ou uma informação estendida em cada um dos pontos. Seguindo-se à região, a informação de separação de downmix armazena uma informação de comprimento de um código de sepa- ração de DMX indicando o número de bytes que a informação de separação de downmix inteira tem. Seguindo-se à informação de comprimento, a infor- mação de separação de downmix armazena o número de coeficientes de correlação interaural (ICC). Este número corresponde ao número de combi- nações de todos os pontos de transmissão descritos acima. A informação de separação de downmix também mantém o número de pedaços de informa- ção de diferença de nível (ILD) entre canais e um valor de cada um dos pe- daços de ILD. Seguindo-se ao número de pedaços e ao valor de ILD1 a in- formação de separação de downmix mantém a ordem de análise de LPC obtida pela análise de LPC e cada um dos coeficientes de LPC. Seguindo-se à informação de separação de DMX (informação de separação de downmix) está a informação estendida para separação de cada um dos pontos e si- nais. No caso da FIG. 19, cada pedaço de informação estendida (a informa- ção estendida 1402 e a informação estendida 1403) é provida para a infor- mação de separação de downmix conforme mostrado na fIG. 15. Assim, no ponto de começo, a informação de separação de downmix inclui, como uma extensão 6, um código de identificação de qual informação estendida é um sinal separando o "ponto 2 e o ponto 6". Após o código de identificação, a informação de árvore de divisão mostrada na FIG. 20 é mantida, seguida pelos coeficientes estendidos para os circuitos de separação CeD (um coe- ficiente de ICC e um coeficiente de ILD).
Conforme descrito acima, uma comutação do conteúdo da in- formação de separação de downmix de acordo com um valor absoluto variá- vel dos coeficientes de correlação interaural (ICC) é efetiva na redução da quantidade de cálculo requerida para o cálculo da informação de separação de downmix em uma MCU.
É notado que a modalidade exemplifica a técnica de MPEG-AAC como o sinal de downmix. Quando o sinal de downmix usa uma técnica de codificação com a análise de LPC1 os fluxos podem ser sintetizados por um processamento de adição aritmética e de interpolação linear com o uso dos coeficientes de LSP obtidos como resultado da análise LPC1 quando do cál- culo da informação de separação de downmix acima. Em outras palavras, isto significa que a informação de separação de downmix pode ser calculada em um estado de um fluxo de bit, o qual usualmente torna desnecessária uma codificação sob uma carga pesada e, assim, facilmente torna possível obter a informação de separação de downmix. A técnica de TwinVQ descrita na Referência Não de Patente 5 exemplifica uma técnica para uso da análise de LPC para codificação.
Uma técnica convencional não atribui uma informação de sepa- ração de downmix a um fluxo de forma alguma. Além dos parâmetros de separação de sinal típicos (diferença de nível interaural (ILD) e coeficientes de correlação interaural (ICC)), a unidade de sintetização de fluxo 100 na presente invenção ainda transmite um coeficiente de LPC de um PCM dife- rencial.
Aqui, a análise de LPC é provida para o PCM diferencial, ao in- vés de para os PCMS 1 e 2, porque isto torna possível comprimir a faixa di- nâmica de um sinal acústico. Isto resulta na implementação de uma estrutu- ra de circuito que elimina a necessidade de uma faixa dinâmica larga para uma unidade de decodificação, o que é benéfico na redução de um custo de circuito. Como de costume, a provisão da análise de LPC para o PCM dife- rencial contribui para um melhoramento em uma performance para separa- ção de um sinal de downmix. A informação de separação de downmix 208 (FIG. 5) é calculada e codificada entre os PCMS 1 e 2. Um downmix adicio- nal dos sinais codificados de downmix nos pontos 1 e 2, possivelmente ten- do características acústicas totalmente diferentes, elimina as características acústicas as quais os sinais codificados de downmix tinham originalmente. As características acústicas eliminadas não podem ser recuperadas pela extensão dos sinais com as características acústicas eliminadas. Daí, a ge- ração da informação estendida do sinal codificado de downmix, conforme descrito acima, é essencial, de modo a se reterem as características acústi- cas sem se aumentar uma quantidade de informação como possível.
O sinal codificado de downmix 207 (FIG. 5 e 6) e a informação de separação de downmix 208 (FIG. 5), os quais são obtidos acima, e a in- formação estendida 202, 203, 204 e 205, todas as quais sendo incluídas na informação codificada 101 e na 102 (FIG. 5) são multiplexados pelo circuito de multiplexação 106 (FIG. 4), e transmitidos para o ponto 3 como uma in- formação codificada 107, pela unidade de saída 12 (FIG. 4).
Em seguida, uma unidade de decodificação recebendo o sinal codificado de downmix e a informação estendida deve ser descrita. Uma u- nidade de decodificação A (FIG. 5) primeiramente separa o sinal de downmix e o sinal estendido, e, então, decodifica o sinal codificado de downmix em um circuito de codificação predeterminado. É notado que o processo descrito na Referência Não de Patente 2 é adotado quando a técnica de MPEG-AAC é utilizada. Com base no sinal de PCM decodificado obtido como resultado da decodificação e da informação estendida separada mencionada anterior- mente, sinais acústicos plurais independentes são decodificados. As FIG. 7 e 8 mostram um exemplo do circuito de decodificação.
É notado que a unidade de decodificação A é, por exemplo, um bloco funcional de uma função realizada no ponto 3. Para se ser mais espe- cífico, a unidade de decodificação A é um bloco funcional de uma função a ser realizada por um computador no ponto 3 que executa um software arma- zenado no computador.
A FIG. 7 ilustra a unidade de decodificação A (FIG. 5).
Citando o ponto 1 como um exemplo, a unidade de decodifica- ção A na FIG. 7, incluindo os circuitos de separação 603 e 604 conectados em um estágio múltiplo, recebe um sinal de downmix 601 e um sinal esten- dido 602 ambos obtidos como sinais de PCM. O circuito de OTT e o circuito de TTT do MPEG-Surround mostrado na Referência Não de Patente 3 são exemplificados como circuitos de separação. A FIG. 8 exemplifica um circui- to de separação simples.
A FIG. 8 mostra um circuito de separação 709 incluído na unida- de de decodificação A. Com base em: o sinal de entrada 701, a diferença de nível inte- raural (ILD) (referida como a informação de separação (diferença de nível interaural) 703 na FIG. 8 descrita nas Expressões 2 e 3; e os coeficientes de correlação interaural (ICC) (referidos como a informação de separação (valor de correlação) 702 na FIG. 8), a unidade de decodificação A primeiramente faz com que um circuito de descorrelação 704 para descorrelacionar o sinal de entrada 701. É notado que o circuito descorrelacionador na Referência Não de Patente 3 executa a operação acima. A descorrelação pelo circuito de descorrelação 704 não está limitada a isto. A Referência Não de Patente 6, por exemplo, mostra uma técnica para descorrelação do sinal, utilizando o algoritmo de Levinson-Durbin.
O sinal de entrada 701 viaja através do circuito de descorrelação 704 e tem o ganho controlado pelos circuitos de controle de ganho 705 e 706. Então, sinais separados 707 e 708 são obtidos.
Com base na diferença de nível interaural (ILD) 703, os circuitos
de controle de ganho 705 e 706 executam os cálculos a seguir: (Expressão 6) Sigl = Deco(lnput801(n))*Gain(i) (Expressão 7) Sig2 = Deco(lnput801(n))*(1 - Gain(i)) onde o operador Dec denota uma descorrelação do sinal, e Sigl e Sig2 denotam os sinais separados 707 e 708 (FIG. 8). Uma seqüência do processamento descrito acima permite que os sinais monofônicos ou estere- ofônicos plurais independentes desejados sejam decodificados a partir do sinal codificado estendido de downmix.
É notado que um aparelho de codificação e uma unidade de de- codificação, usando a técnica de MPEG-Surround, descrita na Referência Não de Patente 3, podem ser usados nos processos para o cálculo da infor- mação estendida e para a decodificação dos sinais independentes originais do sinal de downmix e a informação estendida ambos obtidos como os sinais de PCM. A técnica de codificação usada nos processos não está limitada à técnica de MPEG-Surround. Mais ainda, a técnica de codificação usada nos processos não deve estar limitada à técnica de MPEG-Surround. Como de costume, a presente invenção é efetiva para uma técnica de codificação es- pacial de multicanal paramétrica (incluindo a técnica de MP3 Surround), a qual codifica e decodifica um sinal de multicanal com um sinal de downmix e a informação estendida.
A FIG. 11 mostra um circuito de conformação de downmix 104a. A unidade de sintetização de fluxo 100 pode incluir o circuito de conforma- ção de downmix 104a.
O dito acima exemplificou a unidade de sintetização de fluxo 100 decodificando temporalmente os sinais codificados de downmix separados nos sinais de PCM, e fazendo um downmix nos sinais de PCM. O que vem a seguir é um outro exemplo de decodificação e downmix. Na técnica de MPEG-AAC, um processo de decodificação de sinais de downmix providos para o circuito de conformação de downmix 104a (FIG. 11) é descrito na Re- ferência Não de Patente 1. Um esboço da decodificação envolve a decodifi- cação dos sinais de downmix separados nos sinais de PCM através de cada uma de uma análise da informação codificada, uma quantificação inversa e uma transformada de tempo - freqüência. Mediante a análise da informação codificada, cada um dos sinais de downmix providos 201 e 204 é quantifica- do inversamente (requantificação) por uma unidade de quantificação inversa 1001. Um processo detalhado descrito na Referência Não de Patente 1 é resumido abaixo. Cada uma das unidades de quantificação inversa 1001 calcula uma informação espectral (Spec(n)), conforme se segue: (Expressão 8) Spec(n) = Gain(n)*2^(QuantizeValue(n)*4 / 3) onde QuantizeValue(n) é um valor quantificado obtido pelo downmix, e Gain(n) é um ganho quantificado do quadro.
A realização de uma quantificação inversa em cada um dos si- nais de downmix 201 e 204 providos obtém dois pedaços de dados espec- trais (Spec201(n) e Spec204(n)). Uma unidade adição 104aX adiciona esses pedaços de dados espectrais, usando a Expressão 9, para a obtenção de um espectro sinterizado Spec(n).
(Expressão 9) Spec(n) = 0.5*Spec201 (n) + 0.5*Spec204(n)
É notado que o coeficiente não está limitado a 0,5. Quaisquer coeficientes dados para Spec201(n) e Spec204(n) devem ser providos, à medida que uma relação similar à Expressão 7 se sustente. O espectro sin- tetizado obtido acima é requantificado pela unidade de quantificação 104aY com a técnica de MPEG-AAC. O resultado da requantificação é o sinal de downmix 207 incluído na informação codificada 107 (FIG. 5) provida a partir da unidade de sintetização de fluxo 100. Uma quantificação inversa seguida por uma adição significa a realização de uma adição em uma informação de freqüência. Isto elimina a necessidade de uma transformada de tempo - fre- qüência (incluindo o processamento de MDCT) requerida para a restauração dos sinais codificados de downmix separados para os sinais de PCM, permi- te que a unidade de sintetização de fluxo 100 não precise de uma perfor- mance de cálculo alta, e leva à redução de um custo de produção e de um custo de projeto da unidade de sintetização de fluxo 100.
A unidade de sintetização de fluxo 100 (MCU) implementada acima é uma modalidade da presente invenção, e não deve estar limitada a isto. Ainda, o número representado dos pedaços de informação codificada, providos pela unidade de sintetização de fluxo 100, é dois. O número, contu- do, não deve estar limitado a dois. Três ou mais pedaços de informação co- dificada devem ser adotados.
O que vem a seguir é um exemplo de modificação da primeira modalidade.
É notado na primeira modalidade que a informação de separa- ção de downmix é adicionada pela unidade de sintetização de fluxo 100. A propósito, um outro efeito pode ser observado pela adição da informação a seguir.
A FIG. 14 ilustra um sistema 1a.
A FIG. 14, por exemplo, mostra que o sistema 1a faz com que a unidade de sintetização de fluxo 100 adicione o número de sinais de entrada em cada um dos pontos, além da informação de separação de downmix 208 (FIG. 2). Na FIG. 14, o número de sinais de entrada 3 no ponto 1 e o número de sinais de entrada 3 no ponto 2 são adicionados. Então, a unidade de sin- tetização de fluxo 100 armazena um valor adicionado "6" na informação co- dificada 107 como o número de informação de sinais 1301. Assim, a unidade de sintetização de fluxo 100 transmite a informação codificada 107 para o ponto 3. Recebendo a informação codificada 107, a unidade de decodifica- ção A no ponto 3 primeiramente obtém o número de informação de sinais 1301, em cada um dos pontos de transmissão, incluído na informação codifi- cada 107. Neste momento, a separação e a extensão do sinal de downmix 207, usando a informação para separação dos sinais em cada um dos pon- tos (a informação estendida 202, 203, 205 e 206), não é realizada.
Um aparelho para a decodificação e a reprodução da informação codificada 107 inclui um aparelho de apresentação para a realização de um processamento diferente nos sinais decodificados, dependendo do número de canais de reprodução. O aparelho de apresentação classifica os sinais decodificados 1' a 5' com respeito a cada canal de reprodução. O caso em que há cinco sinais decodificados e dois canais de reprodução é exemplifi- cado conforme se segue:
(Expressão 10) o1 = s1 + 0.5*s2 +1 / ✓2*s3
o2 = s4 + 0.5*s2 +1 / ✓2*s5
onde os sinais decodificados 1 a 5 são s1 a s5, e canais de re- produção são o1 e o2, respectivamente. Um coeficiente usado para o cálculo acima é uma informação de apresentação. Como a informação de apresen- tação, um coeficiente de downmix citado na norma ITU-R BS. 775-1 é usa- do. Este coeficiente de apresentação é determinada com base na classifica- ção dos sinais de canal de reprodução pela unidade de decodificação. No exemplo acima, os sinais s1, s2, s3, s4 e s5 representam os sinais de canal dianteiro esquerdo, dianteiro, traseiro esquerdo, dianteiro direito e traseiro direito, respectivamente. Estes sinais de canal são encaminhados para um canal de saída dianteiro o1 e um canal de saída dianteiro direito o2.
Na estrutura do exemplo de modificação, a informação de apre- sentação usada pelo aparelho de apresentação é determinada quando a soma do número de sinais de entrada é detectada antes de se estender o sinal de downmix 207. Isto permite que uma porção de informação de apre- sentação e a informação codificada 107 sejam simultaneamente decodifica- das pelo cálculo em paralelo, o que leva a uma redução significativa em uma quantidade de atraso no processamento de sinal.
A FIG. 15 mostra um sistema 1b.
Quando da sintetização para transmissão da informação esten- dida de cada ponto, a unidade de sintetização de fluxo 100 na modalidade é assumida como configurando pedaços da informação estendida na ordem de prioridade de cada ponto e sinal de entrada. No caso em que o sinal de en- trada 1 do ponto 1 tem a prioridade mais alta, e um sinal de entrada 6 do ponto 2 tem a segunda prioridade mais alta, por exemplo, a informação codi- ficada 107 é formada na ordem da informação estendida 1402 (informação para separação do sinal 1 do ponto 1), seguida pela informação estendida 1403 (informação para separação do sinal 6 do ponto 2), de acordo com uma informação de prioridade 1401, conforme mostrado na FIG. 15. Esta configuração permite um processamento de arredondamento, com base na prioridade no caso em que toda a informação codificada 107 não pode ser processada quando a unidade de decodificação A decodifica a informação codificada 107 transmitida a partir da unidade de sintetização de fluxo 100 para o ponto 3. Em outras palavras, uma vez que a informação codificada 107 inclui sinais e pedaços da informação estendida dispostos na ordem de prioridade a partir da posição de começo, o dispositivo de sintetização de fluxo 100 pode arredondar a informação estendida 1403, quando o aparelho de processamento de decodificação for meramente requerido para proces- samento de um pedaço de informação estendida tendo a prioridade mais alta. Isto permite que a decodificação seja realizada apenas uma vez, redu- zindo-se o número de vezes de decodificação à metade, quantas quanto for o número de vezes de decodificação em toda a informação codificada, e, assim, leva a uma realização de uma economia mais potente no aparelho de processamento de decodificação.
A informação de prioridade 1401 é determinada conforme se segue. Em primeiro lugar, a unidade de sintetização de fluxo 100 detecta qual ponto provê um número grande de sinais (freqüência de transmissão). Então, a unidade de sintetização de fluxo 100 detecta o pedaço de informa- ção estendida transmitido mais freqüentemente dos sinais estendidos incluí- dos nos pontos transmitindo em freqüência grande. Em um outro ponto, a informação de prioridade é gerada através de um processo similar. Assim, as prioridades de todos os pontos e sinais de entrada são calculadas. De acordo com as prioridades, a unidade de sintetização de fluxo 100 rearranja os pedaços de informação estendida. Então, a unidade de sintetização de fluxo 100 usa a ordem dos pedaços da informação estendida priorizada para dispor e transmitir os pedaços de informação estendida em ordem.
A FIG. 21 é um fluxograma que mostra um processo de cálculo de prioridade.
A prioridade pode ser detectada por uma outra configuração, também. Conforme mostrado na FIG. 21, um valor de ICC de cada sinal de entrada é separado. Quando o valor de ICC é menor do que um valor NJCC predeterminado regulado pela unidade de sintetização de fluxo 100 (Etapa S42: Sim), uma ILD de coeficiente estendido é adicionalmente separada da informação estendida (Etapa S43). Assim, a prioridade é regulada de acordo com a ILD de coeficiente estendido separado. Em outras palavras, pelo cál- culo de cada um dos níveis ordinais do coeficiente de ILD incluído em todo sinal (Etapa S44), o coeficiente de ILD é regulado como a prioridade de cada sinal (Etapa S45). Enquanto a unidade de sintetização de fluxo 100 na pre- sente invenção está operando, o valor NJCC permanece constante como um valor regulado em uma fase inicial. Como de costume, a prioridade pode ser variável com um tempo decorrido avançando, conforme necessário. Uma prioridade variável com um tempo decorrido avançado torna possível um ajuste da acurácia de detecção da ordem de prioridade, o que pode realizar uma unidade de sintetização de fluxo pela primeira vez que é flexível o bas- tante para ajustar a prioridade.
Em seguida, uma descrição extra adicionada á descrição da primeira modalidade deve ser provida. É notado que a descrição extra a se- guir não deve oferecer quaisquer limitações para o conteúdo da descrição acima.
A FIG. 5 ilustra uma estrutura do sistema 1.
Em um encontro dentre usuários em cada um dos pontos, o sis- tema 1 é um sistema de teleconferência de multiponto transmitindo um sinal acústico a partir de um ponto de transmissão para um ponto de recepção e reproduzindo o sinal acústico transmitido no ponto de recepção, o sinal acús- tico o qual é incluído em uma fala do encontro. Especificamente, o 1 Especi- ficamente, o 1 transmite sinais acústicos plurais a partir do ponto de trans- missão para o ponto de recepção para fazer com que o ponto de recepção reproduza os sinais acústicos plurais, de modo que um usuário no ponto de recepção desfrute de uma atmosfera fiel à realidade.
É notado que o que vem a seguir exemplifica cada um dos pon- tos 1 e 2 a serem atribuídos como o ponto de transmissão e o ponto 3 como o ponto de recepção.
Cada um dos pontos tem microfones (não mostrados) e um computador. O computador gera uma informação codificada (a informação codificada 101 e a informação codificada 102 na FIG. 5) especificando sinais acústicos plurais (sinais de PCM), e transmite a informação codificada gera- da para a unidade de sintetização de fluxo 100, os sinais acústicos plurais os quais são capturados por cada um dos microfones. Ainda, o computador em cada um dos pontos recebe a partir da unidade de sintetização de fluxo 100 uma informação codificada (a informação codificada 107 na FIG. 5) gerada pela unidade de sintetização de fluxo 100, e reproduz cada um dos sinais acústicos especificados pela informação codificada recebida. Aqui, a infor- mação codificada 107 é gerada de acordo com a informação codificada (a informação codificada 101 e a informação codificada 102 na FIG. 5) transmi- tida a partir de um ponto para o outro além do ponto de recepção para a uni- dade de sintetização de fluxo 100.
A FIG. 4 mostra uma estrutura da unidade de sintetização de fluxo 100.
A unidade de sintetização de fluxo 100 inclui vários circuitos de separação 103, tendo o circuito de separação 103, o circuito de conformação de downmix 104, o circuito de cálculo de informação estendida 105 e o cir- cuito de multiplexação 106.
Conforme cada uma dentre a informação codificada 101, a in- formação codificada 102 e a informação codificada 107 mostra, a informação codificada inclui um sinal de DMX (o sinal codificado de downmix) e uma informação estendida. É notado que um sinal de DMX na informação codifi- cada 101 mostrada na FIG. 4 é o sinal de DMX 201, e a informação estendi- da inclui a informação estendida inteira 202 e a informação estendida 203. Ainda, o sinal de DMX na informação codificada 102 é o sinal de DMX 204, e a informação estendida inclui a informação estendida 205 e a informação estendida 206. Mais ainda, o sinal de DMX na informação codificada 107 é um sinal de DMX 207, e a informação estendida inclui a informação de sepa- ração de downmix 208, a informação estendida 203, a informação estendida 202, a informação estendida 205 e a informação estendida 206.
A informação estendida especifica as características dos sinais acústicos plurais da informação codificada na qual a informação estendida está incluída. Especificamente, a informação estendida especifica a diferen- ça de nível interaural (ILD) e os coeficientes de correlação interaural (ICC) dentre os sinais acústicos plurais. Para se ser mais específico, a informação estendida inclui dados quantificados e processados codificados por Huffman com respeito à diferença de nível interaural (ILD) e aos coeficientes de corre- lação interaural (ICC) dos sinais acústicos. Assim, a informação estendida inclui os dados processados acima para especificação da diferença de nível interaural (ILD) e dos coeficientes de correlação interaural (ICC) processa- dos, os quais são calculados a partir dos dados processados. A informação estendida tira vantagem da configuração de dados dos dados processados para o armazenamento da diferença de nível interaural (ILD) e dos coeficien- tes de correlação interaural (ICC). Em outras palavras, a informação esten- dida tem uma configuração de dados formada nos dados processados acima como uma configuração de dados física. A informação estendida também inclui uma configuração de dados da diferença de nível interaural (ILD) e dos coeficientes de correlação interaural (ICC) como uma configuração de dados lógica a ser armazenada, devido à configuração de dados física.
O sinal de DMX é incluído na informação codificada indicando os sinais acústicos plurais. Os sinais acústicos sofrem um downmix para serem um sinal de PCM de downmix, e o sinal de PCM de downmix é codificado para ser o sinal de DMX.
Os circuitos de separação plurais 103 separam, cada um, um sinal de DMX correspondente e uma informação estendida a partir de um pedaço de informação codificada (a informação codificada 101 e a informa- ção codificada 102) transmitida a partir dos pontos de transmissão plurais (os pontos 1 e 2 na FIG. 5) para a unidade de sintetização de fluxo 100.
É notado que a informação codificada a ser transmitida a partir do ponto de transmissão e recebido pela unidade de sintetização de fluxo 100 (a informação codificada 101 e a informação codificada 102) é referida como a informação codificada a ser recebida. A propósito, a informação co- dificada transmitida pela unidade de sintetização de fluxo 100 e recebida no ponto de recepção (a informação codificada 107) é referida como a informa- ção codificada a ser transmitida.
Especificamente, cada um dos circuitos de separação plurais 103 separa um pedaço correspondente da informação codificada.
É notado que cada um dos circuitos de separação plurais 103 é um bloco funcional de uma função implementada na unidade de sintetização de fluxo 100, por exemplo, por um software. Estes blocos funcionais podem operar, por exemplo, em paralelo uns aos outros.
O circuito de conformação de downmix 104 e o circuito de cálcu- lo de informação estendida 105 geram o sinal de DMX 207 e a informação de separação de downmix 208 na informação codificada 107 (FIG. 4 e 5) a ser transmitida para o ponto de recepção (o ponto 3 na FIG. 5) de acordo com cada um dos sinais de DMX (o ponto 3 na FIG. 5) de acordo com os sinais de DMX (os sinais de DMX 201 e 204: FIG. 4) e cada pedaço da in- formação estendida separada pelos circuitos de separação plurais 103.
A FIG. 6 exemplifica uma estrutura do circuito de conformação de downmix 104 (FIG. 4). É notado que a estrutura mostrada na FIG. 6 é um exemplo. O circuito de conformação de downmix 104 e o circuito de cálculo de informação estendida 105 tendo a função acima podem ser em uma es- trutura a qual não inclui qualquer uma ou alguma parte da estrutura na FIG. O circuito de conformação de downmix 104 inclui os circuitos de decodificação (os circuitos de decodificação 501 e 502), o circuito de down- mix 503 e o circuito de codificação 504.
Cada um dos circuitos de decodificação plurais (cada um dos circuitos de decodificação 501 e similares: FIG. 6) decodifica o sinal de DMX (os sinais de DMX 201 e 204: FIG. 6 e 5) no sinal de PCM de downmix, o sinal de DMX o qual é separado da informação codificada do ponto de transmissão associado (os pontos 1 e 2 na FIG. 5).
Em seguida, o circuito de cálculo de informação estendida 105 (FIG. 4) calcula a informação de separação de downmix 208 (FIG. 5) com base nos sinais de PCM de downmix decodificados, cada um dos quais sen- do a partir do ponto de transmissão correspondente.
Então, o circuito de downmix 503 (FIG. 6) usa a informação de separação de downmix 208 calculada pelo circuito de cálculo de informação estendida 105 para: fazer um downmix de cada um dos sinais de PCM de downmix, os quais são a partir do ponto de transmissão correspondente e decodificados pelo circuito de decodificação associado (o circuito de decodi- ficação 501 e similares); e para gerar um sinal de PCM de downmix.
Assim, o circuito de codificação 504 codifica o sinal de PCM de downmix para a provisão do sinal de downmix 207 (veja a FIG. 5). O circuito de multiplexação 106 (FIG. 4) gera a informação codi- ficada 107 (FIG. 4) gera a informação codificada 107 (FIG. 4 e 5) com base no sinal de downmix 207 gerado pelo circuito de conformação de downmix 104 e na informação de separação de downmix 208 calculada pelo circuito de cálculo de informação estendida 105. Especificamente, com base no sinal de downmix 207, na informação de separação de downmix 208 e nos peda- ços de informação estendida (a informação estendida 202, a informação es- tendida 203, a informação estendida 205 e a informação estendida 206), a qual é a partir de cada um dos pontos de transmissão (os pontos 1 e 2 na FIG. 5) e são separados pelos circuitos de separação plurais 103, o circuito de multiplexação 106 gera a informação codificada 107 incluindo o sinal de downmix 207, a informação de separação de downmix 208 e os pedaços de informação estendida a partir de cada um dos pontos de transmissão.
A propósito, o ponto de recepção (o ponto 3) tem uma unidade de decodificação (a unidade de decodificação A: FIG. 5) decodificando a in- formação codificada 107 transmitida para o ponto de recepção pela unidade de sintetização de fluxo 100 para a geração de cada um dos sinais acústicos (sinais de PCM) especificados pela informação codificada 107.
A unidade de decodificação A decodifica a informação codificada 107 (FIG. 4 e 5) transmitida a partir da unidade de sintetização de fluxo 100 para o computador no ponto 3. A unidade de decodificação A decodifica a informação codificada 107 para a geração dos sinais de DMX (os sinais de DMX 201 e 204 na FIG. 5) e dos pedaços de informação estendida (a infor- mação estendida 202, a informação estendida 203, a informação estendida 205 e a informação estendida 206). A unidade de decodificação A usa cada pedaço de informação gerada para a geração de cada um dos sinais acústi- cos no ponto de transmissão associado e para reprodução de cada um dos sinais acústicos gerados.
A FIG. 8 ilustra o circuito de separação 709 incluído na unidade de decodificação A.
Além do sinal de entrada 701, do valor de correlação 702 e da diferença de nível interaural (ILD) 703, o circuito de separação 709 gera os sinais separados 707 e 708 separados do sinal de entrada 701.
O sinal de entrada 701, por exemplo, é o sinal de downmix 207 incluído na informação codificada 107, o qual a unidade de sintetização de fluxo 100 transmite para o ponto 3. Mais ainda, o sinal de entrada 701, por exemplo, é a informação codificada obtida a partir do sinal de downmix 207 através de uma decodificação (decodificação de downmix) mais de uma vez com o uso da informação de separação (incluindo a informação de separa- ção de downmix 208 (FIG. 5) e a informação estendida 202 (FIG. 5)).
O valor de correlação 702 é um coeficiente de correlação inte- raural (ICC) da informação estendida para decodificação do sinal de entrada 701. A diferença de nível interaural (ILD) 703 é uma diferença de ní- vel interaural (ILD) da informação estendida para decodificação do sinal de entrada 701.
O circuito de separação 709 inclui o circuito de descorrelação 704 e os circuitos de controle de ganho 705 e 706.
O circuito de descorrelação 704 descorrelaciona o sinal de en- trada 701 com o uso do valor de correlação 702 para a geração de dois ou mais sinais intermediários não correlacionados.
Cada um dos circuitos de controle de ganho 705 e 706 usa a diferença de nível interaural (ILD) 703 para ajuste do ganho de cada um dos sinais intermediários gerados. Os circuitos de controle de ganho 705 e 706 realizam o ajuste dos sinais gerados 707 e 708, os quais são separados do sinal de entrada 701.
A FIG. 7 ilustra uma estrutura da unidade de decodificação A.
A unidade de decodificação A inclui os circuitos de separação 603 e 604. O circuito de separação 709 na FIG. 8 é um exemplo dos circui- tos de separação 603 e 604.
Os circuitos de separação 603 e 604 realizam uma decodifica- ção da informação codificada mais de uma vez para decodificação do sinal de DMX de cada ponto de transmissão (os sinais de DMX 201 e 204) do si- nal de DMX 601 na informação codificada 107 (FIG. 5) recebida no ponto de recepção (o ponto 3). Assim sendo, os sinais acústicos plurais capturados em cada ponto são decodificados.
É notado que o sistema 1 pode ser estruturado conforme mos- trado na FIG. 22.
A FIG. 22 ilustra um processo da unidade de sintetização de flu- xo 100 transmitindo a informação codificada para cada um dos pontos 1 a 3.
A FIG. 22 mostra que cada um dos blocos funcionais na unidade de sintetização de fluxo 100 (FIG. 4) realiza a operação a seguir.
A unidade de entrada 11 (FIG. 4) provê um pedaço da informa- ção codificada (não mostrada) a partir dos pontos 1 a 3 para a unidade de sintetização de fluxo 100. É notado que a informação codificada provida a partir do ponto η (n = 1, 2 e 3) é referida como a informação codificada intro- duzida do ponto n. Mais ainda, um sinal de DMX incluído na informação co- dificada introduzida do ponto η é referida como um sinal de DMX introduzido de ponto n. Mais ainda, a informação estendida incluída na informação codi- ficada introduzida do ponto η é referida como a informação estendida intro- duzida do ponto n.
Uma unidade de saída 12 extrai os pedaços de informação codi- ficada (a informação codificada a ser extraída 107a, a informação codificada a ser extraída 107b e a informação codificada a ser extraída 107c: FIG. 22) para cada um dos pontos 1 a 3. É notado que a informação codificada a ser extraída para o ponto η é referida como a informação codificada a ser extraí- da para o ponto n.
Cada uma das informações codificadas a serem extraídas 107a a 107c inclui um sinal de downmix de saída comum 207x como um sinal de DMX incluído em cada uma das informações codificadas a serem extraídas. Em outras palavras, qualquer conteúdo do sinal de DMX incluído nas infor- mações codificadas a serem extraídas 107a a 107c é o sinal de downmix de saída comum 207x, e a mesma que cada outra. Então, cada uma das infor- mações codificadas a serem extraídas 107a a 107c inclui, como a informa- ção estendida, a informação estendida a ser extraída H1, a informação es- tendida a ser extraída H2 e a informação estendida a ser extraída H3, res- pectivamente. Os pedaços da informação estendida a ser extraída H1 a H3 em cada um dos pontos são diferentes de cada outro.
O sinal de downmix de saída comum 207x é um sinal de DMX com o sinal de DMX introduzido associado nos pontos 1 a 3 decodificados. Em outras palavras, o sinal de downmix de saída comum 207x é decodifica- do em três sinais de DMX introduzidos; especificamente, os sinais de DMX introduzidos nos pontos 1 a 3.
Em seguida, a informação estendida a ser extraída H1 no ponto 1 deve ser descrita de cada um dos pedaços da informação estendida a ser extraída (a informação estendida a ser extraída H1 a H3).
A informação codificada a ser extraída 107a encaminhada para o ponto 1 inclui como a informação de separação de downmix a informação de separação de downmix H11 para separação de um ponto de modo a se decodificar cada um dos sinais de DMX introduzidos no ponto associado (os pontos 2 e 3), outro além do ponto 1, o ponto alvo. Ainda, a informação codi- ficada a ser extraída 107a encaminhada para o ponto 1 inclui a informação estendida introduzida do ponto 2 e a informação estendida introduzida do ponto 3. Em outras palavras, a informação codificada a ser extraída 107a inclui cada pedaço da informação estendida introduzida no outro ponto as- sociado (os pontos 2 e 3). Daí, a informação estendida a ser extraída H1 é uma informação estendida para decodificação dos sinais acústicos dos ou- tros pontos associados (os pontos 2 e 3) dos sinais de downmix de saída comum 207x.
É notado que os pedaços da informação estendida a ser extraí- da (a informação estendida a ser extraída H1 a H3), incluídos na informação estendida a ser extraída do ponto n, são referidos como a informação esten- dida a ser extraída do ponto n.
Cada pedaço da informação estendida a ser extraída H1 do pon- to 1 para a informação estendida a ser extraída H3 do ponto 3 tem uma con- figuração similar à informação estendida descrita acima a ser extraída H1 do ponto 1.
Em outras palavras, cada um dos pedaços da informação esten- dida a ser extraída dos pontos 1 a 3 (a informação estendida a ser extraída H1, por exemplo) inclui: a informação estendida introduzida (a informação estendida introduzida do ponto 2 e a informação estendida introduzida do ponto 3, por exemplo) a partir de cada um dos pontos (os pontos 2 e 3, por exemplo), outros além do ponto da informação estendida a ser extraída (o ponto 1, por exemplo); e a informação de separação de downmix (a informa- ção de separação de downmix H11, por exemplo) para a decodificação do sinal acústico de cada um dos outros pontos (os pontos 2 e 3, por exemplo) do sinal de downmix comum 207x.
Uma unidade de geração de informação codificada a ser extraí- da 13 (FIG. 4) gera cada pedaço da informação codificada a ser extraída (a informação codificada a ser extraída 107a a 107c) para os pontos 1 a 3, com base no pedaço associado de informação codificada introduzida recebida pela unidade de sintetização de fluxo 100.
Especificamente, o circuito de conformação de downmix 104 na unidade de geração de informação codificada a ser extraída 13 gera o sinal de downmix de saída comum 207x. Além disso, a circuito de cálculo de in- formação estendida 105 gera a informação estendida a ser extraída H1 a H3. Então, o circuito de multiplexação 106 gera os pedaços de informação codificada a ser extraída (a informação codificada a ser extraída 107a a 107c) para cada um dos pontos com base no sinal de downmix de saída comum 207x gerado e os pedaços de informação estendida a ser extraída H1 a H3.
A unidade de saída 12 (FIG. 4) extrai cada um dos pedaços ge- rados da informação codificada a ser extraída (a informação codificada a ser extraída 107a a 107c) para o ponto associado para a informação codificada a ser extraída.
Conforme descrito acima, uma unidade de sintetização de fluxo (a unidade de sintetização de fluxo 100) inclui a unidade de entrada 11, a unidade de geração de informação codificada a ser extraída 13 e a unidade de saída 12. Aqui, a unidade de entrada 11 introduz dois ou mais sinais codi- ficados (informação codificada a ser extraída) incluindo: um primeiro sinal acústico de downmix (o sinal de DMX introduzido) com um sinal acústico codificado, o sinal acústico o qual tem dois ou mais sinais de som que sofre- ram um downmix; e o sinal estendido (informação estendida introduzida) pa- ra a obtenção de dois ou mais dos sinais de som a partir do primeiro sinal acústico de downmix. A unidade de geração de informação codificada a ser extraída 13 gera: um segundo sinal acústico de downmix (o sinal de downmix de saída comum 207x) para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido (a informação de separação de downmix H11) para a obtenção de cada um dos primeiros sinais acústicos de downmix (os sinais de DMX introduzidos nos pontos 1 e 2) a partir do se- gundo sinal acústico de downmix, com base em cada um dos sinais codifi- cados (a informação codificada introduzida no ponto 1 e a informação codifi- cada introduzida no ponto 2, por exemplo) introduzidos pela unidade de saí- da 12; e o sinal codificado (a informação codificada a ser extraída 107a a ser provida para o ponto 1) incluindo o segundo sinal acústico de downmix gera- do (o sinal de downmix de saída comum 207x), o sinal estendido gerado (a informação de separação de downmix H11), e cada um dos sinais estendi- dos (a informação estendida H12). A unidade de saída 112 extrai o sinal codi- ficado gerado.
Na unidade de sintetização de fluxo (a unidade de sintetização de fluxo 100), a unidade de entrada 11 introduz os sinais codificados (infor- mação codificada introduzida) a partir dos destinos de entrada - saída pre- determinados associados (os pontos 1 a 3), a unidade de saída 12 extrai os sinais codificados (a informação codificada a ser extraída) para os destinos de entrada - saída associados, e a unidade de geração de informação codi- ficada a ser extraída 13 gera um de cada um dos segundos sinais acústicos de downmix descritos acima (o sinal de downmix de saída comum 207x) e quantos dos sinais estendidos (a informação estendida a ser extraída H1, a informação estendida a ser extraída H2 e a informação estendida a ser ex- traída H3) quanto for o número de destinos de entrada - saída. O segundo sinal acústico de downmix gerado é um sinal acústico de downmix para a obtenção de cada um dos segundos sinais acústicos de downmix (cada um dos sinais de DMX introduzidos) incluídos no sinal codificado associado in- troduzido a partir do destino de entrada - saída correspondente. Cada um dos sinais estendidos gerados (a informação estendida H1, por exemplo): corresponde ao destino de entrada - saída associado (o ponto 1, por exem- plo) o qual é diferente de cada outro; e apenas inclui o sinal estendido (cada pedaço de informação estendida introduzida a partir dos pontos 2 e 3) dos destinos de entrada - saída (os pontos 2 e 3), outros além do destino de en- trada - saída correspondente (o ponto 1). A unidade de saída 12 extrai cada um dos sinais codificados gerados pela informação codificada a ser extraída 13 para o destino de entrada - saída (o ponto 1) ao qual o sinal estendido (a informação estendida a ser extraída H1, por exemplo) incluído no sinal codi- ficado corresponde.
Então, o sinal estendido (a informação estendida 202 inteira e a informação estendida 203 na FIG. 5, por exemplo) inclui partes plurais de sinal estendido (cada pedaço da informação estendida 202 e da informação estendida 203). Na unidade de sintetização de fluxo 100, o sinal de som (si- nal 3) é obtido a partir do sinal codificado (a informação codificada 101), u- sando-se algumas partes do sinal estendido (a informação estendida 202), correspondente a um sinal de som (o sinal 3 no ponto 1, por exemplo) a par- tir das partes plurais do sinal estendido.
O circuito de conformação de downmix 104 e o circuito de cálcu- lo de informação estendida 105 podem processar, em intervalos predetermi- nados, tal como de 40 milissegundos, as partes de intervalo na informação codificada introduzida. Microfones no ponto 1 podem capturar sinais acústi- cos a partir de usuários diferentes uns dos outros. O número de usuários comparecendo ao encontro pode variar, de modo que se possa mudar o número de sinais acústicos capturados. O número de sinais acústicos pode variar, os sinais acústicos os quais a informação codificada (a informação codificada 101) encaminhou para a unidade de sintetização de fluxo 100 fa- zer o downmix.
(Segunda Modalidade)
A FIG. 9 mostra um sistema 1c que inclui pontos plurais estabe- lecendo conexões em cada outro através da unidade de sintetização de fluxo 100 descrita na primeira modalidade.
No ponto 1, a informação estendida 802 inclui os sinais 1 e 2, e o sinal estendido 803 inclui um sinal de downmix com o qual os sinais 1 e 2 sofrem um downmix e o sinal 3. Os detalhes são descritos na primeira moda- lidade. De modo similar no ponto 2, a informação estendida 805 é calculada a partir dos sinais 4 e 5, a informação estendida 806 dos sinais 6 e 7, e a informação estendida 807 de um sinal de downmix com o qual os sinais 4 e 5 sofrem um downmix e um sinal de downmix com o qual os sinais 6 e 7 so- frem um downmix. A informação estendida é similar a um coeficiente do cir- cuito de OTT na técnica de MPEG-Surround. Em cada um dos pontos, além disso, os sinais codificados de downmix 801 e 804 com sinais introduzidos que sofreram o downmix e foram codificados no formato de MPEG-AAC, são gerados para serem transmitidos para a unidade de sintetização de fluxo 100 descrita na primeira modalidade através de uma rede.
Aqui, como a informação estendida na informação codificada 107 transmitida para o ponto 3, uma informação é atribuída para mostrar a partir de qual ponto a informação codificada foi transmitida. A técnica con- vencional não transmite a informação em um ponto apesar de tudo, e, assim, não pode controlar para separadamente reproduzir os pontos 1 e 2, quando da reprodução no ponto 3. Contudo, a segunda modalidade codifica para encaminhar a informação, para o ponto 3, indicando a partir de qual ponto a informação codificada é transmitida como a informação codificada mostrada na segunda modalidade. Isto torna possível controlar separadamente os pontos 1 e 2 quando da decodificação no ponto 3. A reprodução de uma voz de cada um dos sinais acústicos no ponto 1 em um alto-falante esquerdo e uma voz de cada um dos sinais acústicos no ponto 2 em um alto-falante di- reito permite uma reprodução fiel à realidade, o que facilita uma comunica- ção entre cada um dos pontos.
A FIG. 10 exemplifica uma string de código na informação codifi- cada recebida 107.
A FIG. 10 mostra um exemplo quando a informação codificada 107 inclui a informação de ponto 908. A informação codificada 107 na FIG. 10 inclui a informação de ponto 908 na informação estendida 904.
Em primeiro lugar, uma informação é atribuída ao ponto de co- meço da informação codificada 107 para mostrar a informação estendida seguinte. A informação é uma informação de árvore 901 na FIG. 10. A infor- mação estendida, para separação de um sinal de downmix, transmite uma informação sobre como a separação é executada, no caso em que sinais de downmix plurais são encontrados. Na FIG. 9, por exemplo, o sinal estendido 802 transmite uma informação para determinar qual sinal é separado a ser provido para qual canal, uma vez que o sinal estendido 802 mantém uma diferença de nível interaural (ILD) e coeficientes de correlação interaural (ICC). Conforme mostrado na FIG. 9, o sinal 1 é gerado por. uma separação de um sinal de DMX 808 e uma separação de DMX (informação de separa- ção de downmix) 809 para a provisão de um primeiro canal; uma separação do primeiro canal provido com o uso da informação estendida 803 para a provisão de um primeiro canal; e, então, a separação do primeiro canal pro- vido com o uso da informação estendida 802 para a provisão de um primeiro canal como o sinal 1. De modo similar, o sinal 2 é gerado por: uma separa- ção do sinal de DMX 808 e a separação de DMX (informação de separação de downmix) 809 para a provisão de um primeiro canal; a separação do pri- meiro canal provido com o uso da informação estendida 803 para a provisão de um primeiro canal; e, então, a separação do primeiro canal provido com o uso da informação estendida 802 para a provisão de um segundo canal co- mo o sinal 2. O sinal 3 é gerado pela separação do sinal de DMX 808 e pela separação de DMX (informação de separação de downmix) 809 para a pro- visão de um primeiro canal, e, então, a separação do primeiro canal provido com o uso da informação estendida para a provisão de um segundo canal como o sinal 3. Conforme descrito acima, o sinal estendido 802 transmite a informação sobre o sinal estabelecendo uma conexão para qual circuito de separação e encaminhada para qual canal.
Por exemplo, a informação estendida 904 inclui uma informação de determinação 907 para a identificação da informação estendida 904 como a informação estendida para separação do sinal codificado de downmix ou como a informação estendida para separação dos sinais em uma base de ponto. Aqui, a informação estendida 904, separando os sinais em uma base de ponto (separando os sinais 1 e 2) armazena a informação sobre a "sepa- ração em uma base de ponto". Além do acima, a informação estendida 904 inclui: uma informação de ponto informação de ponto 908 indicando a partir da qual ponto cada pedaço de informação estendida é transmitido (aqui, in- dicando o ponto 1); e a informação estendida 909 para separação dos sinais 1 e 2, tal como a diferença de nível interaural (ILD) e os coeficientes de cor- relação interaural (ICC). De modo similar, a informação estendida 905 inclui a informação estendida indicando: uma informação na separação em uma base de ponto; uma informação no ponto 1; e uma informação estendida para separação do sinal 3 e o sinal de downmix com o qual os sinais 1 e 2 sofrem um downmix.
Um sinal de separação de DMX (informação de separação de downmix) 903 inclui uma informação indicando que a informação estendida é para a separação do sinal codificado de downmix, e uma informação esten- dida para separação dos sinais de downmix dos pontos 1 e 2.
Ainda, a metade inferior da FIG. 10 mostra uma configuração da informação de árvore 901 (FIG. 10).
Além dos sinais acima, a informação de árvore 901 indicando uma conexão de um circuito de separação é atribuída à informação codifica- da 107 a ser transmitida. A FIG. 10 mostra os detalhes. Em primeiro lugar, o número total de sinais 909 é armazenado na informação de árvore 901. A FIG. 9 mostra que o ponto 3 recebe sete sinais; especificamente, os sinais 1 a 7, e, assim, o número de sinais que 909 armazena é "7". Em seguida, a informação de árvore 901 tem uma profundidade de árvore máxima 910 para se mostrar a "profundidade" dos circuitos de separação. A FIG. 9 mostra o ponto 3 estabelecendo uma conexão em três estágios entre os circuitos de separação. Assim, a profundidade de árvore máxima 910 armazena "3" co- mo a informação de profundidade. Então, a informação de árvore 901 man- tém uma informação sobre o prosseguimento de canais de saída para sepa- ração do sinal 1 como um coeficiente de árvore 911 para o sinal 1. De modo a se separar o sinal 1, o sinal de DMX 808 e a separação de DMX (informa- ção de separação de downmix) 809 são separados para a provisão do pri- meiro canal, e o primeiro canal provido é adicionalmente separado pela in- formação estendida 803 para a provisão do primeiro canal, e o primeiro ca- nal provido é adicionalmente separado com o uso da informação estendida 802 para a provisão do primeiro canal. Assim, um coeficiente tendo zeros de três dígitos é mantido. De modo similar, os canais são precedidos a partir do primeiro canal através do primeiro canal para o segundo canal, de modo a se separar o sinal 2. Assim, "001" é mantido como um coeficiente de árvore 912 para o sinal 2. No caso do sinal 3, os canais são procedidos a partir do primeiro canal para o segundo canal (terminando aqui). Assim, uma informa- ção indicando "01" e um fim é mantida como um coeficiente de árvore 913.
O armazenamento da informação de árvore conforme descrito acima torna possível uma fácil determinação do número de circuitos de se- paração (o circuito de OTT no MPEG-Surround) de acordo com o número de separações com base em um resultado de decodificação desejado. Esta configuração permite que a unidade de decodificação A prediga uma quanti- dade de cálculo, com base na informação de árvore, do circuito de separa- ção (o circuito de OTT no MPEG-Surround), antes de um cálculo de decodi- ficação, o que permite uma distribuição efetiva dos recursos de cálculo inclu- ídos na unidade de decodificação A. Como resultado, a distribuição geral de recursos de cálculo pode ser predita de antemão. Assim, o cálculo de valo- res de pico pode ser facilmente diversificado. A diversificação dos valores de pico de cálculo significa que o pior caso de cenário da potência de proces- samento requerida para decodificação pode ser assegurado de antemão, o que é benéfico na implementação de um relógio de processador de freqüên- cia baixa e no projeto de um circuito de codificação de economia de energia. Além disso, a distribuição dos recursos de cálculo melhora a capacidade de reutilização de uma memória de armazenamento requerida para um cálculo. Isto possivelmente provê um efeito benéfico na realização de um LSI de de- codificação projetado para poupar memória.
É notado que a FIG. 10 é mostrada como um exemplo da infor- mação de árvore 901; a propósito, a ordem do número de sinais 909 e a pro- fundidade de árvore máxima 910 não devem ser limitadas àquilo na FIG. 10. Como de costume, a informação de árvore 901 pode ser formada facilmente: de forma separada tendo o número de sinais 909, vários coeficientes de ár- vore, ou a informação de profundidade de árvore 910; ou armazenando-se a combinação dos mesmos como mostra a FIG. 10.
Além disso, a modalidade mostra o caso de transmissão do nú- mero de sinais e da informação de configuração de árvore como uma infor- mação codificada; a propósito, o número de sinais e a informação de confi- guração de árvore podem ser transmitidos separadamente da informação codificada. Uma técnica da transmissão separada é usar uma informação de inicialização a ser transmitida e recebida quando os pontos 1 a 3 estabelece- rem conexões e cada um dentre o aparelho de codificação e a unidade de decodificação estabelecerem comunicações. No caso em que o número de pontos e um número de ponto de cada ponto não mudam dinamicamente como a informação de inicialização, a transmissão do número de sinais e da informação de configuração de árvore quando da inicialização do aparelho de codificação e da unidade de decodificação em cada ponto melhora a efi- ciência de codificação da informação codificada em si, se comparado com a transmissão do número de sinais e da informação de configuração de árvore incluídos em cada um dos pedaços da informação codificada. Isto melhora a qualidade de som na mesma taxa de transmissão. No caso em que os nú- meros de sinais e pontos, o número de ponto e o número de sinais de entra- da não são transmitidos como a informação de inicialização, isto é, no caso em que os pedaços de informação são transmitidos como a informação codi- ficada em uma base de quadro, os pontos de conexão podem ser dinamica- mente dispostos em uma base de quadro. Como de costume, o número de sinais de entrada pode ser mudado em uma base de quadro. Daí, quando da utilização da presente invenção em um sistema de comunicações para transmissão e recepção de sinais de entrada, em cada ponto, atribuídos a alto-falantes associados de modo a se desfrutar de uma atmosfera fiel à rea- lidade, os alto-falantes podem ser dinamicamente comutados e, assim, os que comparecem ao encontro podem ser mudados de forma flexível, depen- dendo de uma situação.
Ainda, cada um dos sinais de entrada no ponto de transmissão associado (os pontos 1 e 2 na modalidade), conforme descrito acima, é um sinal capturado pelos microfones. A propósito, uma distância entre os micro- fones e a informação de direção em cada microfone quando captura os sons podem ser incluídas na informação codificada a ser transmitida como a in- formação de ponto. Quando a distância entre cada um dos microfones e a informação de direção de cada um dos microfones são incluídas na informa- ção codificada, a unidade de decodificação recebendo a informação codifi- cada pode omitir um processamento de decodificação, uma vez que os si- nais 1 e 3 podem ser encaminhados como um sinal único, porque uma cor- relação entre os sinais 1 e 3 possivelmente se torna alta no caso em que, por exemplo, a distância entre um microfone capturando um sinal de entrada 1 e um microfone capturando um sinal de entrada 3 é curta; especificamen- te, em 10 centímetros. A presente invenção, a qual também pode ser forma- da para se poupar potência, desfruta de uma estrutura flexível e benéfica para um sistema no qual uma conservação de potência é essencial, tal como em um sistema de teleconferência utilizando telefones celulares e uma fer- ramenta de comunicações doméstica de tamanho pequeno provendo uma atmosfera fiel à realidade.
(Terceira Modalidade)
A FIG. 11 ilustra o circuito de conformação de downmix 104a descrito acima.
O circuito de conformação de downmix 104 é estruturado como mostra a FIG. 6 na primeira modalidade. A propósito, a FIG. 11 mostra uma outra modalidade. A FIG. 11 exemplifica a recepção dos sinais de downmix 201 e 204 codificados em uma técnica de codificação estereofônica conven- cional, tais como MPEG-AAC e MP3.
Como um exemplo, o que vem a seguir descreve o caso em que os sinais de downmix 201 e 204 são codificados em uma técnica de MPEG- AAC. Como de costume, a técnica de codificação pode ser a técnica de MP3, bem como uma técnica de compressão estereofônica com perda típi- ca, incluindo TwinVQ e MPEG - Camada 2, ao invés da técnica de MPEG- AAG. Mais ainda, a técnica de codificação pode ser uma técnica de com- pressão sem perda, incluindo LPCM, a MPEG-ALS e a MPEG-SLS.
Cada um dos sinais de downmix é codificado na técnica de MPEG-AAC. A seqüência de decodificação é descrita na Referência Não de Patente 1. Um esboço da decodificação envolve a decodificação dos sinais de downmix separados nos sinais de PCM através de cada um de uma aná- lise de informação codificada, quantificação inversa e transformada de tem- po - freqüência. A modalidade deve se concentrar em um processo pós- quantificação, o qual é um ponto essencial da modalidade. Mediante uma análise da informação codificada, cada um dos sinais de downmix providos 201 e 204 é quantificado inversamente (requantificado) pela unidade de quantificação inversa 1001 associada. Um processo detalhado, descrito na Referência Não de Patente 1 é mostrado brevemente abaixo. O processo usa a Expressão 8 (veja a descrição da FIG. 11 da primeira modalidade) pa- ra a provisão da informação de espectro (Spec(n)). Aqui, QuantizeValue(n) é um valor quantificado obtido pelo downmix, e Gain(n) é um ganho quantifi- cado do quadro.
As unidades quantificadas inversamente realizam uma quantifi- cação inversa nos sinais de downmix correspondentes providos 201 e 201 para a obtenção de dois pedaços de dados espectrais (Spec201(n) e Spec204(n)). Uma unidade adição 104aX adiciona esses pedaços de dados espectrais, usando a Expressão 9, para a obtenção de um espectro sinteri- zado Spec(n).
É notado aqui que o coeficiente é regulado para 0,5; contudo, o coeficiente não deve ser limitado a 0,5. Quaisquer coeficientes dados para Spec201(n) e Spec204(n) devem ser providos, à medida que uma relação similar à Expressão 7 se sustente.
O espectro sintetizado obtido acima é requantificado pela uni- dade de quantificação 104aY com a técnica de MPEG-AAC. O resultado da requantificação é o sinal de downmix 207 incluído na informação codificada 107 provida a partir da unidade de sintetização de fluxo 100.
A estrutura da presente invenção realizando uma quantificação inversa seguida pela quantificação inversa seguida por uma adição significa a realização de uma adição em uma informação de freqüência. Isto elimina a necessidade de uma transformada de tempo - freqüência (incluindo o pro- cessamento de MDCT) requerida para a restauração dos sinais codificados de downmix separados para os sinais de PCM. Isto permite que a unidade de sintetização de fluxo 100 não precise de uma performance de cálculo alta do processador. Em outras palavras, isto pode diminuir a freqüência de ope- ração máxima do processador e reduzir um tamanho de memória de cálculo em proporção com menos processamento extra, o que resulta em um efeito significativo na redução de custos de produção e de projeto.
É notado que o sinal de downmix está na técnica de MPEG-AAC na modalidade; a propósito, a técnica não deve estar limitada a isto. A técni- 5 ca também pode ser a MPEG - Camada 3 e a TwinVQ1 bem como qualquer técnica de codificação de áudio utilizando uma transformada de tempo - fre- qüência.
(Quarta Modalidade)
A FIG. 12 ilustra uma outra modalidade da unidade de sintetiza- ção de fluxo 100.
A FIG. 12 mostra um sistema 1d incluindo os pontos 1, 2 e 3 es- tabelecendo conexões com cada outro através da unidade de sintetização de fluxo (unidade de conexão de multiponto) 100 da presente invenção. Ca- da um dos pontos usa um microfone para a captura de dois ou mais sinais acústicos de modo a se obter um sinal de PCM de multicanal. Na FIG. 12, os sinais 1, 2 e 3 e 4, 5, 6e7 são capturados nos pontos 1 e 2, respectivamen- te. Conforme descrito na primeira modalidade, um sinal de PCM de downmix estereofônico ou monofônico é calculado a partir do sinal de PCM obtido.
O sinal de PCM de downmix estereofônico ou monofônico obtido recebe um processamento de codificação acústica estereofônico ou mono- fônico na técnica de MPEG-AAC descrita na Referência de Não de Patente 2. Um sinal monofônico recebe um processamento de codificação monofôni- ca, tal como G. 726 e o MPEG-AAC descrito na Referência Não de Patente 1. A FIG. 12 mostra sinais, com cada um dos sinais de PCM de downmix codificados, como os sinais de DMX 1101 e 1105. Estes são referidos com os sinais codificados de downmix.
Em seguida, um sinal referido como um sinal estendido é obtido. Este sinal é uma informação para decodificação dos sinais de downmix (os sinais de DMX 1101 e 1105) em sinais plurais independentes. O ponto 1 e- xemplifica o cálculo do sinal estendido. Em primeiro lugar, uma diferença de nível interaural (ILD) e um coeficiente de correlação interaural (ICC) são de- rivados a partir de entre os sinais de entrada (no caso em que o sinal 1 e o sinal 2 são ambos sinais monofônicos) em uma base de quadro, conforme mostrado na primeira modalidade.
A diferença de nível interaural (ILD) e os coeficientes de correla- ção interaural (ICC) calculados são quantificados e codificador por Huffman para a criação de um coeficiente A. O circuito de OTT (um circuito que gera o sinal estendido acima a partir de duas entradas) usado para a codificação de MPEG-Surround descrita na Referência Não de Patente 3 deve prover um processo detalhado do cálculo. É notado que a diferença de nível inte- raural (ILD) e o coeficiente de correlação interaural (ICC) são exemplificados como uma informação estendida; contudo, a informação estendida não deve estar limitada a estes. Ainda, o cálculo acima foi exemplificado para a gera- ção da informação estendida a partir de dois sinais independentes. Quando da obtenção da informação estendida de três sinais, a propósito, uma outra técnica é utilizada. O circuito de TTT usado para a codificação de MPEG- Surround descrita na Referência Não de Patente 3 deve prover os detalhes da técnica.
Em seguida, os sinais 1 e 2 sofrem um downmix para serem convertidos no sinal monofônico. A diferença de nível interaural (ILD) e o coeficiente de correlação interaural (ICC) são calculados, usando-se as Ex- pressões 2 e 3 e codificados por Huffman para a criação de um Coeficiente B. Uma árvore de sinal 209 no ponto 1 na FIG. 12 ilustra esquematicamente o dito acima.
O dito acima é diferente daquilo na primeira modalidade pelo fato de os coeficientes AeB calculados acima serem armazenados em um fluxo codificado, conforme se segue.
A informação estendida 1102 obtida pela multiplicação dos coe- ficientes AeB representa uma "informação completa requerida para a sepa- ração do sinal 1". De modo similar, a informação estendida 1103 obtida pela multiplicação dos coeficientes AeB representa uma "informação completa requerida para a separação do sinal 2". A informação estendida 1104 inclui o coeficiente B apenas. De modo similar ao ponto 1, o ponto 2 tem uma infor- mação estendida 1106, uma informação estendida 1107, uma informação estendida 1108 e uma informação estendida 1109 incluindo os coeficientes C e D, os coeficientes C e D, o coeficiente C e um coeficiente E, e os coefi- cientes C e E1 respectivamente.
O sinal codificado de downmix e a informação estendida obtidos acima são sintetizados em pedaços de informação codificada 101 (1114) e 102 (1115) em uma base de ponto a ser transmitida a partir dos pontos de transmissão (os pontos 1 e 2) para a unidade de sintetização de fluxo 100 através de um caminho de comunicações, tal como a Internet.
A unidade de sintetização de fluxo 100 na presente invenção executa um processamento similar à primeira modalidade. Especificamente, cada um dos circuitos de separação 103 (FIG. 4) separa os sinais codifica- dos de downmix e a informação estendida da informação codificada 101 no ponto 1 e da informação codificada 102 no ponto 2. Na separação, um peda- ço da informação para distinção entre os sinais codificados de downmix e os pedaços de informação estendida são atribuídos a cada ponto de começo do pedaço de informação estendida. O circuito de separação 103 executa a se- paração acima de acordo com o pedaço de informação.
Os sinais codificados de downmix separados são temporaria- mente decodificados nos sinais de PCM, seguindo-se a um processo prede- terminado. É notado que esta seqüência de processamento depende de qual técnica de codificação é usada para a codificação dos sinais de downmix. Como um exemplo, a técnica de codificação no MPEG-AAC significa que a seqüência de processamento é uma descrita na Referência Não de Patente 2. Os sinais de PCM obtidos acima são referidos como o PCM 1 e o PCM 2. Os sinais de PCM decodificados sofrem ainda um downmix pelo circuito de conformação de downmix 104 e são codificados em um padrão de codifica- ção predeterminado (por exemplo, o padrão MPEG-AAC, por exemplo), para a geração do sinal codificado de downmix 207. A Expressão 4 (faça uma referência à FIG. 4 na primeira modalidade) exemplifica um processo de downmix descrito acima. Este processo é equivalente a uma operação do circuito de downmix 503.
Em seguida, o circuito de cálculo de informação estendida 105 calcula a informação estendida a partir do PCM 1 e do PCM 2 de acordo com as Expressões 2 e 3 descritas acima (veja a descrição na FIG. 5 da primeira modalidade). Esta informação estendida calculada é referida como a informação de separação de downmix 208. O circuito de OTT usado para o
MPEG-Surround descrito deve prover um processo detalhado do cálculo.
Aqui, a informação de separação de downmix 208 é derivada do PCM 1 e do PCM 2, pelas razões a seguir. Um downmix adicional dos sinais codificados de downmix nos pontos 1 e 2, possivelmente tendo característi- cas acústicas totalmente diferentes, elimina as características as quais os sinais codificados de downmix originalmente tinham. As características acús- ticas eliminadas não podem ser recuperadas apesar de se estenderem os sinais com as características acústicas eliminadas. Assim, a informação co- dificada com a informação estendida do sinal codificado de downmix atribuí- do é configurada de modo a se reterem características acústicas sem au- mento uma quantidade de informação quanto possível.
O sinal codificado de downmix 207 conforme descrito acima, a informação de separação de downmix 208 e a informação estendida 202, 203, 204 e 205, todas as quais sendo incluídas na informação codificada 101 e na 102 são multiplexadas pelo circuito de multiplexação 106 e transmitidas para o ponto 3, como a informação codificada 107.
Em seguida, a unidade de decodificação A tendo recebido o si- nal codificado de downmix e a informação estendida deve ser descrita abai- xo. A unidade de decodificação A primeiramente separa o sinal de downmix e o sinal estendido e, então, decodifica o sinal codificado de downmix em um circuito de decodificação predeterminado. O processo descrito na Referência Não de Patente 2 é adotado quando a técnica de MPEG-AAC é utilizada. Com base no sinal de PCM decodificado obtido através da decodificação e da informação estendida separada mencionada anteriormente, sinais acústi- cos plurais independentes são decodificados. As FIG. 7 e 8 mostram um e- xemplo do circuito de decodificação.
Citando o ponto 3 como um exemplo, a unidade de decodifica- ção A na FIG. 7, incluindo os circuitos de separação 603 e 604 conectados em um estágio múltiplo, recebe o sinal de downmix 601 e o sinal estendido 602 ambos obtidos como sinais de PCM. O circuito de OTT e o circuito de TTT do MPEG-Surround mostrado na Referência Não de Patente 3 são e- xemplificados como um circuito de separação. A FIG. 8 exemplifica um cir- cuito de separação simples.
Com base em: o sinal de entrada 701, a diferença de nível inte- raural (ILD) (referida como a informação de separação (diferença de nível interaural) 703 na FIG. 8 descrita nas Expressões 2 e 3; e os coeficientes de correlação interaural (ICC) (referidos como a informação de separação (valor de correlação) 702 na FIG. 8), a unidade de decodificação A primeiramente faz com que um circuito de descorrelação 704 para descorrelacionar o sinal de entrada 701. O circuito de descorrelacionador na Referência Não de Pa- tente 3 executa a operação acima. A descorrelação pelo circuito de descor- relação 704 não deve estar limitada a isto. A Referência Não de Patente 6, por exemplo, mostra uma técnica para a descorrelação do sinal, utilizando- se um algoritmo de Levinson-Durbin.
O sinal de entrada 701 viaja através do circuito de descorrelação 704 e tem o ganho controlado pelos circuitos de controle de ganho 705 e 706. Então, sinais separados 707 e 708 são obtidos. Com base na diferença de nível interaural (ILD) 703, os circuitos de controle de ganho 705 e 706 usam as Expressões 6 e 7 descritas previamente (veja a descrição da FIG. 8 na primeira modalidade) para a execução de cálculos.
Aqui, o operador Dec denota nas Expressões 6 e 7 uma descor- relação do sinal, e Sigl e Sig2 denotam os sinais separados 707 e 708. Uma seqüência do processamento descrito acima permite que os sinais monofô- nicos ou estereofônicos plurais independentes desejados sejam decodifica- dos a partir do sinal codificado estendido de downmix (a informação de se- paração de downmix).
É notado que um aparelho de codificação e uma unidade de de- codificação, usando a técnica de MPEG-Surround, descrita na Referência Não de Patente 3, podem ser usados nos processos para o cálculo da infor- mação estendida e para a decodificação dos sinais independentes originais do sinal de downmix e a informação estendida ambos obtidos como os sinais de PCM. Mais ainda, a técnica de codificação usada nos processos não está limitada à técnica de MPEG-Surround; ao invés disso, a técnica de MP3 Sur- round bem como uma técnica de codificação não comprimida incluindo a técnica de LPCM, pode ser adotada como de costume.
A unidade de sintetização de fluxo 100 (MCU) implementada acima é uma modalidade de exemplo da presente invenção, e não deve es- tar limitada a isto. Ainda, o número representado dos pontos para encami- nhamento da informação codificada é dois. O número, contudo, não deve estar limitado a dois. Três ou mais pontos podem ser adotados.
Conforme mostrado na FIG. 12, a informação codificada 101 no ponto 1 inclui o sinal de DMX 1101, a informação estendida 1102 para sepa- ração do sinal 1, a informação estendida 1103 para separação do sinal 2 e a informação estendida 1104 para separação do sinal 3. Cada um dos sinais 1 a 3 é separado com base no sinal de DMX. Os pedaços da informação es- tendida 1102 e da informação estendida 1103 incluem os coeficientes de informação codificada AeB, respectivamente. A informação estendida 1104 inclui a informação de separação B requerida para a separação do sinal 3 do sinal de DMX 1101. De modo similar, a informação codificada 102 no ponto 2 inclui o sinal de DMX 1105, a informação estendida 1106 para separação do sinal 4, a informação estendida 1107 para separação do sinal 5, a infor- mação estendida 1108 para separação do sinal 6 e a informação estendida 1109 para separação do sinal 7. Cada um dos sinais 4 a 7 é separado com base no sinal de DMX 1105. A informação estendida 1106 e a informação estendida 1107 incluem ambas a informação de separação codificada Cea informação de separação codificada D. A informação estendida 1108 e a sinal de pressão 1109 incluem ambas a informação de separação C e a in- formação de separação E requeridas para a separação dos sinais 6 e 7 do sinal de DMX 1105.
A informação codificada configurada acima é sintetizada na in- formação codificada 1116 (FIG. 12) na unidade de sintetização de fluxo 100 na modalidade e transmitida para o ponto 3. Aqui, os sinais de DMX 1101 e 1105 são sintetizados para a obtenção de um novo sinal de DMX 1110. A primeira modalidade provê detalhes do processo de cálculo. Como de cos- tume, cada um dos sinais de DMX 1101 e 1105 mais provavelmente tendo características acústicas diferentes, não são simplesmente sintetizados para sofrerem um downmix. Ao invés disso, um sinal estendido de DMX (a infor- mação de separação de downmix) 1111 para separação dos sinais de DMX 1101 e 1105 do sinal sintetizado (o sinal de DMX 1110) deve ser calculado para serem atribuídos à informação codificada 1116. A informação codifica- da 1114 e a informação codificada 1115 são configuradas acima. Então, a unidade de sintetização de fluxo 100 transmite a informação codificada 1116 para o ponto 3. Aqui, a informação codificada 1116 é sintetizada a partir de: a informação estendida 1102 como a informação estendida 1112 e a infor- mação estendida 1108 como a informação estendida 1113, respectivamente. O ponto 3 o qual recebe a informação codificada 116 pode codificar os sinais 1 e 6 apenas. Em outras palavras, a informação estendida de DMX (a infor- mação de separação de downmix) 1111 separa o sinal de DMX 1110 em um sinal de DMX Y e um DMX 2'. A separação de cada um dos sinais separa- dos com o uso do coeficiente de separação B incluído na informação esten- dida 1112 (= 1102) permite a separação do sinal 3 e de um sinal sintetizado dos sinais 1 e 2. Ainda, uma separação do sinal sintetizado dos sinais 1 e 2 com o uso do coeficiente de separação A incluído na informação estendida 1112 (= 1102) provê o sinal 1. De modo similar, o DMX'2 pode ser separado em um sinal sintetizado dos sinais 4 e 5 e um sinal sintetizado dos sinais 6 e 7 com o uso do coeficiente de separação C incluído na informação estendida 1113 (= 1108). A separação do sinal sintetizado dos sinais 6 e 7 com o coe- ficiente de separação E incluído na informação estendida 1113 (= 1108) pro- vê o sinal 6.
Uma vez que o dito acima é um exemplo, um outro sinal de en- trada tendo uma combinação diferente também pode ser transmitido. A uni- dade de sintetização de fluxo pode sintetizar uma combinação da informação estendida 1104 e da informação estendida 1107 para a configuração da in- formação codificada 1116 de modo a se transmitirem os sinais de entrada 3 e 5.
As configurações da informação codificada 1114 e da informa- ção codificada 1115 na FIG. 12 tornam possível uma unidade de sintetização de fluxo, a qual pode escolher alguns canais de transmissão necessários (canais de entrada) em cada ponto. Esta configuração permite que a unida- de de sintetização de fluxo gere livremente a informação codificada 1116 tendo várias combinações de sinais de entrada em uma base de ponto e em uma base de sinal de entrada. Além disso, a unidade de sintetização de flu- xo pode frear um aumento na quantidade de transmissão de informação (ta- xa de bit) pela transmissão de parte da informação codificada 114 e da in- formação codificada 1115, não toda. No caso da FIG. 12 (dois pontos de transmissão e sete sinais), um cálculo simples requer 22 pedaços diferentes de informação codificada, os quais devem todos ser transmitidos. Isto resulta em um aumento na taxa de bit. Uma transmissão simples dos 22 pedaços diferentes da informação codificada totaliza tanto quanto aproximadamente 1,4 Mbps para 22 canais, desde que a taxa de bit seja de 64 kbps por canal na técnica de MPEG-AAC, por exemplo. A presente invenção, contudo, re- quer a taxa de transmissão para tão pouco quanto sete pedaços da informa- ção estendida, mesmo quando o número de sinais de transmissão for sete no máximo, uma vez que a unidade de sintetização de fluxo simplesmente escolhe sete pedaços da informação estendida. Cada pedaço da informação estendida é de tanto quanto vários kbps no máximo. Assim, a transmissão de sete pedaços termina em aproximadamente 30 kbps. Conforme mostrado na FIG. 12, dois sinais totalizam aproximadamente 64 kbps da parte codifi- cada de DMX no máximo, o que permite uma transmissão com menos de 100 kbps na informação codificada inteira 1116. Em termos de aplicabilidade industrial, a presente invenção é significativamente benéfica, de modo que uma taxa de bit baixa e um estabelecimento de ponto flexível e uma configu- ração de transmissão possam ser realizadas.
Daí, cada uma das unidades de sintetização de fluxo a seguir (A1) a (A11) e uma unidade de decodificação (B) é construída. Em outras palavras, é formado um dispositivo de sintetização de fluxo (A1) que inclui: uma unidade de entrada (a unidade de entrada 11), a qual introduz pelo menos dois sinais codificados (a informação codificada 101 e a informação codificada 102), cada um incluindo um primeiro sinal a- cústico de downmix (o sinal de DMX 201 e o sinal de DMX 204 na FIG. 5) e um sinal estendido (a informação estendida 202, a informação estendida 203, a informação estendida 205 e a informação estendida 206), cada um dos primeiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico (o sinal de PCM de downmix) no qual pelo menos dois si- nais de som (sinais de fala) capturados pelos microfones sofrem um down- mix, e o sinal estendido sendo para a obtenção pelo menos de dois sinais de som (cada um dos sinais de fala no ponto 1 e cada um dos sinais de fala no ponto 2) fora do primeiro sinal acústico de downmix; uma unidade de gera- ção de sinal codificado (a unidade de geração de informação codificada a ser extraída 13) a qual gera: um segundo sinal acústico de downmix (o sinal de downmix 207) e um sinal estendido (a informação de separação de downmix 208) com base em cada um dos sinais codificados introduzidos pela unidade de entrada, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix (o sinal de DMX 201 e o sinal de DMX 204) e o sinal estendido gerado sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix (o sinal de DMX 201, o sinal de DMX 204) a partir do segundo sinal acústico de down- mix; e gera um sinal codificado (a informação codificada 107) incluindo o segundo sinal acústico de downmix gerado (o sinal de downmix 207), o sinal estendido gerado (a informação de separação de downmix 208) e cada um dos sinais estendidos (a informação estendida introduzida 202 e a informa- ção estendida introduzida 203 no ponto 1, e a informação estendida 205 e a informação estendida 206 no ponto 2) incluídos no sinal codificado introduzi- do correspondente; e uma unidade de saída (a unidade de saída 12), a qual extrai o sinal codificado gerado.
A estrutura do dispositivo de sintetização de fluxo (A1) torna possível transmitir e receber cada um dos sinais de som no sinal codificado associado a ser introduzido, usando-se um processamento simples, elimi- nando-se a necessidade de processamento em uma quantidade de proces- samento grande, tal como uma decodificação de cada sinal do sinal codifi- cado associado a ser introduzido, e a codificação do sinal de som decodifi- cado em um sinal codificado a ser extraído.
Ainda, o dispositivo de sintetização de fluxo (A2) inclui a unidade de geração de sinal codificado (a unidade de geração de informação codifi- cada a ser extraída 13) a qual calcula um número agregado (o número de sinais 909 na FIG. 9) de pelo menos dois sinais de som incluídos em cada um dos sinais codificados introduzidos pela referida unidade de entrada, e o sinal codificado a ser gerado (a informação codificada 107) inclui o número agregado calculado de pelo menos dois sinais de som (A1).
Mais ainda, o dispositivo de sintetização de fluxo (A3) caracteri- za que o sinal estendido (tudo da Extensão I (a informação estendida 202) até a Extensão Il (a informação estendida 203) na FIG. 5, por exemplo) no sinal codificado introduzido pela referida unidade de entrada inclui uma plu- ralidade de sinais parcialmente estendidos (Extensão I e Extensão I) e parte da pluralidade de sinais parcialmente estendidos (Extensão I) obtém um si- nal de som (o sinal 3 no ponto 1 na FIG. 5, por exemplo) de um sinal codifi- cado (a informação codificada 101), parte da pluralidade de sinais parcial- mente estendidos sendo correspondente ao sinal de som (o sinal de som 3), e a unidade de geração de sinal codificado (a unidade de geração de infor- mação codificada a ser extraída 13) gera o sinal codificado (A1) que armaze- na parte da pluralidade de sinais parcialmente estendidos (Extensão I) cor- respondente ao sinal de som (o sinal 3 no ponto 1, por exemplo) sendo cada um de pelo menos dois sinais de som.
Ainda, o dispositivo de sintetização de fluxo (A4) é formado para incluir a unidade de geração de sinal codificado a qual gera o sinal codifica- do (A3) incluindo apenas um sinal parcialmente estendido para a obtenção de um sinal acústico predeterminado de cada um dos sinais de fala no ponto associado.
Mais ainda, o dispositivo de sintetização de fluxo é estruturado para incluir a unidade de geração de sinal codificado (A1) gerando o sinal codificado incluindo apenas os sinais estendidos em parte dos sinais codifi- cados predeterminados, em alguns pontos, incluídos em pelo menos dois sinais codificados, nos pontos correspondentes, cada um sendo introduzido pela unidade de entrada.
Além disso, o dispositivo de sintetização de fluxo (A6) é estrutu- rado para incluir a unidade de geração de sinal codificado a qual gera (A5) o sinal codificado apenas incluindo um sinal estendido incluído em um sinal codificado introduzido a partir de uma fonte de entrada tendo uma ordem de prioridade predeterminada mais alta do que uma ordem de referência prede- terminada.
O dispositivo de sintetização de fluxo (A7) caracteriza que o sinal estendido no sinal codificado introduzido pela unidade de entrada inclui uma pluralidade de sinal parcialmente estendido, e um sinal de som é obtido de um sinal codificado com um uso de parte da pluralidade de sinais parcial- mente estendidos incluídos na pluralidade de sinais parcialmente estendi- dos, correspondendo ao sinal de som, e a unidade de geração de sinal codi- ficado (A1) gera o sinal codificado apenas incluindo parte da pluralidade de sinais parcialmente estendidos correspondentes a um sinal de som que tem; uma ordem de prioridade mais alta do que uma ordem de referência prede- terminada, a ordem de prioridade sendo predeterminada.
Mais ainda, o dispositivo de sintetização de fluxo (A8) caracteri- za que o sinal estendido no sinal codificado introduzido pela unidade de en- trada inclui uma pluralidade de sinais parcialmente estendidos, e um sinal de som é decodificado a partir de um sinal codificado com um uso de parte da pluralidade de sinais parcialmente estendidos incluídos na pluralidade de sinais parcialmente estendidos, correspondendo ao sinal de som, e a unida- de de geração de sinal codificado (A1) gera o sinal codificado incluindo uma informação de árvore (a informação de árvore 901 na FIG. 10) especificando uma estrutura de árvore construída a partir do sinal estendido, e cada um dos sinais parcialmente estendidos no sinal codificado a ser gerado, o sinal estendido sendo gerado pela unidade de geração de sinal codificado.
Ainda, a unidade de sintetização de fluxo (A9) caracteriza que a unidade de geração de sinal codificado (A1) gera o sinal codificado incluindo a informação de determinação (a informação de determinação 907 na FIG. 10) indicando o sinal estendido gerado pela unidade de geração de sinal co- dificado dentre o sinal estendido gerado pela unidade de geração de sinal codificado e cada um dos sinais estendidos incluído no sinal associado de pelo menos dois sinais codificados introduzidos pela unidade de entrada.
Além disso, o dispositivo de sintetização de fluxo (A10) caracte- riza que um sinal codificado introduzido pela unidade de entrada inclui uma informação de fonte de entrada (a informação de ponto 908 na Flg. 10) indi- cando uma fonte de entrada a partir da qual o sinal codificado foi introduzido, e a unidade de geração de sinal codificado: identifica cada um dos sinais codificados incluindo uma informação de fonte de entrada indicando uma fonte de entrada predeterminada, cada um dos sinais codificados sendo in- cluído no sinal introduzido de cada um de pelo menos dois sinais codifica- dos; gera o segundo sinal acústico de downmix e um sinal estendido, o se- gundo sinal acústico de downmix obtendo cada um dos primeiros sinais a- cústicos de downmix em um dos sinais codificados identificados associados, e o sinal estendido sendo para a obtenção; e gera (A1) o sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado e cada um dos sinais estendidos em um dos sinais codificados asso- ciados e identificados.
Mais ainda, o dispositivo de sintetização de fluxo (A11) caracte- riza que a unidade de geração de sinal codificado (a unidade de geração de informação codificada a ser extraída 13) inclui (A1): uma unidade de separa- ção (os circuitos de separação plurais 103 na FIG. 4), os quais separam o primeiro sinal acústico de downmix incluído em cada um dos sinais codifica- dos, a partir do sinal codificado introduzido pela unidade de entrada; uma unidade de geração de sinal acústico de downmix (o circuito de conformação de downmix 104) o qual gera o segundo sinal acústico de downmix com ba- se em cada um dos primeiros sinais acústicos de downmix separados pela unidade de separação; uma unidade de geração de sinal estendido (o circui- to de cálculo de informação estendida 105) a qual gera o sinal estendido com base em cada um dos primeiros sinais acústicos de downmix separados pela unidade de separação, o sinal estendido sendo para a obtenção de ca- da um dos primeiros sinais acústicos de downmix do segundo sinal acústico de downmix; e uma unidade de sintetização (o circuito de multiplexação 106) a qual sintetiza, para a geração do sinal codificado, o segundo sinal acústico de downmix gerado pela unidade de geração de sinal acústico de downmix, o sinal estendido gerado pela unidade de geração de sinal estendido e cada um dos sinais estendidos incluídos em um sinal associado do sinal codifica- do introduzido pela unidade de entrada (A11).
Mais ainda um dispositivo de decodificação (o dispositivo de de- codificação A) inclui (B) uma unidade de entrada (não mostrada) a qual in- troduz um sinal codificado (a informação codificada 107 na FIG. 5), incluindo um sinal acústico de downmix e um sinal estendido, o sinal acústico de downmix sendo provido a partir de um sinal acústico codificado no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do sinal acústico de downmix, onde o sinal acústico de downmix (o sinal de downmix 207) no sinal codificado a ser introduzido é um segundo sinal acústico de downmix para a obtenção de cada um dos sinais acústicos de downmix (o sinal de DMX 201 e o sinal de DMX 204) em pelo menos dois sinais codificados pre- determinados (a informação codificada 101 e a informação codificada 102), o sinal estendido no sinal codificado a ser introduzido é um sinal estendido (a informação de separação de downmix 208) para a obtenção de cada um dos primeiros sinais acústicos de downmix (o sinal de DMX 201 e o sinal de DMX 204) a partir do segundo sinal acústico de downmix (o sinal de downmix 207) e a unidade de decodificação inclui uma subunidade de decodificação (o cir- cuito de separação 709), o qual gera pelo menos dois sinais intermediários (os dois sinais intermediários gerados pelo circuito de descorrelação 704 na FIG. 8) com base em pelo menos um coeficiente de correlação interaural (ICC) e uma diferença de nível interaural de freqüência (ILD) incluídos no sinal estendido (a informação de separação de downmix 208) e para multi- plicação dos pelo menos dois sinais intermediários gerados pela diferença de nível interaural de freqüência (ILD)1 pelo menos dois sinais intermediários sendo descorrelacionados de um sinal decodificado (o sinal de entrada 701 na Flg. 8) obtido a partir do segundo sinal acústico de downmix com o uso de um coeficiente de correlação interaural (ICC).
(Outros Exemplos de Modificação)
As modalidades acima descreveram a presente invenção; a pro- pósito, a presente invenção não deve ser limitada às modalidades acima, como de costume. Os casos a seguir devem ser incluídos na presente in- venção.
(1) Especificamente, cada uma das unidades de sintetização de fluxo e a unidade de decodificação é um sistema de computador incluindo um microprocessador, uma ROM, uma RAM, uma unidade de disco rígido, uma unidade de exibição, um teclado e um mouse. A RAM ou a unidade de disco rígido armazena um programa de computador. O microprocessador opera no programa de computador, o qual faz com que cada uma das uni- dades implemente uma função do mesmo. Aqui, o programa de computador inclui uma combinação de códigos de instrução plurais enviando uma instru- ção para o computador de modo a se obter uma função predeterminada.
(2) Parte de ou todos os elementos estruturais incluídos em cada uma das unidades acima podem ser incluídos em uma única LSI (Integração em Larga Escala) de sistema. Uma LSI de sistema, uma LSI de ultramulti- função, é fabricada com unidades estruturais plurais integradas em um único chip. Especificamente, a LSI de sistema é um sistema de computador que tem um microprocessador, uma ROM e uma RAM. A RAM armazena um programa de computador. A LSI de sistema obtém a função da mesma pelo microprocessador operando no programa de computador.
(3) Parte de ou todos os elementos estruturais tendo cada uma das unidades descritas acima podem ser incluídos em uma placa de IC ou um módulo único destacável para e de cada uma das unidades. A placa de IC ou o módulo é um sistema de computador o qual consiste em micropro- cessador, uma ROM e uma RAM. A placa de IC e o módulo também podem incluir a LSI de ultramultifunção descrita acima. O microprocessador opera no programa de computador, o que permite que a placa de IC e o módulo obtenham a função dos mesmos. A placa de IC e o módulo também podem ser resistentes à violação.
(4) A presente invenção pode ser em métodos descritos acima.
A presente invenção também pode ser um programa de computador execu- tando os métodos por um computador e um sinal digital incluindo o programa de computador.
A presente invenção ainda pode incluir um meio de gravação que pode ser lido em computador, o qual armazena o programa de compu- tador ou o sinal digital em um disco flexível, um disco rígido, um CD-ROM, um MO1 um DVD, um DVD-ROM, um DVD-RAM, um BD (Disco de Blu-ray) e uma memória de semicondutor.
A presente invenção ainda pode transmitir o programa de com- putador ou o sinal digital através de uma rede e uma difusão de dados prin- cipalmente incluindo uma linha de comunicações eletrônica, uma linha de comunicações com fio ou sem fio e a Internet.
A presente invenção também pode ser um sistema de computa- dor incluindo um microprocessador e uma memória. A memória pode gravar o programa de computador descrito acima, e o microprocessador pode ope- rar no programa de computador.
A presente invenção pode ser implementada por um outro sis- tema de computador independente pelo.armazenamento para transferência do programa ou do sinal digital em um meio de gravação ou através de uma rede.
(5) A presente invenção pode ser uma combinação da modali- dade acima com qualquer um dos exemplos de modificação acima. Aplicabilidade Industrial
A presente invenção, estabelecendo conexões entre os pontos plurais através de um caminho de comunicações, é efetiva para um sistema de teleconferência de multiponto do qual cada um dos pontos é submetido a uma codificação de multicanal.

Claims (17)

1. Dispositivo de sintetização de fluxo, que compreende: uma unidade de entrada configurada para a introdução de pelo menos dois sinais codificados, cada um incluindo um primeiro sinal acústico de downmix e um sinal estendido, cada um dos primeiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som a partir do primeiro sinal acústico de downmix; uma unidade de geração de sinal codificado configurada para gerar: um segundo sinal acústico de downmix e um sinal estendido com ba- se em cada um dos sinais codificados introduzidos pela referida unidade de entrada, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido ge- rado sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix fora do segundo sinal acústico de downmix; e a geração de um sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado, e cada um dos sinais estendidos incluídos no sinal codificado introduzido correspondente; e uma unidade de saída configurada para a extração do sinal codi- ficado gerado.
2. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde a referida unidade de geração de sinal codificado é confi- gurada para o cálculo de um número agregado de pelo menos dois sinais de som incluídos em cada um dos sinais codificados introduzidos pela referida unidade de entrada, e o sinal codificado a ser gerado inclui o número agre- gado calculado de pelo menos dois sinais de som.
3. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde o sinal estendido no sinal codificado introduzido pela refe- rida unidade de entrada inclui uma pluralidade de sinais parcialmente esten- didos, e alguns da pluralidade de sinais parcialmente estendidos obtêm um sinal de som de um sinal codificado, alguns da pluralidade de sinais parcial- mente estendidos os quais são incluídos na pluralidade de sinais parcial- mente estendidos sendo correspondentes ao sinal de som, e a referida unidade de geração de sinal codificado é configurada para a geração do sinal codificado armazenado alguns da pluralidade de sinais parcialmente estendidos correspondentes ao sinal de som sendo cada um de pelo menos dois sinais de som.
4. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 3, onde a referida unidade de geração de sinal codificado é confi- gurada apara a geração do sinal codificado incluindo apenas um sinal parci- almente estendido para a obtenção de um sinal acústico predeterminado.
5. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde referida unidade de geração de sinal codificado é configu- rada para a geração do sinal codificado incluindo apenas sinais estendidos em alguns dos sinais codificados predeterminados incluídos em pelo menos dois sinais codificados, cada um sendo introduzido pela referida unidade de entrada.
6. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 5, onde a referida unidade de geração de sinal codificado é confi- gurada para a geração do sinal codificado apenas incluindo um sinal esten- dido incluindo em um sinal codificado introduzido a partir de uma fonte de entrada tendo uma ordem de prioridade predeterminada mais alta do que uma ordem de referência predeterminada.
7. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde o sinal estendido no sinal codificado introduzido pela refe- rida unidade de entrada inclui uma pluralidade de sinais parcialmente esten- didos, e um sinal de som é obtido de um sinal codificado com um uso de al- guns da pluralidade de sinais parcialmente estendidos incluídos na plurali- dade de sinais parcialmente estendidos, correspondendo ao sinal de som, e a referida unidade de geração de sinal codificado é configurada para gerar o sinal codificado apenas incluindo alguns da pluralidade de si- nais parcialmente estendidos correspondentes a um sinal de som que tem uma ordem de prioridade mais alta do que uma ordem de referência prede- terminada, a ordem de prioridade sendo predeterminada.
8. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde sinal estendido no sinal codificado introduzido pela referida unidade de entrada inclui uma pluralidade de sinais parcialmente estendidos, e um sinal de som é decodificado a partir de um sinal codificado com um uso de alguns da pluralidade de sinais parcialmente estendidos, incluído na plu- ralidade de sinais parcialmente estendidos, correspondendo ao sinal de som, e a referida unidade de geração de sinal codificado é configurada para a geração do sinal codificado incluindo uma informação de árvore es- pecificando uma estrutura de árvore construída do sinal estendido e cada um de sinais estendidos no sinal codificado a ser gerado, o sinal estendido sen- do grado pela referida unidade de geração de sinal codificado.
9. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde a referida unidade de geração de sinal codificado é confi- gurada para gerar o sinal codificado incluindo a determinação de uma infor- mação indicando o sinal estendido gerado pela referida unidade de geração de sinal codificado dentre o sinal estendido gerado pela referida unidade de geração de sinal codificado e cada um dos sinais estendidos incluídos no sinal associado de pelo menos dois sinais codificados introduzidos pela refe- rida unidade de entrada.
10. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde cada sinal codificado introduzido pela referida unidade de entrada inclui uma informação de fonte de entrada indicando uma fonte de entrada a partir da qual o sinal codificado foi introduzido, e a referida unidade de geração de sinal codificado é configurada para: identificar cada um dos sinais codificados incluindo uma informação de fonte de entrada indicando uma fonte de entrada predeterminada, cada um dos sinais codificados sendo incluídos em cada um dos sinais introduzidos de pelo menos dois sinais codificados; gerar o segundo sinal acústico de downmix e um sinal estendido, o segundo sinal acústico de downmix obten- do cada um dos primeiros sinais acústicos de downmix em um dos sinais codificados identificados associados, e o sinal estendido sendo para a ob- tenção; e gerar o sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado e cada um dos sinais estendidos em um dos sinais codificados associados e identificados.
11. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicaçãol, onde a referida unidade de entrada é configurada para o recebi- mento de um sinal codificado a partir de cada um de uma pluralidade de des- tinos de entrada - saída predeterminados, a referida unidade de saída é configurada para a extração do sinal codificado para cada um da pluralidade de destinos de entrada - saída, a referida unidade de geração de sinal codificado é configurada para a geração do segundo sinal acústico de downmix e de quantos forem os sinais estendidos quanto o número da pluralidade de destinos de entrada - saída, o segundo sinal acústico de downmix a ser gerado sendo gerado um e um sinal acústico de downmix para obtenção de cada um dos segun- dos sinais acústicos de downmix incluídos em um sinal correspondente de pelo menos dois sinais codificados introduzidos a partir da pluralidade de destinos de entrada - saída apenas incluindo um sinal estendido de um ou- tro destino de entrada - saída além do destino de entrada - saída corres- pondente, e a referida unidade de saída é configurada para a extração de cada um dos sinais codificados os quais a referida unidade de geração de sinal codificado gera para o destino associado dos destinos de entrada - saída ao qual a informação estendida incluída em cada um dos sinais codifi- cados corresponde, a informação estendida sendo gerada pela referida uni- dade de geração de sinal codificado.
12. Dispositivo de sintetização de fluxo, de acordo com a Reivin- dicação 1, onde a referida unidade de entrada inclui: uma unidade de separação configurada para a separação do primeiro sinal acústico de downmix, incluído em cada um dos sinais codifica- dos, do sinal codificado introduzido pela referida unidade de entrada; uma unidade de geração de sinal acústico de downmix configu- rada para a geração do segundo sinal acústico de downmix com base em cada um dos primeiros sinais acústicos de downmix separados pela referida unidade de separação; uma unidade de geração de sinal estendido configurada para a geração do sinal estendido com base em cada um dos primeiros sinais acús- ticos de downmix separados pela referida unidade de separação, o sinal es- tendido sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix fora do segundo sinal acústico de downmix; e uma unidade de sintetização para sintetização, para a geração do sinal codificado, o segundo sinal acústico de downmix gerado pela referi- da unidade de geração de sinal acústico de downmix, o sinal estendido gra- do pela referida unidade de geração de sinal estendido, e cada um dos si- nais estendidos incluídos em um sinal associado do sinal codificado introdu- zido pela referida unidade de entrada.
13. Dispositivo de decodificação, que compreende: uma unidade de entrada configurada para a introdução de um sinal codificado incluindo um sinal acústico de downmix e um sinal estendi- do, o sinal acústico de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofreram um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do sinal acústico de downmix, onde o sinal acústico de downmix no sinal codificado a ser intro- duzido é um segundo sinal acústico de downmix para a obtenção de cada um dos sinais acústicos de downmix em um sinal predeterminado de pelo menos dois sinais codificados, o sinal estendido no sinal codificado a ser introduzido é um sinal estendido para a obtenção de cada um dos primeiros sinais acústicos de downmix do segundo sinal acústico de downmix, e a referida unidade de decodificação inclui uma subunidade de decodificação configurada para a geração de pelo menos dois sinais inter- mediários com base em um coeficiente de correlação interaural (ICC) e uma diferença de nível interaural de freqüência (ILD) incluída no sinal estendido, e para a multiplicação dos pelo menos dois sinais intermediários gerados pela diferença de nível interaural de freqüência (ILD), pelo menos dois sinais intermediários sendo não correlacionados de um sinal decodificado obtido a partir do segundo sinal acústico de downmix com um uso do coeficiente de correlação interaural (ICC).
14. Método de sintetização de fluxo, que compreende: a introdução de pelo menos dois sinais codificados, cada um incluindo um primeiro sinal acústico de downmix e um sinal estendido, cada um dos primeiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do primeiro sinal acústico de downmix, a geração de: um segundo sinal acústico de downmix e um sinal estendido com base em cada um dos sinais codificados introduzidos na refe- rida introdução, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido gerado sendo para a obtenção de cada um dos segundos sinais acústicos de downmix do segundo sinal acústico de downmix; e um sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado e cada um dos sinais estendidos incluídos no sinal codificado intro- duzido correspondente; e a extração do sinal codificado gerado.
15. Programa de computador, o qual faz com que um computa- dor execute: a introdução de pelo menos dois sinais codificados, cada um incluindo um primeiro sinal acústico de downmix e um sinal estendido, cada um dos primeiros sinais acústicos de downmix sendo obtido pela codificação de um sinal acústico no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo menos dois sinais de som do primeiro sinal acústico de downmix, a geração de: um segundo sinal acústico de downmix e um sinal estendido com base em cada um dos sinais codificados introduzidos na refe- rida introdução, o segundo sinal acústico de downmix sendo para a obtenção de cada um dos primeiros sinais acústicos de downmix, e o sinal estendido gerado sendo para a obtenção de cada um dos segundos sinais acústicos de downmix do segundo sinal acústico de downmix; e um sinal codificado incluindo o segundo sinal acústico de downmix gerado, o sinal estendido gerado e cada um dos sinais estendidos incluídos no sinal codificado intro- duzido correspondente; e a extração do sinal codificado gerado.
16. Método de decodificação, que compreende: a introdução de um sinal codificado incluindo um sinal acústico de downmix e um sinal estendido, o sinal acústico de downmix sendo provi- do com um sinal acústico codificado no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo me- nos dois sinais de som do sinal acústico de downmix, onde o sinal acústico de downmix no sinal codificado a ser intro- duzido é um segundo sinal acústico de downmix para a obtenção de cada um dos sinais acústicos de downmix em pelo menos dois sinais codificados predeterminados, o sinal estendido no sinal codificado a ser introduzido é um sinal estendido para a obtenção de cada um dos primeiros sinais acústicos de downmix do segundo sinal acústico de downmix, e o referido método de decodificação inclui a geração de pelo me- nos dois sinais intermediários com base em um coeficiente de correlação interaural (ICC) e uma diferença de nível interaural de freqüência (ILD) inclu- ída no sinal estendido, e a multiplicação dos pelo menos dois sinais interme- diários gerados pela diferença de nível interaural de freqüência (ILD)1 pelo menos dois sinais intermediários sendo não correlacionados de um sinal de- codificado obtido a partir do segundo sinal acústico de downmix com um uso do coeficiente de correlação interaural (ICC).
17. Programa de computador, o qual faz com que um computa- dor execute: a introdução de um sinal codificado incluindo um sinal acústico de downmix e um sinal estendido, o sinal acústico de downmix sendo provi- do com um sinal acústico codificado no qual pelo menos dois sinais de som sofrem um downmix, e o sinal estendido sendo para a obtenção de pelo me- nos dois sinais de som do sinal acústico de downmix, onde o sinal acústico de downmix no sinal codificado a ser intro- duzido é um segundo sinal acústico de downmix para a obtenção de cada um dos sinais acústicos de downmix em pelo menos dois sinais codificados, predeterminados, o sinal estendido no sinal codificado a ser introduzido é um sinal estendido para a obtenção de cada um dos primeiros sinais acústicos de downmix do segundo sinal acústico de downmix, e o referido programa de computador faz com que o computador execute a geração de pelo menos dois sinais intermediários com base em um coeficiente de correlação interaural (ICC) e uma diferença de nível inte- raural de freqüência (ILD) incluída no sinal estendido, e a multiplicação dos pelo menos dois sinais intermediários gerados pela diferença de nível inte- raural de freqüência (ILD), pelo menos dois sinais intermediários sendo não correlacionados de um sinal decodificado obtido a partir do segundo sinal acústico de downmix com um uso do coeficiente de correlação interaural (ICC).
BRPI0806228A 2007-10-16 2008-10-16 Dispositivo de sintetização de fluxo, unidade de decodificação e método BRPI0806228A8 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
JP2007-269127 2007-10-16
JP2007269127 2007-10-16
JP2008-184666 2008-07-16
JP2008184666 2008-07-16
PCT/JP2008/002941 WO2009050896A1 (ja) 2007-10-16 2008-10-16 ストリーム合成装置、復号装置、方法

Publications (2)

Publication Number Publication Date
BRPI0806228A2 true BRPI0806228A2 (pt) 2011-09-06
BRPI0806228A8 BRPI0806228A8 (pt) 2016-11-29

Family

ID=40567182

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0806228A BRPI0806228A8 (pt) 2007-10-16 2008-10-16 Dispositivo de sintetização de fluxo, unidade de decodificação e método

Country Status (7)

Country Link
US (1) US8391513B2 (pt)
EP (1) EP2128856A4 (pt)
JP (2) JPWO2009050896A1 (pt)
CN (1) CN101578655B (pt)
BR (1) BRPI0806228A8 (pt)
RU (1) RU2473139C2 (pt)
WO (1) WO2009050896A1 (pt)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2154910A1 (en) * 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
KR101613975B1 (ko) * 2009-08-18 2016-05-02 삼성전자주식회사 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치
CN102065265B (zh) * 2009-11-13 2012-10-17 华为终端有限公司 实现混音的方法、装置和系统
EP2702588B1 (en) 2012-04-05 2015-11-18 Huawei Technologies Co., Ltd. Method for parametric spatial audio coding and decoding, parametric spatial audio coder and parametric spatial audio decoder
US9460729B2 (en) 2012-09-21 2016-10-04 Dolby Laboratories Licensing Corporation Layered approach to spatial audio coding
US9491299B2 (en) 2012-11-27 2016-11-08 Dolby Laboratories Licensing Corporation Teleconferencing using monophonic audio mixed with positional metadata
US10149072B2 (en) * 2016-09-28 2018-12-04 Cochlear Limited Binaural cue preservation in a bilateral system
JP7092047B2 (ja) * 2019-01-17 2022-06-28 日本電信電話株式会社 符号化復号方法、復号方法、これらの装置及びプログラム
CN113160837B (zh) * 2021-04-16 2022-12-23 北京百瑞互联技术有限公司 一种sbc码流的混音方法、装置、介质及设备
CN113423006B (zh) * 2021-05-31 2022-07-15 惠州华阳通用电子有限公司 一种基于主副声道的多音频流混音播放方法及系统

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2137926C (en) 1993-05-05 2005-06-28 Rudolf Hofmann Transmission system comprising at least a coder
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
KR101021079B1 (ko) 2002-04-22 2011-03-14 코닌클리케 필립스 일렉트로닉스 엔.브이. 파라메트릭 다채널 오디오 표현
BRPI0305434B1 (pt) 2002-07-12 2017-06-27 Koninklijke Philips Electronics N.V. Methods and arrangements for encoding and decoding a multichannel audio signal, and multichannel audio coded signal
US7447317B2 (en) * 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
JP4033840B2 (ja) 2004-02-12 2008-01-16 日本電信電話株式会社 音声ミキシング方法、音声ミキシング装置、音声ミキシングプログラム及びこれを記録した記録媒体
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
SE0400998D0 (sv) * 2004-04-16 2004-04-16 Cooding Technologies Sweden Ab Method for representing multi-channel audio signals
DE602005022235D1 (de) * 2004-05-19 2010-08-19 Panasonic Corp Audiosignalkodierer und Audiosignaldekodierer
WO2006004048A1 (ja) * 2004-07-06 2006-01-12 Matsushita Electric Industrial Co., Ltd. オーディオ信号符号化装置、オーディオ信号復号化装置、方法、及びプログラム
JP2006067367A (ja) 2004-08-27 2006-03-09 Matsushita Electric Ind Co Ltd 符号化オーディオ信号の編集装置
KR101236259B1 (ko) * 2004-11-30 2013-02-22 에이저 시스템즈 엘엘시 오디오 채널들을 인코딩하는 방법 및 장치
KR100682904B1 (ko) * 2004-12-01 2007-02-15 삼성전자주식회사 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법
EP1691348A1 (en) * 2005-02-14 2006-08-16 Ecole Polytechnique Federale De Lausanne Parametric joint-coding of audio sources
US7961890B2 (en) * 2005-04-15 2011-06-14 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Multi-channel hierarchical audio coding with compact side information
US7751572B2 (en) 2005-04-15 2010-07-06 Dolby International Ab Adaptive residual audio coding
JP2006323314A (ja) 2005-05-20 2006-11-30 Matsushita Electric Ind Co Ltd マルチチャネル音声信号をバイノーラルキュー符号化する装置
EP1920636B1 (en) * 2005-08-30 2009-12-30 LG Electronics Inc. Apparatus and method for decoding an audio signal
US7761289B2 (en) * 2005-10-24 2010-07-20 Lg Electronics Inc. Removing time delays in signal paths
KR100888474B1 (ko) 2005-11-21 2009-03-12 삼성전자주식회사 멀티채널 오디오 신호의 부호화/복호화 장치 및 방법
CN101390443B (zh) * 2006-02-21 2010-12-01 皇家飞利浦电子股份有限公司 音频编码和解码
KR20080071971A (ko) * 2006-03-30 2008-08-05 엘지전자 주식회사 미디어 신호 처리 방법 및 장치
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
MX2009000086A (es) * 2006-07-07 2009-01-23 Fraunhofer Ges Forschung Concepto para combinar multiples fuentes de audio parametricamente codificadas.
CN100512422C (zh) * 2006-11-23 2009-07-08 北京航空航天大学 多mcu视频会议系统中的混音方法
EP2146522A1 (en) * 2008-07-17 2010-01-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio output signals using object based metadata

Also Published As

Publication number Publication date
EP2128856A1 (en) 2009-12-02
BRPI0806228A8 (pt) 2016-11-29
CN101578655A (zh) 2009-11-11
RU2473139C2 (ru) 2013-01-20
RU2009122690A (ru) 2010-12-20
US20100063828A1 (en) 2010-03-11
EP2128856A4 (en) 2011-11-02
CN101578655B (zh) 2013-06-05
WO2009050896A1 (ja) 2009-04-23
JP2013137563A (ja) 2013-07-11
US8391513B2 (en) 2013-03-05
JPWO2009050896A1 (ja) 2011-02-24

Similar Documents

Publication Publication Date Title
BRPI0806228A2 (pt) dispositivo de sintetização de fluxo, unidade de decodificação e método
JP4601669B2 (ja) マルチチャネル信号またはパラメータデータセットを生成する装置および方法
JP6583485B2 (ja) テレビジョン受像機および信号処理方法、並びにプログラム
RU2648590C2 (ru) Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
JP6331095B2 (ja) 復号装置および方法、符号化装置および方法、並びにプログラム
US9484039B2 (en) Method and an apparatus for processing an audio signal
RU2649944C2 (ru) Устройство декодирования, способ декодирования, устройство кодирования, способ кодирования и программа
JP2014089467A (ja) マルチチャンネルオーディオ信号のエンコーディング/デコーディングシステム、記録媒体及び方法
US20070168183A1 (en) Audio distribution system, an audio encoder, an audio decoder and methods of operation therefore
WO2006070757A1 (ja) 音声符号化装置および音声符号化方法
WO2009122757A1 (ja) ステレオ信号変換装置、ステレオ信号逆変換装置およびこれらの方法
GB2580899A (en) Audio representation and associated rendering

Legal Events

Date Code Title Description
B25A Requested transfer of rights approved

Owner name: PANASONIC INTELLECTUAL PROPERTY MANAGEMENT CO., LT

B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B11B Dismissal acc. art. 36, par 1 of ipl - no reply within 90 days to fullfil the necessary requirements