BRPI0316498B1 - Método e aparelho para processar sinais de áudio de um fluxo de bits - Google Patents

Método e aparelho para processar sinais de áudio de um fluxo de bits Download PDF

Info

Publication number
BRPI0316498B1
BRPI0316498B1 BRPI0316498-5A BRPI0316498A BRPI0316498B1 BR PI0316498 B1 BRPI0316498 B1 BR PI0316498B1 BR PI0316498 A BRPI0316498 A BR PI0316498A BR PI0316498 B1 BRPI0316498 B1 BR PI0316498B1
Authority
BR
Brazil
Prior art keywords
channel
channels
mixing
switching
channel configuration
Prior art date
Application number
BRPI0316498-5A
Other languages
English (en)
Inventor
Schmidt Jürgen
Spille Jens
F. Schröder Ernst
Böhm Johannes
Original Assignee
Thomson Licensing S.A.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing S.A. filed Critical Thomson Licensing S.A.
Publication of BRPI0316498B1 publication Critical patent/BRPI0316498B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

"método e aparelho para processar sinais de áudio de um fluxo de bits". no padrão iso/iec 14496:2001 mpeg-4, diversos objetos de áudio que podem ser codificados com diferentes tipos de codificação do formato mpeg-4 podem juntos formar um sistema de áudio composto que representa uma única trilha de som proveniente de diversos subfluxos de bits. em um receptor, os múltiplos objetos de áudio são decodificados separadamente, mas não diretamente reproduzidos para um ouvinte. em vez disso, instruções transmitidas para mixagem são usadas para preparar uma única trilha de som. conflitos de mixagem podem ocorrer no caso de os sinais de áudio a ser combinados terem diferentes números ou configurações de canal. de acordo com a invenção, é usado um nó de configuração de canal de áudio adicional que sinaliza os itens de informação de configuração de canal corretos para os fluxos de dados de áudio decodificados a ser apresentados. a invenção permite que o provedor de conteúdo ajuste a configuração de canal de uma maneira tal que o apresentador no lado do receptor possa produzir uma apresentação de canal correta sob todas as circunstâncias. um valor de código de escape nos dados de configuração de canal facilita o correto tratamento de combinações de canais ainda não definidas.

Description

(54) Título: MÉTODO E APARELHO PARA PROCESSAR SINAIS DE ÁUDIO DE UM FLUXO DE BITS (51) Int.CI.: H04S 1/00; H04S 3/00 (30) Prioridade Unionista: 02/12/2002 EP 02026779.5 (73) Titular(es): THOMSON LICENSING S.A.
(72) Inventor(es): JÜRGEN SCHMIDT; JENS SPILLE; ERNST F. SCHRÕDER; JOHANNES BÕHM
MÉTODO E APARELHO PARA PROCESSAR SINAIS DE ÁUDIO
DE UM FLUXO DE BITS
A invenção diz respeito a um método e a um aparelho para processar dois ou mais sinais de áudio inicialmente decodificados recebidos ou reproduzidos de um fluxo de bits que têm cada qual um número diferente de canais e/ou configurações de canais diferentes, e que são combinados antes de ser apresentados em uma configuração de canal final.
ANTECEDENTES DA INVENÇÃO
No padrão ISO/IEC 14496:2001 MPEG-4, em particular na parte 3 Áudio e na parte 1 Sistemas, diversos objetos de áudio que podem ser codificados com diferentes tipos de codificação de formato MPEG-4 podem juntos formar um sistema de áudio composto que representa uma única trilha de som a partir de diversos subfluxos de áudio. Interação do usuário, capacidade de terminal e configuração de alto-falante podem ser usadas durante a determinação de como produzir uma única trilha de som a partir de objetos componentes. Composição de áudio significa misturar múltiplos objetos de áudio individuais para criar uma única trilha de som, por exemplo, um único canal ou um único par estéreo. Um conjunto de instruções para mistura é transmitido ou transferido no fluxo de bits. Em um receptor, os múltiplos objetos de áudio são decodificados separadamente, mas não executados diretamente para um ouvinte. Em vez disso, as instruções transmitidas para mistura são usadas para preparar uma única trilha de som a partir dos objetos de áudio decodificados. Esta trilha de som final é então executada para o ouvinte.
ISO/IEC 14496:2001 é a segunda versão do padrão de· áudio MPEG-4, enquanto que ISO/IEC 14496 é a primeira versão. No padrão de áudio MPEG-4 são descritas notas para apresentar áudio. Fluxos de cabeçalhos que contêm informação de configuração, que é necessária para decodificar subfluxos de áudio, são transportados por meio de sistemas MPEG-4. Em uma cena de áudio simples, a configuração do canal do decodif icador de áudio, por exemplo, 5.1 multicanal - pode ser alimentada dentro do Compositor de um nó até o no seguinte, de maneira tal que informação de configuração de canal possa chegar ao apresentador, que é responsável pelo correto mapeamento de alto-falante. O apresentador representa essa parte final da cadeia de áudio que não está mais sob o controle do radiodifusor ou provedor de conteúdo, por exemplo, um amplificador de áudio que tem controle de volume e os altofalantes anexos.
1' significa uma etapa ou unidade de processamento usada no padrão MPEG-4 referido, por exemplo, uma interface que leva sincronização de tempo sem conexão entre um decodificador e as unidades de processamento subseqüente, ou uma interface correspondente entre o apresentador e uma unidade de processamento a montante. Em geral, em XSO/IEC 14496-1:2001, a descrição da cena é representada usando uma abordagem paramétrica. A descrição consiste de uma hierarquia codificada ou árvore de nós com atributos e outra informação incluindo fontes de eventos e alvos. Nós de folhas nesta árvore correspondem a dados audiovisuais elementares, enquanto que nós intermediárias agrupam este material para formar objetos audiovisuais, e realizam, por exemplo, agrupamento e transformação em tais objetos audiovisuais (nós de descrição de cena) .
Decodificadores de ãudío tanto têm uma configura5 ção de canal pré-determinada por definição, como recebem, por exemplo, alguns itens de informação de configuração para ajustar suas configurações de canal.
INVENÇÃO
Normalmente, na árvore de processamento de áudio, 10 a configuração de canal dos decodificadores de áudio pode ser usada para o mapeamento de alto-falante que ocorre depois de passar o nó de som, ver ISO/IEC 14496-3:2001, capítulo 1.6.3.4 Configuração de Canal. Portanto, conforme mostrado na figura 1, uma implementação de execução MPEG-4 pas15 sa esses itens de informação, que são transmitidos dentro de fluxos de bits MPEG-4 recebidos, juntamente com saída ou saídas do decodificador através dos nós de ãudío AudioSource e
Sound2D ao apresentador. Os dados de configuração de canal ChannelConf íg devem ser usados pelo apresentador para fazer a associação correta de alto-falante, especialmente no caso de áudio multicanais (numChan > 1) , onde o phaseGroup sinaliza os nós de áudio que devem ser ajustados.
Entretanto, durante a combinação ou composição de subfluxos de áudio com diferentes associações de canal, por exemplo, o som ambiente de múltiplos canais 5.1 e estéreo 2.0, parte dos nós de áudio (AudioMix, AudioSwitch e AudioFX) definidos no padrão MPEG-4 atual supramencionado pode mudar a associação de canal fixa que é exigida para a repre4 sentação correta do canal, isto é, tais nós de áudio têm urtí comportamento variante com o canal, levando a conflito na transmissão da configuração do canal.
Um problema a ser solucionado pela invenção é lidar devidamente com tais conflitos de configuração de canal, de maneira tal que o apresentador possa reproduzir som com as associações de canal corretas ou desejadas. Este problema é solucionado pelo método revelado na reivindicação 1. Um aparelho que utiliza este método está revelado na reivindicação 3.
A invenção revela maneiras diferentes, mas afins, de solucionar tal confusão de configuração de canal usando nós de áudio de canal variante. Um nó de configuração de canal de áudio adicional é usado, ou sua funcionalidade é adicionada aos nós de mistura e/ou comutação de áudio existentes. Este nó.de configuração de canal de áudio adicional sinaliza itens de informação de configuração de canal correta aos fluxos de dados de áudio decodificados que passam através do nó Sound2D até o apresentador.
Vantajosamente, a invenção permite que o provedor de conteúdo ou radiodifusor ajuste a configuração do canal de uma maneira tal que o apresentador no lado do receptor possa produzir uma apresentação de canal correta sob todas circunstâncias. Um valor de código de escape nos dados de configuração de canal facilita o tratamento correto de combinações de canal ainda não definidas, mesmo no caso de sinais que têm configurações de canal diferentes serem mixados e/ou comutados entre si. A invenção pode também ser usada em qualquer outra aplicação de múltiplos canais, em que os dados do canal recebidos são passados através de uma unidade de pós-processamento que tem uma capacidade inerente de intercambiar os canais recebidos na reprodução.
Em princípio, o método inventivo é adequado para processar dois ou mais sinais de áudio inicialmente decodificados recebidos ou reproduzidos de um fluxo de bits, que têm cada qual um número diferente de canais e/ou configurações de canal diferentes, e que são combinados por mistura e/ou comutação antes de ser apresentados em uma configuração de canal final, em que, em cada um dos ditos sinais de áudio inicialmente decodificados, uma informação de configuração de canal especifica correspondente é controlada, de maneira tal que, no caso de o número não casado de canais e/ou tipos de configurações de canal, o número e/ou configuração dos canais para saída após a dita mistura e/ou após a dita comutação é determinado por mistura e/ou comutação de informação especifica relacionada provida de um provedor de conteúdo ou radiodifusor, e em que ao fluxo de dados combinados a ser apresentado uma configuração de canal atualizada de forma correspondente é anexada.
Em princípio, o aparelho inventivo inclui:
- pelo menos dois decodificadores de dados de áudio que decodificam dados de áudio recebidos ou reproduzidos de um fluxo de bits;
- dispositivo para processar os sinais de áudio inicialmente decodificados pelos ditos decodificadores de dados de áudio, em que pelo menos dois dos ditos sinais de áudio decodifica6 dos têm cada qual um número diferente de canais e/ou confi guração de canal diferente, e em que o dito processamento inclui combinação por mistura e/ou comutação;
- dispositivo para apresentar os sinais de áudio combinados em uma configuração de canal final, em que, em cada um dos ditos sinais de áudio inicialmente decodificados, uma informação de configuração de canal específica correspondente é anexada,
- em que, no dito dispositivo de processamento, a dita mistura e/ou comutação é controlada de maneira tal que, no caso de número não casado de canais e/ou tipos de configurações de canal, o número e/ou configuração dos canais para sair após a dita mistura e/ou após a dita comutação é determinado pela informação de mistura e/ou comutação específica relacionada provida de um provedor de conteúdo ou radiodifusor, e em que, ao fluxo de dados combinados alimentado no dito dispositivo de apresentação, uma informação de configuração de canal atualizada de forma correspondente é anexada.
Modalidades adicionais vantajosas da invenção estão reveladas nas respectivas reivindicações dependentes.
DESENHOS
Modalidades exemplares da invenção estão descritas com referência aos desenhos anexos, que mostram em;
Figura 1: fluxo de informação de configuração de canal transparente em um receptor;
Figura 2: conflitos de fluxo de configuração de canal em um receptor;
Figura 3: receptor inventivo incluindo um nó adi7 cional AudioChannelConfig.
MODALIDADES EXEMPLARES
Na Figura 2, um primeiro decodificador 21 fornece um sinal multicanal 5.1 decodificado por meio de um nó AudioSource ou interface 24 a uma primeira entrada Inl de um nó AudioMix ou estágio de mistura 27. Um segundo decodificador 22 fornece um sinal estéreo 2.0 por meio de um nó AudioSource ou interface 25 a uma segunda entrada In2 do nó AudioMix 27. 0 nó AudioMix 27 representa uma chave de múltiplos canais que permite conectar qualquer canal ou canais de entrada a qualquer canal ou canais de saída, por meio do que fatores de amplificação efetivos usados podem ter assim qualquer valor entre 0 = desligado e 1 = ligado, por exemplo 0,5, 0,6 ou 0,707. 0 sinal de saída do nó AudioMix 27 tendo um formato multicanal 5.1 é alimentado a uma primeira entrada de um nó AudioSwitch ou comutador ou estágio de mistura 28. Um terceiro decodificador 23 fornece um sinal decodificado 1 (centro) por meio de um nó AudioSource ou interface 26 a uma segunda entrada do nó AudioSwitch 28.
A funcionalidade deste nó AudioSwitch 28 é similar ao do nó AudioMix 27, exceto que os fatores de amplificação usados nele podem ter valores 0 = desligado ou 1 = ligado apenas. 0 nó AudioMix 27 e o nó de comutação de Áudio 28 são controlados por uma unidade ou estágio de controle 278 que recupera e/ou avalia a partir do fluxo de bits recebido de um provedor de conteúdo ou radiodifusor, por exemplo, dados de configuração de canal e outros dados neces8 sários nos nós, e alimenta esses itens de dados aos nós. Õ nó de comutação de áudio 28 produz ou avalia seqüências de decisões de comutação relacionadas à seleção de quais canais de entrada devem ser atravessados, bem como quais canais de áudio transmitidos. 0 campo de dados whichChoice correspondente especifica as seleções de canal correspondentes em função de instantes de tempo. O sinal de saída de áudio do nó AudioSwitch 28 tendo um formato estéreo 2.0 passa por meio de um nó Sound2D ou interface 29 à entrada de um apresentador ou estágio de reprodução 20.
Na Figura 2, estão mostrados dois conflitos diferentes. O primeiro conflito ocorre no nó de mistura 27, onde uma mistura de um sinal estéreo nos canais ambiente em uma configuração 5.1 está mostrada. A questão é, por exemplo, se o sinal de saída de áudio resultante teria canais 5.1, ou se os canais ambiente deve se tornar canais de formato estéreo 2.0. No caso de se selecionar um formato de saída 5.1, a solução direta seria atribuir o sinal de entrada L2 ao primeiro canal de saída lch e o sinal de entrada R2 ao segundo canal de saída 2ch. Entretanto, pode haver outras possibilidades. 0 provedor de conteúdo ou radiodifusor pode querer atribuir o sinal de entrada L2 ao canal de saída 5ch, em vez disso. Entretanto, a versão atual do padrão MPEG-4 referido não permite tal recurso.
O segundo conflito ocorre na seqüência de atualizações de campo de dados whichChoice no nó AudioSwitch 28. Dentro desta seqüência, canais fora da saída do nó AudíoMix 27 e a saída do canal único do nó AudíoSource 26 são seqüen9 cialmente selecionadas em instantes de tempo específicos. Os instantes de tempo no campo de dados whichChoice podem ser definidos, por exemplo, por cada guadro sucessivo ou grupos de quadros, a cada período de tempo predeterminado (por exemplo, 5 minutos) , cada vez que o provedor de conteúdo ou radiodifusor tiver pré-estabelecido ou comandado, ou mediante cada clique no mouse de um usuário. No exemplo dado na figura 2, em um primeiro instante de tempo, o sinal de entrada Cl é conectado ao canal de saída lch e o sinal de entrada M é conectado ao canal de saída 2ch. Em um segundo instante de tempo, o sinal de entrada Ll é conectado ao canal de saída lch e o sinal de entrada RI é conectado ao canal de saída 2ch. Em um terceiro instante de tempo, o sinal de entrada LSI é conectado ao canal de saída lch e o sinal de entrada RS1 é conectado ao canal de saída 2ch. Dentro desta seqüência, canais além da saída do nó Audiosource 27 e a saída do canal único do nó AudioSource 26 são seqüencialmente selecionadas. Entretanto, em virtude da informação de entrada contraditória no nó 28, nenhuma configuração de canal de saída correta pode ser determinada automaticamente com base na versão atual do padrão MPEG-4 referido.
Com base na suposição de que o provedor de conteúdo ou radiodifusor é para solucionar tais conflitos, três soluções inventivas são viáveis que são explicadas em relação à figura 3. Um primeiro decodificador 21 fornece um sinal multícanal 5.1 decodificado por meio de um nó Audiosource ou interface 24 a uma primeira entrada de um nó AudioMix ou estágio de mistura 27. Um segundo decodificador 22 fornecer um sinal estéreo 2.0 decodificado por meio de um nó AudioSource ou interface 25 a uma segunda entrada do nó
AudioMix 27. 0 sinal de saída do nó AudioMix 27 tendo um formato multicanal 5.1 é alimentado a uma primeira entrada de um nó AudioWsitch ou comutador ou estágio de mistura 28. Um terceiro decodificador 23 fornece um sinal 1 (centro) decodificado por meio de um nó AudioSource ou interface 26 a uma segunda entrada do nó AudioSwitch 28. Os decodificadores podem cada qual incluir na entrada um armazenamento provisório de decodificação interna ou externa. 0 sinal de saída do nó AudioSwitch 28 tendo um formato estéreo 2.0 passa por meio de um nó Sound2D ou interface 29 à entrada de um apresentador ou estágio de reprodução 20.
nó AudioMix 27 e o nó AudioSwitch 28 são controlados por uma unidade ou estágio de controle 278 que recupera e/ou avalia, a partir do fluxo de bits recebido de um provedor de conteúdo ou radiodifusor, por exemplo, dados de configuração de canal e outros dados necessários nos nós, e alimenta esses itens de dados aos nós.
Um novo nó de áudio, denominado nó AudioChannelConfig 30 é introduzido entre o nó AudioSwitch 28 e o nó Sound2D 29. Este nó tem as seguintes propriedades ou função: AudioChannelconfig{
exposedField SFInt32 numChannel 0
exposedField MFInt32 phaseGroup 0
exposedField MFInt32 channelConfig 0
exposedField MFFloat channelLocation 0,0
exposedField MFFloat channelDirection 0,0
exposedField MFInt32 polarityPattern 1 b
expressa na notação MPEG-4. SFInt32, MFInt32 e MFFloat são tipos de dados de campo simples (SF, contendo um único va5 lor) e campo múltiplo (MF, contendo múltiplos valores e a quantidade de valores) que são definidos em ISO/IEC 147721:1998, subclãusula 5.2. Int32 significa um número inteiro e Float um número de ponto flutuante. exposedField denota um campo de dados cujo conteúdo pode ser alterado pe10 lo provedor de conteúdo ou radiodifusor por cena de áudio.
O phaseGroup (especifica relacionamentos de fase na saída do nó, isto é, especifica se existe ou não relacionamentos de fase importantes entre múltiplos canais de áudio) e os campos numChannel (número de canais na saída do nó) são redefinidos pelo provedor de conteúdo por causa da correlação funcional com o campo channelConfig ou parâmetros. 0 campo channelConfig e a tabela de associação de configuração de canal a seguir podem ser definidos usando um conjunto de valores de índice predefinidos, usando assim os valores do padrão ISO/IEC 14496-3:2001 parte de áudio, capítulo 1.6.3.4. De acordo com a invenção, ele ê estendido usando alguns valores do capítulo 0.2.3.2 do padrão de áudio ISO/IEC 13818-3 MPEG-2:
valor No. de elementos sintáticos Canal para mapeamento
do ín- canais de áudio, listados na do alto-falante
dice ordem recebida
0 não espe- não especificado channelConfiguration
cíficado do nó filho é passado
1 seqüência de escape Os campos channelLoca- tion, channelDirection e polarityPattern são válidos
2 1 single çhannel- alto-falante frontal
element central
3 2 channel_pair_element alto-falantes frontais
esquerdo, direito
4 3 sin- alto-falante central,
gle channel_elernent, alto-falantes frontal
çhannel pair element esquerdo e direito
5 4 sin- alto-falante frontal
gle__channel element, central, alto-falantes
channel_pair_element, frontais centrais es-
sin- querdo e direito, al-
gle_channel element to-falantes ambientes
traseiros
6 5 sin- alto-falantes frontal,
gle_channel element, alto-falantes frontais
channel_pair_element, esquerdo e direito
channel pair element
7 5+1 sin- alto-falante frontal e
gle_channel element, central, alto-falantes
çhannel joair_element, frontais esquerdo e
channel_pair_element, direito, alto-falantes
lfe_element traseiros ambientes
direito e ambientes
esquerdo, alto-falante
de efeitos de baixa freqüência frontais
8 7 + 1 sin- gle_channel_element, çhannel jpair_element, channel_pair element, çhannel pair_element, lfe_element alto-falante frontal central, alto-falantes frontais centrais esquerdo e direito, alto-falantes frontais externos esquerdo e direito, alto-falantes traseiros ambiente direito e ambiente esquerdo, alto-falante de efeito de baixa freqüência frontal
9 2/2 MPEG-2 L, R, LS, RS alto-falantes frontais esquerdo e direito, alto-falantes traseiros ambiente esquerdo e ambiente direito
10 2/1 MPEG-2 L, R, S, alto-falantes frontais esquerdo e direito, alto-falante ambiente traseiro
Tabela 1: Associação de configuração de canais
Vantajosamente, um valor de escape 1 é definido nesta tabela tendo por exemplo índice 1 na tabela. Se este valor ocorrer, a configuração de canal desejada não é lista14 da na tabela e, portanto, os valores nos campos channelLoca' tion, channelDirection e polarityPattern devem ser usados para atribuir os canais desejados e suas propriedades. De o índice channelConfig for um índice definido na tabela, os campos channelLocation, channelDirection e polarityPattern são vetores do comprimento zero.
Nos campos channelLocation e channelDirection um arranjo vetorial flutuante pode ser definido, por meio do que os três primeiros valores flutuantes (vetor trídimensio10 nal) são associados com o primeiro canal, o 3 valores flutuantes seguintes são associados com o segundo canal, e assim por diante.
Os valores são definidos como valores x, y, z (sistema de coordenadas da direita usado em ISO/lEC 14772-1 (VRML 97)). Os valores channelLocation descrevem a direção e a distância absoluta em metros (a distância absoluta foi usada em virtude de simples o usuário poder gerar um vetor normalizado, normalmente usados em configuração de canal). 0 channelDirection é um veto unitário com o mesmo sistema de coordenadas. Por exemplo, channelLocation [0, 0, -1] relativo ao ponto de varredura de escuta significa o alto-falante central na distância de um metro. Três outros exemplos estão dados nas três linhas da tabela 2.
channelLocation channeIDire c t i on Localização
X Y Z X Y Z
0 0 -1 0 0 1 alto- falante frontal
central
k*sen(30 °) 0 1*- COS(60 °) -sen(30 D) 0 cos(60 alto- falante frontal direito
k*sen(45 k*sen(45 k*- sen(45 -sen(45 cos(45 Cubo amis-
°) COS(45 °) °) sônico (LFU) frontal superior esquerdo
Tabela 2: Exemplos para channelLocation e channelDirection polarityPattern é um veto inteiro onde os valores são restritos aos valores dados na tabela 3. Isto é ú5 til, por exemplo, no caso de som Dolby ProLogic, onde os canais dianteiros têm padrão monopolar e o canal ambiente tem característica bipolar.
polarityPattern pode ter valores de acordo com a tabela 2.
VAlor Características
0 Monopolar
1 Bipolar
3 Cardióide
4 Fone de ouvido
Em uma modalidade alternativa da invenção, o nó
AudioChannelConfig adicional 30 não está inserido. Em vez disso, a funcionalidade deste nó é adicionada aos nós do tipo AudioMix 27, AudioSwitch 28 e AudioFX (não representado).
Em uma modalidade alternativa adicional da invenção, os valores apresentados dos campos phaseGroup são adi5 cionalmente definidos para os nós existentes correspondentes AudioMix, AudioSwitch e AudioFX na primeira versão ISO/IEC 14496 do padrão MPEG-4. Esta é uma solução parcial por meio da qual os valores para os grupos de fase são tirados da tabela 1 anterior, exceto a seqüência de escape. Valores mais .0 altos são reservados para uso privado ou futuro. Por exemplo, canais que têm o phaseGroup 2 são identificados como alto-falantes dianteiros esquerdo/direito.

Claims (6)

  1. REIVINDICAÇÕES
    1. Método para processar dois ou mais sinais de áudio inicialmente decodificados (21, 22, 23) recebidos ou reproduzidos de um fluxo de bits, que têm cada qual um número diferente de canais e/ou configurações de canal diferentes, e que são combinados pela mistura (27) e/ou comutação (28) antes de ser apresentados (20) em uma configuração de canal final, em que, para cada um dos ditos sinais de áudio inicialmente decodificados, um item de informação de configuração de canal específica correspondente (ChannelConfig) é anexado, e os itens de informação de configuração de canal para os ditos dois ou mais sinais de áudio inicialmente decodificados podem demandar configurações de canal conflitantes entre si, o método sendo CARACTERIZADO pelo fato de que a dita mistura (27) e/ou comutação (28) é controlada de maneira tal que, no caso de número não casado de canais e/ou tipos de configurações de canal não casados, o número dos canais para saída e/ou o tipo de configuração dos canais para saída, após a dita mistura e/ou após a dita comutação é determinado pela informação de mistura e/ou comutação específica relacionada (278) provida de um provedor de conteúdo ou difusor e que está embutida no dito fluxo de bits, e em que, ao fluxo de dados combinados a ser apresentado, uma configuração de canal atualizada de forma correspondente é anexada (30).
  2. 2. Método, de acordo com a reivindicação 1, CARACTERIZADO pelo fato de que o dito fluxo de bits tem formato MPEG—4.
  3. 3. Aparelho para processar dois ou mais sinais de áudio inicialmente decodificados recebidos ou reproduzidos de um fluxo de bits, que têm cada qual um número diferente de canais e/ou configurações de canal diferentes, e que são combinados por mistura (27) e/ou comutação (28) antes de serem apresentados (20) em uma configuração de canal final, em que, para cada um dos ditos sinais de áudio inicialmente decodificados, um item de informação de configuração de canal específica correspondente (ChannelConfig) é anexado, e os itens de informação de configuração de canal para os ditos dois ou mais sinais de áudio inicialmente decodificados podem demandar configurações de canal conflitantes entre si, o dito aparelho incluindo:
    - pelo menos dois decodificadores de dados de áudio (21, 22, 23) que inicialmente decodificam dados de áudio recebidos ou reproduzidos do dito fluxo de bits;
    - um dispositivo (24 - 28) para processar os sinais de áudio inicialmente decodificados pelos ditos decodificadores de dados de áudio, em que pelo menos dois dos ditos sinais de áudio decodificados têm cada qual um número diferente de canais e/ou configuração de canal diferente, e em que o dito processamento inclui combinação por mistura (27) e/ou comutação (28);
    CARACTERIZADO por incluir ainda:
    - um dispositivo (20) para apresentar os sinais de áudio combinados em uma configuração de canal final, em que, no dito dispositivo de processamento (24 -28), a dita mistura (27) e/ou comutação (28) é controlada de maneira tal que, no caso de número não casado de canais e/ou tipos não casados de configurações de canal, o número dos canais para saída e/ou tipo de configuração os canais para saída após a dita mistura e/ou a dita comutação é determinado pela informação de mistura e/ou comutação específica relacionada (278) provida de um provedor de conteúdo ou difusor, e que é embutida no dito fluxo de bits; e
    - um dispositivo (30) para anexar ao dito fluxo de dados combinados alimentado para o dito dispositivo de apresentação (20) um item de informação de configuração de canal atualizada de forma correspondente.
  4. 4. Aparelho, de acordo com a reivindicação 3, CARACTERIZADO pelo fato de que o dito fluxo de bits tem formato MPEG—4.
  5. 5. Sinal de áudio inicialmente decodificado recebido ou reproduzido de um fluxo de bits, tendo um número diferente de canais e/ou configurações de canal diferentes, e que é combinado por mistura (27) e/ou comutação (28) antes de ser apresentado em uma configuração de canal final, CARACTERIZADO pelo fato de que, em cada um dos ditos sinais de áudio inicialmente decodificados, uma informação de configuração de canal específica correspondente é controlada, de maneira tal que, no caso de o número não casado de canais e/ou tipos de configurações de canal, o número e/ou configuração dos canais para saída após a dita mistura (27) e/ou após a dita comutação (28) é determinado por mistura e/ou comutação de informação específica relacionada (278) provida de um provedor de conteúdo ou radiodifusor, e em que ao flu4 xo de dados combinados a ser apresentado uma configuração de canal atualizada de forma correspondente é anexada.
  6. 6. Sinal de áudio, de acordo com a reivindicação 5, CARACTERIZADO pelo fato de que o dito fluxo de bits tem for5 mato MPEG-4 e pelo fato de que grupos de sinal de áudio poderem ser formados contendo informações especificas de mistura e/ou comutação (278) providas de um provedor de conteúdos ou difusor.
    Vpresentadoi
    5.1 Config. do canal Som2D
    5.15Config.do canal Fonte de áudw
    5.14- Config. do canal
BRPI0316498-5A 2002-12-02 2003-11-24 Método e aparelho para processar sinais de áudio de um fluxo de bits BRPI0316498B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP02026779.5 2002-12-02
EP02026779A EP1427252A1 (en) 2002-12-02 2002-12-02 Method and apparatus for processing audio signals from a bitstream
PCT/EP2003/013172 WO2004052052A2 (en) 2002-12-02 2003-11-24 Method and apparatus for processing audio signals from a bitstream

Publications (1)

Publication Number Publication Date
BRPI0316498B1 true BRPI0316498B1 (pt) 2018-01-23

Family

ID=32309353

Family Applications (2)

Application Number Title Priority Date Filing Date
BRPI0316498-5A BRPI0316498B1 (pt) 2002-12-02 2003-11-24 Método e aparelho para processar sinais de áudio de um fluxo de bits
BR0316498-5A BR0316498A (pt) 2002-12-02 2003-11-24 Método e aparelho para processar sinais de áudio de um fluxo de bits

Family Applications After (1)

Application Number Title Priority Date Filing Date
BR0316498-5A BR0316498A (pt) 2002-12-02 2003-11-24 Método e aparelho para processar sinais de áudio de um fluxo de bits

Country Status (9)

Country Link
US (1) US8082050B2 (pt)
EP (2) EP1427252A1 (pt)
JP (2) JP5031988B2 (pt)
KR (1) KR101024749B1 (pt)
CN (1) CN100525513C (pt)
AU (1) AU2003288154B2 (pt)
BR (2) BRPI0316498B1 (pt)
CA (1) CA2508220C (pt)
WO (1) WO2004052052A2 (pt)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9002716B2 (en) * 2002-12-02 2015-04-07 Thomson Licensing Method for describing the composition of audio signals
KR100745689B1 (ko) * 2004-07-09 2007-08-03 한국전자통신연구원 혼합된 오디오 스트림으로부터 오디오 객체를 분리하기위한 단말 장치 및 그 방법
US7411528B2 (en) 2005-07-11 2008-08-12 Lg Electronics Co., Ltd. Apparatus and method of processing an audio signal
JP2007157191A (ja) * 2005-11-30 2007-06-21 Toshiba Corp 音声ミクシング処理装置及び音声ミクシング処理方法
CA2646278A1 (en) * 2006-02-09 2007-08-16 Lg Electronics Inc. Method for encoding and decoding object-based audio signal and apparatus thereof
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
CN101490744B (zh) * 2006-11-24 2013-07-17 Lg电子株式会社 用于编码和解码基于对象的音频信号的方法和装置
US20080201292A1 (en) * 2007-02-20 2008-08-21 Integrated Device Technology, Inc. Method and apparatus for preserving control information embedded in digital data
KR20080082917A (ko) 2007-03-09 2008-09-12 엘지전자 주식회사 오디오 신호 처리 방법 및 이의 장치
JP5541928B2 (ja) 2007-03-09 2014-07-09 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
US20100249963A1 (en) * 2007-06-25 2010-09-30 Recollect Ltd. recording system for salvaging information in retrospect
MX2010002572A (es) 2007-09-06 2010-05-19 Lg Electronics Inc Un metodo y un aparato para descodificar una señal de audio.
KR100998913B1 (ko) * 2008-01-23 2010-12-08 엘지전자 주식회사 오디오 신호의 처리 방법 및 이의 장치
EP2083584B1 (en) 2008-01-23 2010-09-15 LG Electronics Inc. A method and an apparatus for processing an audio signal
US8615316B2 (en) 2008-01-23 2013-12-24 Lg Electronics Inc. Method and an apparatus for processing an audio signal
KR101461685B1 (ko) * 2008-03-31 2014-11-19 한국전자통신연구원 다객체 오디오 신호의 부가정보 비트스트림 생성 방법 및 장치
KR101596504B1 (ko) * 2008-04-23 2016-02-23 한국전자통신연구원 객체기반 오디오 컨텐츠의 생성/재생 방법 및 객체기반 오디오 서비스를 위한 파일 포맷 구조를 가진 데이터를 기록한 컴퓨터 판독 가능 기록 매체
CN102099854B (zh) 2008-07-15 2012-11-28 Lg电子株式会社 处理音频信号的方法和装置
EP2146342A1 (en) * 2008-07-15 2010-01-20 LG Electronics Inc. A method and an apparatus for processing an audio signal
TWI427619B (zh) * 2008-07-21 2014-02-21 Realtek Semiconductor Corp 音效混波裝置與方法
US20100057471A1 (en) * 2008-08-26 2010-03-04 Hongwei Kong Method and system for processing audio signals via separate input and output processing paths
KR101600352B1 (ko) * 2008-10-30 2016-03-07 삼성전자주식회사 멀티 채널 신호의 부호화/복호화 장치 및 방법
CN102016982B (zh) * 2009-02-04 2014-08-27 松下电器产业株式会社 结合装置、远程通信系统以及结合方法
KR101040086B1 (ko) * 2009-05-20 2011-06-09 전자부품연구원 오디오 생성방법, 오디오 생성장치, 오디오 재생방법 및 오디오 재생장치
US9154596B2 (en) * 2009-07-24 2015-10-06 Broadcom Corporation Method and system for audio system volume control
US8521316B2 (en) * 2010-03-31 2013-08-27 Apple Inc. Coordinated group musical experience
US8965545B2 (en) * 2010-09-30 2015-02-24 Google Inc. Progressive encoding of audio
US20120148075A1 (en) * 2010-12-08 2012-06-14 Creative Technology Ltd Method for optimizing reproduction of audio signals from an apparatus for audio reproduction
CN102547140A (zh) * 2010-12-31 2012-07-04 新奥特(北京)视频技术有限公司 一种支持多方式导入音频的方法
US8842842B2 (en) 2011-02-01 2014-09-23 Apple Inc. Detection of audio channel configuration
AR088777A1 (es) * 2011-03-18 2014-07-10 Fraunhofer Ges Forschung Transmision de longitud de elemento de cuadro en la codificacion de audio
US9552818B2 (en) 2012-06-14 2017-01-24 Dolby International Ab Smooth configuration switching for multichannel audio rendering based on a variable number of received channels
TWI530941B (zh) * 2013-04-03 2016-04-21 杜比實驗室特許公司 用於基於物件音頻之互動成像的方法與系統
EP2830045A1 (en) * 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Concept for audio encoding and decoding for audio channels and audio objects
CN104053047B (zh) * 2014-06-24 2018-04-10 深圳市九洲电器有限公司 一种音频输出调整装置及调整方法
CN106688251B (zh) * 2014-07-31 2019-10-01 杜比实验室特许公司 音频处理系统和方法
CN111951814A (zh) * 2014-09-04 2020-11-17 索尼公司 传输设备、传输方法、接收设备以及接收方法
CN105635893B (zh) * 2014-10-31 2019-05-10 Tcl通力电子(惠州)有限公司 终端设备及其分配声道的方法
CN107274919A (zh) * 2016-04-08 2017-10-20 王泰来 使用高保真混放器的高保真双音频播放装置及其播放方法
SG10202100336WA (en) 2017-01-10 2021-02-25 Fraunhofer Ges Forschung Audio decoder, audio encoder, method for providing a decoded audio signal, method for providing an encoded audio signal, audio stream, audio stream provider and computer program using a stream identifier
US10553224B2 (en) 2017-10-03 2020-02-04 Dolby Laboratories Licensing Corporation Method and system for inter-channel coding
US20200388292A1 (en) * 2019-06-10 2020-12-10 Google Llc Audio channel mixing

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5594800A (en) * 1991-02-15 1997-01-14 Trifield Productions Limited Sound reproduction system having a matrix converter
JPH07162384A (ja) 1993-12-06 1995-06-23 Mitsubishi Electric Corp テレビジョン受信機及びその音声信号の出力方法
DE4409368A1 (de) * 1994-03-18 1995-09-21 Fraunhofer Ges Forschung Verfahren zum Codieren mehrerer Audiosignale
JPH0831096A (ja) * 1994-07-12 1996-02-02 Matsushita Electric Ind Co Ltd オーディオデータ符号化記録装置及びオーディオデータ復号再生装置
US5647008A (en) * 1995-02-22 1997-07-08 Aztech Systems Ltd. Method and apparatus for digital mixing of audio signals in multimedia platforms
JP2766466B2 (ja) * 1995-08-02 1998-06-18 株式会社東芝 オーディオ方式、その再生方法、並びにその記録媒体及びその記録媒体への記録方法
US6259957B1 (en) * 1997-04-04 2001-07-10 Cirrus Logic, Inc. Circuits and methods for implementing audio Codecs and systems using the same
US7333863B1 (en) * 1997-05-05 2008-02-19 Warner Music Group, Inc. Recording and playback control system
US6298025B1 (en) * 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
HU222630B1 (hu) * 1997-06-03 2003-09-29 Koninklijke Philips Electronics N.V. Berendezés és eljárás digitális hangjel lejátszására adathordozóról
US6141597A (en) * 1997-09-08 2000-10-31 Picturetel Corporation Audio processor
US6654931B1 (en) * 1998-01-27 2003-11-25 At&T Corp. Systems and methods for playing, browsing and interacting with MPEG-4 coded audio-visual objects
JPH11225390A (ja) * 1998-02-04 1999-08-17 Matsushita Electric Ind Co Ltd マルチチャネルデータ再生方法
US6119091A (en) * 1998-06-26 2000-09-12 Lsi Logic Corporation DVD audio decoder having a direct access PCM FIFO
JP3632891B2 (ja) * 1998-09-07 2005-03-23 日本ビクター株式会社 オーディオ信号の伝送方法、オーディオディスク、エンコード装置及びデコード装置
JP2000148163A (ja) * 1998-11-05 2000-05-26 Victor Co Of Japan Ltd ディスクエンコード装置及びディスク再生装置
EP1021044A1 (en) * 1999-01-12 2000-07-19 Deutsche Thomson-Brandt Gmbh Method and apparatus for encoding or decoding audio or video frame data
US6466833B1 (en) * 1999-01-15 2002-10-15 Oak Technology, Inc. Method and apparatus for efficient memory use in digital audio applications
US6681077B1 (en) * 1999-04-02 2004-01-20 Matsushita Electric Industrial Co., Ltd. Optical disc, recording device and reproducing device
US6629001B1 (en) * 1999-09-15 2003-09-30 Intel Corporation Configurable controller for audio channels
US6931370B1 (en) * 1999-11-02 2005-08-16 Digital Theater Systems, Inc. System and method for providing interactive audio in a multi-channel audio environment
JP3957251B2 (ja) * 2000-03-02 2007-08-15 パイオニア株式会社 オーディオ情報再生システム、オーディオ情報再生装置及びオーディオ情報再生方法
US6351733B1 (en) * 2000-03-02 2002-02-26 Hearing Enhancement Company, Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7266501B2 (en) * 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
KR100359842B1 (ko) * 2000-03-08 2002-11-07 엘지전자 주식회사 오디오 메뉴 표시 방법
EP1134724B1 (en) * 2000-03-17 2008-07-23 Sony France S.A. Real time audio spatialisation system with high level control
US20020016882A1 (en) * 2000-04-24 2002-02-07 Hiroshi Matsuuchi Digital device, data input-output control method, and data input-output control system
US6799208B1 (en) * 2000-05-02 2004-09-28 Microsoft Corporation Resource manager architecture
US7212872B1 (en) * 2000-05-10 2007-05-01 Dts, Inc. Discrete multichannel audio with a backward compatible mix
US8495679B2 (en) * 2000-06-30 2013-07-23 Thomson Licensing Method and apparatus for delivery of television programs and targeted de-coupled advertising
GB2366709A (en) * 2000-06-30 2002-03-13 Graeme Roy Smith Modular software definable pre-amplifier
JP2002044543A (ja) * 2000-07-21 2002-02-08 Alpine Electronics Inc デジタル放送受信装置
US6757302B1 (en) * 2000-09-14 2004-06-29 Nvision, Inc. Channel status management for multichannel audio distribution
US20020124097A1 (en) * 2000-12-29 2002-09-05 Isely Larson J. Methods, systems and computer program products for zone based distribution of audio signals
JP4423790B2 (ja) * 2001-01-11 2010-03-03 ソニー株式会社 実演システム、ネットワークを介した実演方法
JP2002232375A (ja) 2001-01-30 2002-08-16 Sony Corp データ送信装置、データ受信装置、データ送信方法、データ受信方法、伝送システム
US7689598B2 (en) * 2001-02-15 2010-03-30 International Business Machines Corporation Method and system for file system synchronization between a central site and a plurality of remote sites
US7107110B2 (en) * 2001-03-05 2006-09-12 Microsoft Corporation Audio buffers with audio effects
US6804565B2 (en) * 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
US7216288B2 (en) * 2001-06-27 2007-05-08 International Business Machines Corporation Dynamic scene description emulation for playback of audio/visual streams on a scene description based playback system
US7203692B2 (en) * 2001-07-16 2007-04-10 Sony Corporation Transcoding between content data and description data
US20030021429A1 (en) * 2001-07-30 2003-01-30 Ratcliff David D. On-the-fly configurable audio processing machine
DE10140149A1 (de) * 2001-08-16 2003-02-27 Philips Corp Intellectual Pty Verfahren zur Behandlung von Nutzungskonflikten in digitalen Netzwerken
ES2203294B1 (es) * 2001-09-28 2005-06-01 Global Standards, S.L. Sistema de emisoras y dispositivos de captacion y fidelizacion de audiencia radiofonica remotamente configurables.
US20030078687A1 (en) * 2001-10-15 2003-04-24 Du Breuil Thomas Lemaigre Method and system for automatically configuring an audio environment
US7058189B1 (en) * 2001-12-14 2006-06-06 Pixel Instruments Corp. Audio monitoring and conversion apparatus and method
US20030177279A1 (en) * 2002-02-08 2003-09-18 Evans James C. Creation of middleware adapters from paradigms
US20030156108A1 (en) * 2002-02-20 2003-08-21 Anthony Vetro Consistent digital item adaptation
US7073193B2 (en) * 2002-04-16 2006-07-04 Microsoft Corporation Media content descriptions
US7072726B2 (en) * 2002-06-19 2006-07-04 Microsoft Corporation Converting M channels of digital audio data into N channels of digital audio data
US8060225B2 (en) * 2002-07-31 2011-11-15 Hewlett-Packard Development Company, L. P. Digital audio device
US7533210B2 (en) * 2002-10-24 2009-05-12 Sun Microsystems, Inc. Virtual communication interfaces for a micro-controller
US20040111677A1 (en) * 2002-12-04 2004-06-10 International Business Machines Corporation Efficient means for creating MPEG-4 intermedia format from MPEG-4 textual representation

Also Published As

Publication number Publication date
CA2508220A1 (en) 2004-06-17
KR101024749B1 (ko) 2011-03-24
EP1568250B1 (en) 2013-01-09
EP1568250A2 (en) 2005-08-31
AU2003288154B2 (en) 2008-08-07
JP5031988B2 (ja) 2012-09-26
CN100525513C (zh) 2009-08-05
JP2006508592A (ja) 2006-03-09
WO2004052052A3 (en) 2004-08-12
EP1427252A1 (en) 2004-06-09
CN1711800A (zh) 2005-12-21
KR20050085262A (ko) 2005-08-29
AU2003288154A1 (en) 2004-06-23
US20060174267A1 (en) 2006-08-03
BR0316498A (pt) 2005-10-11
CA2508220C (en) 2013-02-19
WO2004052052A2 (en) 2004-06-17
US8082050B2 (en) 2011-12-20
JP2011150358A (ja) 2011-08-04
JP5346051B2 (ja) 2013-11-20

Similar Documents

Publication Publication Date Title
BRPI0316498B1 (pt) Método e aparelho para processar sinais de áudio de um fluxo de bits
JP6523585B1 (ja) オーディオ信号処理システム及び方法
BRPI0315326B1 (pt) método para codificar e decodificar a largura de uma fonte de som em uma cena de áudio
WO2014115222A1 (en) Sound signal description method, sound signal production equipment, and sound signal reproduction equipment
Mehta et al. Recipes for creating and delivering next-generation broadcast audio
Bytheway et al. Philips White Paper Philips