BR112017003288B1 - Conceito de combinação de áudio - Google Patents

Conceito de combinação de áudio Download PDF

Info

Publication number
BR112017003288B1
BR112017003288B1 BR112017003288-0A BR112017003288A BR112017003288B1 BR 112017003288 B1 BR112017003288 B1 BR 112017003288B1 BR 112017003288 A BR112017003288 A BR 112017003288A BR 112017003288 B1 BR112017003288 B1 BR 112017003288B1
Authority
BR
Brazil
Prior art keywords
audio
data stream
audio data
access unit
unit
Prior art date
Application number
BR112017003288-0A
Other languages
English (en)
Other versions
BR112017003288A2 (pt
Inventor
Thoma Herbert
Bleidt Robert
Krägeloh Stefan
Neuendorf Max
Kuntz Achim
Niedermeier Andreas
Kratschmer Michael
Original Assignee
Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from EP15154752.8A external-priority patent/EP2996269A1/en
Application filed by Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V filed Critical Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E. V
Publication of BR112017003288A2 publication Critical patent/BR112017003288A2/pt
Publication of BR112017003288B1 publication Critical patent/BR112017003288B1/pt

Links

Abstract

A combinação de áudio é mais eficazmente renderizada pelo uso de um ou mais pacote (s) da unidade de truncamento inserido(s) no fluxo de dados de áudio, de modo a indicar a um decodificador de áudio, para uma unidade de acesso predeterminado, uma parte da extremidade de uma estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução.

Description

RELATÓRIO DESCRITIVO
[0001] O presente pedido se refere à combinação de áudio.
[0002] O áudio codificado geralmente vem em blocos de amostras, frequentemente 1024, 2048 ou 4096 amostras em número por bloco. Tais blocos são chamados de estruturas a seguir. No contexto de codecs de áudio MPEG, como Áudio AAC ou MPEG-H 3D, estes blocos/estruturas são chamados de grânulos, os blocos/estruturas codificados são chamados de unidades de acesso (AU | access units) e os blocos decodificados são chamados de unidades de composição (CU | composition units). Em sistemas de transporte, o sinal de áudio é apenas acessível e direcionável na granularidade destes blocos codificados (unidades de acesso). Seria favorável, entretanto, ser capaz de direcionar os dados de áudio em alguma granularidade final, especialmente para finalidades como combinação de fluxo ou mudanças da configuração dos dados de áudio codificado, síncronos e alinhados a outro fluxo como um fluxo de vídeo, por exemplo.
[0003] Até o momento, é conhecido o descarte de algumas amostras de uma unidade de codificação. O formato de arquivo MPEG-4, por exemplo, tem as chamadas listas de edição que podem ser utilizadas para a finalidade de descartar as amostras de áudio no início e no fim de um arquivo de áudio codificado/fluxo contínuo de dados [3]. De forma desvantajosa, o método de lista de edição funciona apenas com o formato de arquivo MPEG-4, ou seja, é específico do formato de arquivo e não funciona com formatos de fluxo como fluxos de transporte MPEG-2. Além disso, as listas de edição são profundamente incorporadas no formato de arquivo MPEG-4 e, certamente, não podem ser facilmente modificadas rapidamente pelos dispositivos de combinação de fluxo. Em AAC [1], a informação de truncamento pode ser inserida ao fluxo de dados na forma de extension_payload. Tal extension_payload em uma unidade de acesso AAC codificada é, entretanto, desvantajosa em que a informação de truncamento é profundamente incorporada em AAC AU e não pode ser facilmente modificada rapidamente pelos dispositivos de combinação de fluxo.
[0004] Por conseguinte, é um objeto da presente invenção fornecer um conceito para combinação de áudio que seja mais eficiente em termos de, por exemplo, complexidade procedural do processo de combinação em combinadores de fluxo, e/ou decodificadores de áudios.
[0005] Este objeto é alcançado pelo assunto das reivindicações independentes aqui anexadas.
[0006] A invenção do presente pedido é inspirada pela ideia de que a combinação de áudio pode ser renderizada mais efetivamente pelo uso de um ou mais pacote(s) de unidade de truncamento inserido(s) no fluxo de dados de áudio para indicar a um decodificador de áudio, para uma unidade de acesso predeterminado, uma parte da extremidade de uma estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução.
[0007] De acordo com um aspecto do presente pedido, um fluxo de dados de áudio é inicialmente fornecido com tal pacote da unidade de truncamento, a fim de renderizar o fluxo de dados de áudio então fornecido de modo mais facilmente combinável na unidade de acesso predeterminado em uma granularidade temporal mais fina do que o comprimento da estrutura de áudio. Um ou mais dos pacotes de unidade de truncamento é(são), então, direcionado(s) ao decodificador de áudio e combinador de fluxo, respectivamente. De acordo com as aplicações, um combinador de fluxo simplesmente busca tal pacote da unidade de truncamento, a fim de localizar um possível ponto de combinação. O combinador de fluxo define o pacote da unidade de truncamento corretamente para indicar uma parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada, para ser descartada em reprodução, corta o primeiro fluxo de dados de áudio na unidade de acesso predeterminado e combina o fluxo de dados de áudio com outro fluxo de dados de áudio para encostar-se na unidade de acesso predeterminado. Conforme o pacote da unidade de truncamento já é fornecido dentro do fluxo de dados de áudio combinável, nenhum dado adicional deve ser inserido pelo processo de combinação e certamente, o consumo de taxa de bit permanece inalterado até o momento.
[0008] De modo alternativo, um pacote da unidade de truncamento pode ser inserido no momento da combinação. Independentemente de fornecer inicialmente um fluxo de dados de áudio com um pacote da unidade de truncamento ou fornecimento do mesmo com um pacote da unidade de truncamento no momento da combinação, um fluxo de dados de áudio combinado tem tal pacote da unidade de truncamento inserido dentro dele com a parte de extremidade sendo uma parte da extremidade posterior no caso da unidade de acesso predeterminado sendo parte do fluxo de dados de áudio à esquerda do ponto de combinação e uma parte da extremidade anterior no caso da unidade de acesso predeterminado sendo parte do fluxo de dados de áudio subsequente ao ponto de combinação.
[0009] Aspectos vantajosos das implementações do presente pedido são o assunto das reivindicações dependentes. Em particular, as aplicações preferidas do presente pedido são descritas abaixo com relação às figuras, entre as quais:
[00010] A Figura 1 esquematicamente mostra de cima para baixo um sinal de áudio, o fluxo de dados de áudio tendo o sinal de áudio codificado nele em unidades de estruturas de áudio do sinal de áudio, um vídeo que consiste em uma sequência de estruturas e outro fluxo de dados de áudio e seu sinal de áudio codificado nele que potencialmente substituem o sinal de áudio inicial de uma certa estrutura de vídeo adiante;
[00011] A Figura 2 mostra um diagrama esquemático de um fluxo de dados de áudio combinável, ou seja, um fluxo de dados de áudio fornecido com pacotes TU, a fim de aliviar as ações de combinação, de acordo com uma aplicação do presente pedido;
[00012] A Figura 3 mostra um diagrama esquemático que ilustra um pacote TU, de acordo com uma aplicação;
[00013] A Figura 4 esquematicamente mostra um pacote TU, de acordo com uma aplicação alternativa, segundo a qual o pacote TU é capaz de sinalizar uma parte da extremidade anterior e uma parte da extremidade posterior, respectivamente;
[00014] A Figura 5 mostra um diagrama em blocos de um codificador de áudio de acordo com uma aplicação;
[00015] A Figura 6 mostra um diagrama esquemático que ilustra uma fonte de disparo para instantes de combinação interna e combinação externa, de acordo com uma aplicação, onde as mesmas dependem de uma varredura da estrutura de vídeo;
[00016] A Figura 7 mostra um diagrama em blocos esquemático de um Combinador de fluxo de acordo com uma aplicação, com a figura que adicionalmente mostra o combinador de fluxo como receptor do fluxo de dados de áudio da Figura 2 e emissor de um fluxo de dados de áudio combinado com base nele;
[00017] A Figura 8 mostra um fluxograma do modo de operação do combinador de fluxo da Figura 7 em combinação com o fluxo de dados de áudio inferior ao superior, de acordo com uma aplicação;
[00018] A Figura 9 mostra um fluxograma do modo de operação do combinador de fluxo em combinação do fluxo de dados de áudio inferior de volta ao superior, de acordo com uma aplicação;
[00019] A Figura 10 mostra um diagrama em blocos de um decodificador de áudio de acordo com uma aplicação, que adicionalmente ilustra o decodificador de áudio como receptor do fluxo de dados de áudio combinado mostrado na Figura 7;
[00020] A Figura 11 mostra um fluxograma de um modo de operação do decodificador de áudio da Figura 10, a fim de ilustrar os diferentes manuseios das unidades de acesso dependendo das mesmas sendo unidades de acesso IPF e/ou unidades de acesso compreendendo pacotes TU;
[00021] A Figura 12 mostra um exemplo de uma sintaxe do pacote TU;
[00022] As Figuras 13A a C mostram diferentes exemplos de como combinar de um fluxo de dados de áudio a outro, com o instante de combinação sendo determinado por um vídeo, aqui um vídeo em 50 estruturas por segundo e um sinal de áudio codificado nos fluxos de dados de áudio em 48 kHz com 1024 grânulos por amostra ou estruturas de áudio e com uma base de tempo de carimbo de data/hora de 90 kHz, de modo que uma duração da estrutura de vídeo seja igual a 1800 escalas de base de tempo enquanto uma estrutura de áudio ou grânulo de áudio seja igual a 1920 escalas de base de tempo;
[00023] A Figura 14 mostra um diagrama esquemático que ilustra outro caso exemplar de combinação de dois fluxos de dados de áudio em um instante de combinação determinado por uma varredura da estrutura de áudio utilizando a estrutura exemplar e as taxas de amostra das figuras 13A a C;
[00024] A Figura 15 mostra um diagrama esquemático que ilustra uma ação do codificador na combinação de dois fluxos de dados de áudio de diferentes configurações de codificação de acordo com uma aplicação;
[00025] A Figura 16 mostra diferentes casos de utilização da combinação, de acordo com uma aplicação; e
[00026] A Figura 17 mostra um diagrama em blocos de um codificador de áudio que suporta diferentes configurações de codificação de acordo com uma aplicação.
[00027] A Figura 1 mostra uma parte exemplar fora de um fluxo de dados de áudio, a fim de ilustrar os problemas que ocorrem ao tentar combinar o respectivo fluxo de dados de áudio com outro fluxo de dados de áudio. Até o momento, o fluxo de dados de áudio da Figura 1 forma um tipo de base dos fluxos de dados de áudio mostrados nas figuras subsequentes. Por conseguinte, a descrição apresentada com o fluxo de dados de áudio da Figura 1 também é válida para os fluxos de dados de áudio descritos mais abaixo.
[00028] O fluxo de dados de áudio da Figura 1 é, geralmente, indicado utilizando o sinal de referência 10. O fluxo de dados de áudio tem codificado nele um sinal de áudio 12. Em particular, o sinal de áudio 12 é codificado no fluxo de dados de áudio em unidades de estruturas de áudio 14, ou seja, partes temporais do sinal de áudio 12 que podem, conforme ilustrado na Figura 1, ser não sobrepostos e encostarem-se temporalmente, ou alternativamente se sobreporem. A forma que o sinal de áudio 12 é, em unidades das estruturas de áudio 14, fluxo de dados de áudio codificado 10 pode ser diferentemente escolhida: codificação por transformada pode ser utilizada, a fim de codificar o sinal de áudio nas unidades das estruturas de áudio 14 em fluxo de dados 10. Neste caso, uma ou várias transformações de decomposição espectral pode(podem) ser aplicada(s) ao sinal de áudio da estrutura de áudio 14, com uma ou mais transformada(s) de decomposição espectral temporalmente que abrange(m) a estrutura de áudio 14 e se estende(m) além de sua extremidade anterior e à direita. Os coeficientes de transformada de decomposição espectral são contidos dentro do fluxo de dados, de modo que o decodificador seja capaz de reconstruir a respectiva estrutura em forma de transformação inversa. As porções de transformada de sobreposição com limites de estrutura de áudio mútuas e mesmo adicionais em unidades das quais o sinal de áudio é espectralmente decomposto são janeladas com as chamadas funções de janela no lado do codificador e/ou decodificador, de modo que um chamado processo de adição por sobreposição no lado do decodificador de acordo com o qual as transformadas de composição espectral sinalizadas inversamente transformadas são sobrepostas entre si e adicionadas, revela a reconstrução do sinal de áudio 12.
[00029] Alternativamente, por exemplo, o fluxo de dados de áudio 10 tem o sinal de áudio 12 codificado nele em unidades das estruturas de áudio 14 utilizando a previsão linear, de acordo à qual as estruturas de áudio são codificadas utilizando os coeficientes de previsão linear e a representação codificada do residual de previsão utilizando, por sua vez, coeficientes de previsão de longo prazo (LTP | long term prediction) como ganho de LTP e atraso de LTP, índices do livro de códigos e/ou uma codificação por transformada da excitação (sinal residual). Mesmo aqui, a reconstrução de uma estrutura de áudio 14 no lado da decodificação pode depender de uma codificação de uma estrutura prévia ou em, por exemplo, previsões temporais de uma estrutura de áudio a outra ou a sobreposição das janelas de transformada para codificação por transformada do sinal de excitação ou similares. A circunstância é aqui mencionada, pois possui uma função na seguinte descrição.
[00030] Para fins de transmissão e manipulação de rede, o fluxo de dados de áudio 10 é composto por uma sequência de pacotes de carga 16. Cada um dos pacotes de carga 16 pertence a uma respectiva da sequência de unidades de acesso 18 na qual o fluxo de dados de áudio 10 é dividido ao longo da ordem do fluxo 20. Cada uma das unidades de acesso 18 está associada a uma estrutura respectiva das estruturas de áudio 14, conforme indicado pelas setas de cabeça dupla 22 na Figura 1. Conforme ilustrado na Figura 1, a ordem temporal das estruturas de áudio 14 pode coincidir com a ordem das estruturas de áudio 18 associadas no fluxo de dados 10: uma estrutura de áudio 14 imediatamente subsequente a outra estrutura pode ser associada a uma unidade de acesso no fluxo de dados 10 imediatamente subsequente à unidade de acesso de outra estrutura de áudio no fluxo de dados 10.
[00031] Isto é, conforme descrito na Figura 1, cada unidade de acesso 18 pode ter um ou mais pacote(s) de carga 16. Um ou mais dos pacotes de carga 16 de uma certa unidade de acesso 18 tem/têm codificados nele(s) os parâmetros de codificação previamente mencionados que descrevem a estrutura associada 14 como os coeficientes de transformada de decomposição espectral, LPCs, e/ou uma codificação do sinal de excitação.
[00032] O fluxo de dados de áudio 10 também pode compreender a informação de carimbo de data/hora 24 que indica, para cada unidade de acesso 18 do fluxo de dados 10, este carimbo de data/hora ti no qual a estrutura de áudio i à qual a respectiva unidade de acesso 18 AUi está associada, deve ser reproduzida. A informação de carimbo de data/hora 24 pode, conforme ilustrado na Figura 1, ser inserida em um de um ou mais dos pacotes 16 de cada unidade de acesso 18 para indicar o carimbo de data/hora da estrutura de áudio associada, mas diferentes soluções também são possíveis, como a inserção da informação de carimbo de data/hora ti de uma estrutura de áudio i em cada um ou mais dos pacotes da unidade de acesso AUi associada.
[00033] Devido à realização de pacotes, a divisão da unidade de acesso e a informação de carimbo de data/hora 24, o fluxo de dados de áudio 10 é especialmente adequado para ser transmitido entre o codificador e o decodificador. Isto é, o fluxo de dados de áudio 10 da Figura 1 é um fluxo de dados de áudio do formato de fluxo. O fluxo de dados de áudio da Figura 1 pode, por exemplo, ser um fluxo de dados de áudio de acordo com Áudio MPEG-H 3D ou MHAS [2].
[00034] A fim de facilitar o manuseio de transporte/rede, os pacotes 16 podem ter tamanhos alinhados por byte e pacotes 16 de diferentes tipos podem ser distinguidos. Por exemplo, alguns pacotes 16 podem se referir a um primeiro canal de áudio ou um primeiro conjunto de canais de áudio e ter um primeiro tipo de pacote associado a ele, enquanto os pacotes tendo outro tipo de pacote associado a ele têm codificado nele outro canal de áudio ou outro conjunto de canais de áudio do sinal de áudio 12 codificado nele. Ainda, pacotes adicionais podem ser de um tipo de pacote que raramente carrega dados de mudança como os dados de configuração, parâmetros de codificação sendo válidos, ou sendo utilizados pela sequência de unidades de acesso. Ainda outros pacotes 16 podem ser de um tipo de pacote que carrega os parâmetros de codificação válidos para as unidades de acesso às quais eles pertencem, enquanto outros pacotes de carga carregam codificações de valores de amostras, coeficientes de transformada, coeficientes de LPC, ou similares. Certamente, cada pacote 16 pode ter um tipo de indicador de pacote sobre ele que seja facilmente acessível por entidades de rede intermediárias e o decodificador, respectivamente. Os pacotes TU descritos a seguir podem ser distinguíveis dos pacotes de carga por tipo de pacote.
[00035] Desde que o fluxo de dados de áudio 10 seja transmitido como é, nenhum problema ocorre. Entretanto, imagine que o sinal de áudio 12 deve ser reproduzido no lado da decodificação até algum ponto no tempo exemplarmente indicado por T na Figura 1, apenas. A Figura 1 ilustra, por exemplo, que este ponto no tempo T pode ser determinado por algum relógio externo, como um relógio da estrutura de vídeo. A Figura 1, por exemplo, ilustra em 26 um vídeo composto por uma sequência de estruturas 28 em uma forma alinhada com o tempo com relação ao sinal de áudio 12, uma em cima da outra. Por exemplo, o carimbo de data/hora Testrutura poderia ser o carimbo de data/hora da primeira foto de uma nova cena, novo programa ou similares, e certamente poderia ser desejado que o sinal de áudio 12 fosse cortado neste momento T = Testrutura e substituído por outro sinal de áudio 12 deste momento em diante, representando, por exemplo, o sinal de tom da nova cena ou programa. A Figura 1, por exemplo, ilustra um fluxo de dados de áudio 30 já existente construído da mesma forma que o fluxo de dados de áudio 10, ou seja, utilizando unidades de acesso 18 compostas por um ou mais pacote(s) de carga 16 no(s) qual(quais) o sinal de áudio 32 que acompanha ou que descreve a sequência de fotos de estruturas 28 inicia no carimbo de data/hora Testrutura nas estruturas de áudio 14 de forma que a primeira estrutura de áudio 14 tenha sua extremidade anterior coincidindo com o carimbo de data/hora Testrutura, ou seja, o sinal de áudio 32 deve ser reproduzido com a extremidade anterior da estrutura 14 registrada para a reprodução do carimbo de data/hora Testrutura.
[00036] Desvantajosamente, entretanto, a taxa de estrutura das estruturas 14 do fluxo de dados de áudio 10 é completamente independente da taxa de estrutura do vídeo 26. É, por conseguinte, completamente aleatório dentro de onde uma certa estrutura 14 do sinal de áudio 12 T = Testrutura cai. Isto é, sem qualquer medição adicional, seria meramente possível sair completamente da unidade de acesso AUj associada com a estrutura de áudio 14, j, dentro da qual T fica, e unindo na unidade de acesso AUj-1 antecessora do fluxo de dados de áudio 10 a sequência de unidades de acesso 18 do fluxo de dados de áudio 30, entretanto, causando, assim, um silencia na parte da extremidade anterior 34 da estrutura de áudio j do sinal de áudio 12.
[00037] As várias aplicações descritas a seguir superam a deficiência descrita acima e permitem lidar com tais problemas de combinação.
[00038] A Figura 2 mostra um fluxo de dados, de áudio de acordo com uma aplicação do presente pedido. O fluxo de dados de áudio da Figura 2 é geralmente indicado utilizando o sinal de referência 40. Primeiramente, a construção do sinal de áudio 40 coincide com a explicada acima com relação ao fluxo de dados de áudio 10, ou seja, o fluxo de dados de áudio 40 compreende uma sequência de pacotes de carga, a saber, um ou mais para cada unidade de acesso 18 na qual o fluxo de dados 40 é dividido. Cada unidade de acesso 18 está associada a uma certa das estruturas de áudio do sinal de áudio que é codificada no fluxo de dados 40 nas unidades das estruturas de áudio 14. Além disso, entretanto, o fluxo de dados de áudio 40 foi “preparado” para ser combinado dentro de uma estrutura de áudio à qual qualquer unidade de acesso predeterminado está associada. Aqui, isto é exemplarmente a unidade de acesso AUi e a unidade de acesso AUj. Vamos nos referir à unidade de acesso AUi primeiro. Em particular, o fluxo de dados de áudio 40 é renderizado “combinável” por ter um pacote da unidade de truncamento 42 inserido nele, o pacote da unidade de truncamento 42 sendo ajustável para indicar, para a unidade de acesso AUi, uma parte de extremidade da estrutura de áudio associada i a ser descartada na reprodução. As vantagens e efeitos do pacote da unidade de truncamento 42 serão discutidos a seguir. Algumas observações preliminares, entretanto, devem ser feitas com relação ao posicionamento do pacote da unidade de truncamento 42 e o conteúdo respectivo. Por exemplo, embora a Figura 2 mostre o pacote da unidade de truncamento 42 como sendo posicionado dentro da unidade de acesso AUi, ou seja, àquela parte de extremidade da qual o pacote da unidade de truncamento 42 indica, o pacote da unidade de truncamento 42 pode alternativamente ser posicionado em qualquer unidade de acesso anterior à unidade de acesso AUi. Do mesmo modo, mesmo se o pacote da unidade de truncamento 42 estiver dentro da unidade de acesso AUi, a unidade de acesso 42 não é exigida ser o primeiro pacote na respectiva unidade de acesso AUi, conforme ilustrado de forma exemplar na Figura 2.
[00039] De acordo com uma aplicação que é ilustrada na Figura 3, a parte de extremidade indicada pelo pacote da unidade de truncamento 42 é uma parte da extremidade posterior 44, ou seja, uma parte da estrutura 14 que se estende de algum instante tinterno dentro da estrutura de áudio 14 para a extremidade posterior da estrutura 14. Em outras palavras, de acordo com a aplicação da Figura 3, não há elemento de sintaxe que sinaliza se a parte de extremidade indicada pelo pacote da unidade de truncamento 42 deve ser uma parte da extremidade anterior ou uma parte da extremidade posterior. Entretanto, o pacote da unidade de truncamento 42 da Figura 3 compreende um índice do tipo de pacote 46 indicando que o pacote 42 é um pacote da unidade de truncamento e um elemento de comprimento do truncamento 48 indicando um comprimento do truncamento, ou seja, o comprimento temporal Δt da parte da extremidade posterior 44. O comprimento do truncamento 48 pode medir o comprimento da parte 44 em unidades de amostras de áudio individuais ou em n-tuplos de amostras de áudio consecutivas, com n sendo maior do que um e sendo, por exemplo, menor do que N amostras, com N sendo o número de amostras na estrutura 14.
[00040] Será descrito posteriormente que o pacote da unidade de truncamento 42 pode opcionalmente compreender um ou mais indicador(es) 50 e 52. Por exemplo, o indicador 50 poderia ser um indicador de combinação externa indicando que a unidade de acesso AUi para a qual o pacote da unidade de truncamento 42 indica a parte de extremidade 44, é preparado para ser utilizado como um ponto de combinação externa. O indicador 52 poderia ser um indicador dedicado ao decodificador para indicar se a unidade de acesso AUi, de fato, foi utilizada como um ponto de combinação externa ou não. Entretanto, indicadores 50 e 52 são, conforme descrito, meramente opcionais. Por exemplo, a presença do próprio pacote TU 42 poderia ser um sinal aos combinadores de fluxo e decodificadores que a unidade de acesso a qual a unidade de truncamento 42 pertence é tal unidade de acesso adequada para combinação externa e uma definição do comprimento do truncamento 48 a zero poderia ser uma indicação ao decodificador que nenhum truncamento deve ser realizado e nenhuma combinação externa, certamente.
[00041] As observações acima com relação ao pacote TU 42 são válidas para qualquer pacote TU, tal como o pacote TU 58.
[00042] Conforme será adicionalmente descrito abaixo, a indicação de uma parte da extremidade anterior de uma unidade de acesso pode ser também necessária. Neste caso, um pacote da unidade de truncamento, como pacote TU 58, pode ser ajustável para indicar uma parte da extremidade posterior como a representada na Figura 3. Tal pacote TU 58 poderia ser distinguida dos pacotes de unidade de truncamento da parte da extremidade anterior como 42 por meios do índice de tipo de pacote da unidade de truncamento 46. Em outras palavras, diferentes tipos de pacotes poderiam ser associados com os pacotes TU 42 indicando as partes de extremidade posterior e os pacotes TU sendo para indicar as partes de extremidade anterior, respectivamente.
[00043] Para fins de integridade, a Figura 4 ilustra uma possibilidade de acordo com qual pacote da unidade de truncamento 42 compreende, além dos elementos de sintaxe mostrados na Figura 3, um indicador anterior/posterior 54 que indica se o comprimento do truncamento 48 é medido da extremidade anterior ou da extremidade posterior da estrutura de áudio i em direção à parte interna da estrutura de áudio i, ou seja, se a parte de extremidade, o comprimento do qual é indicado pelo comprimento do truncamento 48 ser uma parte da extremidade posterior 44 ou uma parte da extremidade anterior 56. O tipo de pacote dos pacotes TU seriam os mesmos então.
[00044] Conforme será descrito em mais detalhes abaixo, o pacote da unidade de truncamento 42 renderiza a unidade de acesso AUi adequada para uma combinação externa desde de que seja possível para os combinadores de fluxo descritos ainda abaixo para definir a parte da extremidade posterior 44, de modo que a partir da combinação externa externamente definida, o tempo T (comparar com a Figura 1) na reprodução da estrutura de áudio i é parado. A partir deste tempo, as estruturas de áudio do fluxo de dados de áudio de combinação interna podem ser reproduzidas.
[00045] Entretanto, a Figura 2 também ilustra um pacote da unidade de truncamento adicional 58 como sendo inserido no fluxo de dados de áudio 40, este pacote da unidade de truncamento adicional 58 sendo ajustável para indicar a unidade de acesso AUj, com j > i, que uma parte de extremidade respectiva deve ser descartada na reprodução. Neste momento, entretanto, a unidade de acesso AUj, ou seja, a unidade de acesso AUj+1, tem codificado nela sua estrutura de áudio associada j em uma forma independente da unidade de acesso AUj- 1 precursora imediata, a saber em que nenhuma referência de previsão ou registros internos do decodificador devem ser definidos como dependentes da unidade de acesso AUj-1 precursora, ou em que nenhum processo de adição por sobreposição renderiza uma reconstrução da unidade de acesso AUj-1 uma exigência para corretamente reconstruir e reproduzir a unidade de acesso AUj., a fim de distinguir a unidade de acesso AUj, que é uma unidade de acesso de reprodução imediata, de outras unidades de acesso que apresentam a partir das independências da unidade de acesso descritas acima como, inter alias, AUi, a unidade de acesso AUj é destacada utilizando hachura.
[00046] A Figura 2 ilustra o fato de que as outras unidades de acesso mostradas na Figura 2 têm sua estrutura de áudio associada codificada nelas, de forma que sua reconstrução seja dependente da unidade de acesso precursora imediata, no sentido de que a reconstrução e a reprodução corretas da respectiva estrutura de áudio com base na unidade de acesso associada sejam meramente possíveis no caso de ter acesso à unidade de acesso precursora imediata, conforme ilustrado por pequenas setas 60 indicando da unidade de acesso precursora à respectiva unidade de acesso. No caso da unidade de acesso AUj, a seta que indica da unidade de acesso precursora imediata, a saber AUj-1, à unidade de acesso AUj é cruzada, a fim de indicar a capacidade de reprodução imediata da unidade de acesso AUj. Por exemplo, a fim de fornecer esta capacidade de reprodução, a unidade de acesso AUj tem dados adicionais codificados nela, como informação de inicialização para inicializar os registros internos do decodificador, dados que possibilitam uma estimativa de informação de cancelamento de distorção geralmente fornecida pela parte temporalmente sobreposta das transformadas inversas da unidade de acesso precursora imediata ou similares.
[00047] As capacidades das unidades de acesso AUi e AUj são diferentes entre si: unidade de acesso AUi é, conforme descrito abaixo, adequada como um ponto de combinação externa devido à presença do pacote da unidade de truncamento 42. Em outras palavras, um combinador de fluxo é capaz de cortar o fluxo de dados de áudio 40 na unidade de acesso AUi para anexar unidades de acesso de outro fluxo de dados de áudio, ou seja, um fluxo de dados de áudio de combinação interna.
[00048] Isto também é possível na unidade de acesso AUj, desde que o pacote TU 58 seja capaz de indicar uma parte da extremidade posterior 44. De modo adicional ou alternativo, o pacote da unidade de truncamento 58 é ajustável para indicar uma parte da extremidade anterior, e neste caso a unidade de acesso AUj é adequada para servir como uma ocasião de combinação interna (retorno). Isto é, o pacote da unidade de truncamento 58 pode indicar uma parte da extremidade anterior da estrutura de áudio j não para ser reproduzida e até este ponto no tempo, ou seja, até a extremidade posterior desta parte da extremidade posterior, o sinal de áudio do fluxo de dados de áudio de combinação interna (de forma preliminar) pode ser reproduzido.
[00049] Por exemplo, o pacote da unidade de truncamento 42 pode ter definido o indicador de combinação externa 50 a zero, enquanto o indicador de combinação externa 50 do pacote da unidade de truncamento 58 pode ser definido a zero ou pode ser definido a 1. Alguns exemplos explícitos serão descritos mais abaixo com relação à Figura 16.
[00050] Deve ser observado que não há necessidade da existência de uma combinação interna capaz da unidade de acesso AUj. Por exemplo, o fluxo de dados de áudio a ser combinado internamente poderia ser destinado a substituir a reprodução do fluxo de dados de áudio 40 completamente do instante T adiante, ou seja, sem combinação interna (retorno) ocorrendo ao fluxo de dados de áudio 40. Entretanto, se o fluxo de dados de áudio a ser combinado internamente é para substituir o sinal de áudio do fluxo de dados de áudio 40 meramente de forma preliminar, então uma combinação interna de volta ao fluxo de dados de áudio 40 é necessária e, neste caso, para qualquer pacote TU de combinação externa 42 deve haver um pacote TU de combinação interna 58 que segue na ordem do fluxo de dados 20.
[00051] A Figura 5 mostra um codificador de áudio 70 para geração do fluxo de dados de áudio 40 da Figura 2. O codificador de áudio 70 compreende um núcleo de codificação de áudio 72 e um insersor de pacote de truncamento 74. O núcleo de codificação de áudio 72 é configurado para codificar o sinal de áudio 12 que entra no núcleo de codificação de áudio 72 em unidades das estruturas de áudio do sinal de áudio, aos pacotes de carga do fluxo de dados de áudio 40 em uma forma que foi descrita acima com relação à Figura 1, por exemplo. Isto é, o núcleo de codificação de áudio 72 pode ser um codificador de transformada que codifica o sinal de áudio 12 utilizando uma transformada revestida, por exemplo, como uma MDCT, e então que codifica os coeficientes de transformada, em que as janelas da transformada revestida podem, conforme descrito acima, cruzar os limites da estrutura entre as estruturas de áudio consecutivas, assim à esquerda em uma independência de estruturas de áudio imediatamente consecutivas e suas unidades de acesso associadas. Alternativamente, o núcleo do codificador de áudio 72 pode utilizar a codificação com base na previsão linear para codificar o sinal de áudio 12 no fluxo de dados 40. Por exemplo, o núcleo de codificação de áudio 72 codifica os coeficientes de previsão linear que descrevem o envelope espectral do sinal de áudio 12 ou alguma versão pré- filtrada respectiva em pelo menos uma base se estrutura-por- estrutura, com, adicionalmente, a codificação do sinal de excitação. Atualizações contínuas da codificação preditiva ou questões de transformada revestida referentes à codificação do sinal de excitação podem levar a interdependências entre estruturas de áudio imediatamente consecutivas e suas unidades de acesso associadas. Outros princípios de codificação são também, entretanto, imagináveis.
[00052] O insersor do pacote da unidade de truncamento 74 insere ao fluxo de dados de áudio 40 os pacotes de unidade de truncamento, como 42 e 58 na Figura 2. Conforme mostrado na Figura 5, o insersor do pacote TU 74 pode, para esta finalidade, ser responsivo a um disparador de posição de combinação 76. Por exemplo, o disparador de posição de combinação 76 pode ser informado das mudanças da cena ou do programa ou outras mudanças em um vídeo, ou seja, dentro da sequência de estruturas, e pode certamente sinalizar ao insersor do pacote da unidade de truncamento 74 qualquer primeira estrutura de tal nova cena ou programa. O sinal de áudio 12, por exemplo, representa continuamente o acompanhamento do áudio do vídeo para o caso que, por exemplo, nenhuma das cenas ou programas individuais no vídeo são substituídos por outras sequências de estrutura ou similares. Por exemplo, imagine que um vídeo representa um jogo de futebol ao vivo e que o sinal de áudio 12 é o sinal de tom relacional a ele. Então, o disparador de posição de combinação 76 pode ser operado manual ou automaticamente para identificar as partes temporais do vídeo de jogo de futebol que são submetidas à substituição potencial por anúncios, ou seja, vídeos de anúncio e, certamente, o disparador 76 sinalizaria os inícios de tais partes ao insersor do pacote TU 74, de modo que o último mencionado possa, responsivo a ele, inserir um pacote TU 42 em tal posição, a saber, referente à unidade de acesso associada com a estrutura de áudio dentro da qual a primeira estrutura de vídeo da parte potencialmente a ser substituída do vídeo começa, fica. Ainda, o disparador 76 informa ao insersor do pacote TU 74 sobre a extremidade posterior de tais partes potencialmente a serem substituídas, para inserir um pacote TU 58 em uma respectiva unidade de acesso associada a uma estrutura de áudio na qual a extremidade de tal parte cai. Desde que tais pacotes TU 58 sejam referidos, o núcleo de codificação de áudio 72 também é responsivo ao disparador 76 para, diferente ou excepcionalmente, codificar a respectiva estrutura de áudio em tal unidade de acesso AUj (comparar com a Figura 2) em uma forma que possibilita a reprodução imediata, conforme descrito acima. Entre elas, ou seja, dentro de tais partes potencialmente a serem substituídas do vídeo, o disparador 76 pode intermitentemente inserir pacotes TU 58, a fim de servir como um ponto de combinação interna ou ponto de combinação externa. De acordo com um exemplo concreto, o disparador 76 informa, por exemplo, o codificador de áudio 70 dos carimbos de data/hora da primeira ou da estrutura inicial de tal parte a ser potencialmente substituída e o carimbo de data/hora da última ou da estrutura final de tal parte, em que o codificador 70 identifica as estruturas de áudio e unidades de acesso associadas com relação a qual inserção de pacote TU e, potencialmente, codificação de reprodução imediata deve ocorrer pela identificação destas estruturas de áudio nas quais os carimbos de data/hora receberam do disparador 76 caem.
[00053] A fim de ilustrar isto, a referência é feita à Figura 6 que mostra a varredura da estrutura fixa na qual o núcleo de codificação de áudio 72 funciona, a saber em 80, junto com a varredura da estrutura fixa 82 de um vídeo a quem o sinal de áudio 12 pertence. Uma parte 84 fora do vídeo 86 é indicada utilizando uma chaveta. Esta parte 84 é, por exemplo, manualmente determinada por um operador ou completa ou parcialmente de forma automática por meios de detecção de cena. A primeira e a última estruturas 88 e 90 têm associado a elas os carimbos de data/hora Tb e Te, que ficam dentro das estruturas de áudio i e j da varredura da estrutura 80. Certamente, estas estruturas de áudio 14, ou seja, i e j, são fornecidas com os pacotes TU pelo insersor do pacote TU 74, em que o núcleo de codificação de áudio 72 utiliza o modo de reprodução imediata, a fim de gerar a unidade de acesso correspondente à estrutura de áudio j.
[00054] Deve ser observado que o insersor do pacote TU 74 pode ser configurado para inserir os pacotes TU 42 e 58 com valores padrão. Por exemplo, o elemento de comprimento do truncamento de sintaxe 48 pode ser definido a zero. Desde que o indicador de combinação interna 50 seja referido, que é opcional, o mesmo é definido pelo insersor do pacote TU 74 na forma descrita acima com relação às figuras de 2 a 4, a saber, indicando a possibilidade de combinação externa para os pacotes TU 42 e para todos os pacotes TU 58 além daqueles registrados com a estrutura final ou imagem de vídeo 86. O indicador ativo de combinação 52 seria definido a zero visto que nenhuma combinação foi aplicada até então.
[00055] Observa-se com relação ao codificador de áudio da Figura 6, que a forma de controlar a inserção de pacotes TU, ou seja, a forma de selecionar as unidades de acesso para as quais a inserção é realizada, conforme explicado com relação às figuras 5 e 6 é ilustrativa apenas e outras formas de determinar estas unidades de acesso para a qual a inserção é realizada é também possível. Por exemplo, cada unidade de acesso, cada Nésima (N>2) unidade de acesso ou cada unidade de acesso IPF poderia alternativamente ser fornecida com um pacote TU correspondente.
[00056] Foi explicitamente mencionado acima, mas preferivelmente, que os pacotes TU são codificados na forma descomprimida de modo que um consumo de bit (taxa de bit de codificação) de um respectivo pacote TU seja independente da definição real do pacote TU. Tendo dito isto, é ainda vantajoso observar que o codificador pode, opcionalmente, compreender um controle de taxa (não mostrado na Figura 5), configurado para registrar um nível de enchimento de um buffer de áudio codificado para certificar-se de que um buffer de áudio codificado no lado do decodificador, no qual o fluxo de dados 40 é recebido tampouco subfluxos, resultando assim em compartimentos, nem sobrefluxos resultando assim na perda de pacotes 12. O codificador pode, por exemplo, controlar/variar um tamanho da etapa de quantização, a fim de obedecer a restrição do nível de enchimento com a otimização de alguma medida de taxa/distorção. Em particular, o controle da taxa pode estimar o nível de enchimento do buffer de áudio codificado do decodificador assumindo uma capacidade/taxa de bit de transmissão predeterminada que pode ser constante ou quase constante e, por exemplo, ser predefinida por uma entidade externa como uma rede de transmissão. A taxa de codificação dos pacotes TU do fluxo de dados 40 é considerada pelo controle da taxa. Assim, na forma mostrada na Figura 2, ou seja, na versão gerada pelo codificador 70, o fluxo de dados 40 mantém a taxa de bit predefinida com variação, entretanto, ao redor dela, a fim de compensar a complexidade de codificação variável se o sinal de áudio 12 em termos de sua relação taxa/distorção com nenhuma sobrecarga do nível de enchimento do áudio codificado do decodificador (à esquerda ao sobrefluxo) nem descarga do mesmo (à esquerda ao sobfluxo). Entretanto, como já foi brevemente descrito acima, e será descrito em mais detalhes abaixo, cada unidade de acesso de AUi de combinação externa é, de acordo com as aplicações preferidas, suposta contribuir com a reprodução no lado do decodificador meramente para uma duração temporal menor do que o comprimento temporal de sua estrutura de áudio i. Conforme ficará mais claro a partir da descrição apresentada abaixo, a unidade de acesso (à esquerda) de um fluxo de dados de áudio de combinação interna combinada com o fluxo de dados 40 na respectiva AU de combinação externa como AUi como uma interface de combinação, deslocará as respectivas AUs sucessoras da AU’ de combinação externa. Assim, daqui em diante, o controle da taxa de bit realizado dentro do codificador 70 é obsoleto. Além disso, a referida AU à esquerda é preferivelmente codificada em uma forma independente para possibilitar a reprodução imediata, consumindo, assim, mais taxa de bit codificada em comparação às AUs sem IPF. Assim, de acordo com uma aplicação, o codificador 70 planeja ou programa o controle da taxa, de modo que o nível de enchimento registrado na respectiva extremidade da AU de combinação externa, ou seja, na sua borda à AU sucessora imediata, por exemplo, um valor predeterminado, como ^ ou um valor entre 34 e 1/8 do nível de enchimento máximo. Por esta medida, outros codificadores que preparam os fluxos de dados de áudio supostos serem combinados no fluxo de dados 40 nas AUs de combinação externa do fluxo de dados 40 podem depender do fato que o nível de enchimento do buffer de áudio codificado do decodificador no momento do início para receber suas próprias AUs (a seguir, às vezes distinguidas das originais por um apóstrofo) está no valor de modo predeterminado que estes outros codificadores podem ainda desenvolver o controle da taxa corretamente. A descrição apresentada até o momento concentrada nas AUs de combinação externa do fluxo de dados 40, mas a aderência ao nível de enchimento estimado/registrado predeterminado também pode ser obtida pelo controle da taxa para AUs de combinação interna (retorno) como AUj mesmo se não estiver executando uma função dupla como ponto de combinação interna e ponto de combinação externa. Assim, os outros referidos codificadores podem, do mesmo modo, controlar seu controle da taxa de forma que o nível de enchimento estimado ou registrado assuma um nível de enchimento predeterminado em uma AU à direita de sua sequência de AU do fluxo de dados. O mesmo pode ser o mesmo que o mencionado para o codificador 70 com relação às AUs de combinação externa. Tais AUs à direita podem ser supostas para formar AUs de combinação de retorno supostas a formar um ponto de combinação com as AUs de combinação interna do fluxo de dados 40 como AUj. Assim, se o controle da taxa do codificador 70 tiver planejado/programado a taxa de bit codificada, de modo que o nível de enchimento estimado/registrado assuma o nível de enchimento predeterminado na (ou melhor após) AUj, então este controle da taxa de bit permanece ainda válido no caso da combinação ter sido realizada após a codificação e a emissão do fluxo de dados 40. O nível de enchimento predeterminado acima mencionado pode ser conhecido aos codificadores por padrão, ou seja, acordados entre eles. Alternativamente, a respectiva AU poderia ser fornecida com uma sinalização explícita deste nível de enchimento estimado/registrado como assumido logo após a respectiva AU de AU de combinação interna ou AU de combinação externa. Por exemplo, o valor poderia ser transmitido no pacote TU da respectiva AU de combinação interna ou AU de combinação externa. Isto custa informações adicionais suplementares, mas o controle da taxa do codificador poderia ser fornecido com mais liberdade no desenvolvimento do nível de enchimento estimado/registrado na AU de combinação interna ou na AU de combinação externa: por exemplo, pode ser suficiente então que o nível de enchimento estimado/registrado após a respectiva AU de combinação interna ou AU de combinação externa estar abaixo de algum limite como 34 do nível de enchimento máximo, ou seja, a capacidade maximamente garantida do buffer de áudio codificado do decodificador.
[00057] Com relação ao fluxo de dados 40, isto significa que o mesmo tem sua taxa controlada para variar aproximadamente em uma taxa de bit média predeterminada, ou seja, tem uma taxa de bit média. A taxa de bit real do fluxo de dados de áudio combinável varia pela sequência de pacotes, ou seja, temporalmente. O desvio (atual) da taxa de bit média predeterminada pode ser integrado temporalmente. Este desvio integrado assume, nas unidades de acesso de combinação interna e de combinação externa, um valor dentro de um intervalo predeterminado que pode ser menor do que ^ largura do que uma faixa (máx-mín) do desvio integrado da taxa de bit, ou pode assumir um valor fixo, por exemplo, valor igual para todas as AUs de combinação interna e de combinação externa, que podem ser menores do que 34 de um máximo do desvio integrado da taxa de bit. Conforme descrito acima, este valor pode ser predefinido por padrão. Alternativamente, o valor não é fixado e não é igual para todas as AUs de combinação interna e de combinação externa, mas pode ser sinalizado no fluxo de dados.
[00058] A Figura 7 mostra um combinador de fluxo para combinação de fluxos de dados de áudio de acordo com uma aplicação. O combinador de fluxo é indicado utilizando a referência 100 e compreende uma primeira interface de entrada de áudio 102, uma segunda interface de entrada de áudio 104, um configurador do ponto de combinação 106 e um multiplexador de combinação 108.
[00059] Na interface 102, o combinador de fluxo espera receber um fluxo de dados de áudio “combinável”, ou seja, um fluxo de dados de áudio fornecido com um ou mais pacote(s) TU. Na Figura 7, foi exemplarmente ilustrado que o fluxo de dados de áudio 40 da Figura 2 entra no combinador de fluxo 100 na interface 102.
[00060] Espera-se que outro fluxo de dados de áudio 110 seja recebido na interface 104. Dependendo da implementação do combinador de fluxo 100, o fluxo de dados de áudio 110 que entra na interface 104 pode ser um fluxo de dados de áudio “não preparado”, como o explicado e descrito com relação à Figura 1, ou um preparado como será descrito ilustrativamente definido abaixo.
[00061] O configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento incluído no fluxo de dados que entra na interface 102, ou seja, pacotes TU 42 e 58 do fluxo de dados 40 no caso da Figura 7, e se os pacotes de unidade de truncamento do outro fluxo de dados 110 que entra na interface 104 estiver presente, em que dois destes pacotes TU são exemplarmente mostrados na Figura 7, a saber, um pacote TU 112 na AU à esquerda ou primeira unidade de acesso AU’1 do fluxo de dados de áudio 110 e um pacote TU 114 em uma última ou unidade de acesso à direita AU’K do fluxo de dados de áudio 110. Em particular, o apóstrofo é utilizado na Figura 7, a fim de distinguir entre as unidades de acesso do fluxo de dados de áudio 110 das unidades de acesso do fluxo de dados de áudio 40. Ainda, no exemplo descrito com relação à Figura 7, assume-se que o fluxo de dados de áudio 110 deve ser pré-codificado e de comprimento fixo, a saber aqui, das unidades de acesso K, correspondente às estruturas de áudio K que juntas temporalmente abrangem um intervalo de tempo dentro do qual o sinal de áudio foi codificado no fluxo de dados 40 deve ser substituído. Na Figura 7, é exemplarmente assumido que este intervalo de tempo a ser substituído estende- se da estrutura de áudio correspondente à unidade de acesso AUi para a estrutura de áudio correspondente à unidade de acesso AUj.
[00062] Em particular, o configurador do ponto de combinação 106 é, em uma forma descrita em mais detalhes abaixo, configurada para definir os pacotes de unidade de truncamento, de modo que fique claro que um truncamento de fato acontece. Por exemplo, enquanto o comprimento do truncamento 48 dentro das unidades de truncamento dos fluxos de dados que entram nas interfaces 102 e 104 pode ser definido a zero, o configurador do ponto de combinação 106 pode mudar a definição do comprimento da transformada 48 dos pacotes TU para um valor não zero. Como o valor é determinado, é a matéria da explicação apresentada abaixo.
[00063] O multiplexador de combinação 108 é configurado para cortar o fluxo de dados de áudio 40 que entra na interface 102 em uma unidade de acesso com um pacote TU como unidade de acesso AUi com pacote TU 42, para obter uma subsequência de pacotes de carga deste fluxo de dados de áudio 40, a saber, aqui na Figura 7 exemplarmente a subsequência de pacotes de carga correspondente às unidades de acesso prévias e incluindo a unidade de acesso AUi e, então, a combinação desta subsequência com uma sequência de pacotes de carga do outro fluxo de dados de áudio 110 que entra na interface 104 de modo que os mesmos sejam imediatamente consecutivos com relação uma à outra e encostem-se na unidade de acesso predeterminado. Por exemplo, o multiplexador de combinação 108 corta o fluxo de dados de áudio 40 na unidade de acesso AUi para apenas incluir o pacote de carga pertencente a esta unidade de acesso AUi anexando, então as unidades de acesso AU’ do fluxo de dados de áudio 110 que inicia com a unidade de acesso AU’1 de modo que as unidades de acesso AUi e AU’1 encostem-se. Conforme mostrado na Figura 7, o multiplexador de combinação 108 age de forma similar no caso da unidade de acesso AUj compreendendo pacote TU 58: neste momento, o multiplexador de combinação 108 anexa o fluxo de dados 40, iniciando com os pacotes de carga pertencentes à unidade de acesso AUj, na extremidade do fluxo de dados de áudio 110, de modo que uma unidade de acesso AU’K encoste-se na unidade de acesso AUj.
[00064] Por conseguinte, o configurador do ponto de combinação 106 define o pacote TU 42 da unidade de acesso AUi para indicar que a parte de extremidade a ser descartada na reprodução é uma parte da extremidade posterior visto que o sinal de áudio do fluxo de dados de áudio 40 deve ser substituído, preliminarmente, pelo sinal de áudio codificado ao fluxo de dados de áudio 110 deste momento adiante. No caso da unidade de truncamento 58, a situação é diferente: aqui, o configurador do ponto de combinação 106 define o pacote TU 58 para indicar que a parte de extremidade a ser descartada na reprodução é uma parte da extremidade anterior da estrutura de áudio à qual a unidade de acesso AUj está associada. Deve ser recordado, entretanto, que o fato que o pacote TU 42 pertence a uma parte da extremidade posterior enquanto o pacote TU 58 se refere a uma parte da extremidade anterior já é derivável do fluxo de dados de áudio de entrada 40 em forma de utilização, por exemplo, de diferentes identificadores do pacote TU 46 para o pacote TU 42, por um lado, e o pacote TU 58, por outro lado.
[00065] O combinador de fluxo 100 emite o fluxo de dados de áudio combinado então obtido em uma interface de saída 116, em que o fluxo de dados de áudio combinado é indicado utilizando o sinal de referência 120.
[00066] Deve ser observado que a ordem na qual o multiplexador de combinação 108 e o configurador do ponto de combinação 106 operam nas unidades de acesso não precisa ser conforme representada na Figura 7. Isto é, embora a Figura 7 sugira que o multiplexador de combinação 108 tem sua entrada conectada às interfaces 102 e 104, respectivamente, com a saída respectiva sendo conectada à interface de saída 116 através do configurador do ponto de combinação 106, a ordem entre o multiplexador de combinação 108 e o configurador do ponto de combinação 106 pode ser comutada.
[00067] Na operação, o combinador de fluxo 100 pode ser configurado para inspecionar o elemento de sintaxe interno de combinação interna 50 compreendido por pacotes de unidade de truncamento 52 e 58 dentro do fluxo de dados de áudio 40 para realizar o corte e a operação de combinação na condição de se ou não o elemento de sintaxe interno de combinação interna indica o respectivo pacote da unidade de truncamento como referente a uma unidade de acesso de combinação interna. Isto significa o seguinte: o processo de combinação, ilustrado até o momento e descrito em mais detalhes abaixo, pode ter sido disparado pelo pacote TU 42, o indicador de combinação interna 50 é definido a um, conforme descrito com relação à Figura 2. Certamente, a definição deste indicador a um é detectada pelo combinador de fluxo 100, no qual a operação da combinação interna, descrita em mais detalhes abaixo, mas já descrita acima, é realizada.
[00068] Conforme descrito acima, o configurador do ponto de combinação 106 pode não precisar mudar quaisquer definições dentro dos pacotes de unidade de truncamento desde que a discriminação entre os pacotes TU de combinação interna como pacote TU 42 e os pacotes TU de combinação externa como pacotes TU 58 seja referida. Entretanto, o configurador do ponto de combinação 106 define o comprimento temporal da respectiva parte de extremidade a ser descartada na reprodução. Para esta finalidade, o configurador do ponto de combinação 106 pode ser configurado para definir um comprimento temporal da parte de extremidade à qual os pacotes TU 42, 58, 112 e 114 se referem, de acordo com um relógio externo. Este relógio externo 122 origina-se, por exemplo, de um relógio da estrutura de vídeo. Por exemplo, imagine que o sinal de áudio codificado no fluxo de dados de áudio 40 representa um sinal de tom que acompanha um vídeo e que este vídeo é o vídeo 86 da Figura 6. Imagine ainda que a estrutura 88 é encontrada, ou seja, a estrutura que começa uma parte temporal 84 na qual um anúncio deve ser inserido. O configurador do ponto de combinação 106 pode já ter detectado que a unidade de acesso AUi correspondente compreende o pacote TU 42, mas o relógio externo 122 informa que o configurador do ponto de combinação 106 no momento exato Tb no qual o sinal de tom original deste vídeo deve terminar e ser substituído pelo sinal de áudio codificado ao fluxo de dados 110. Por exemplo, este instante do ponto de combinação pode ser o instante correspondente à primeira foto ou estrutura a ser substituída pelo vídeo de anúncio que, por sua vez, é acompanhado por um sinal de tom codificado no fluxo de dados 110.
[00069] A fim de ilustrar o modo de operação do combinador de fluxo 100 da Figura 7 em mais detalhes, a referência é feita à figura 8, que mostra a sequência de etapas realizada pelo combinador de fluxo 100. O processo inicia-se com um circuito de ponderação 130. Isto é, o combinador de fluxo 100, como multiplexador de combinação 108 e/ou configurador do ponto de combinação 106, verifica o fluxo de dados de áudio 40 para um ponto de combinação interna, ou seja, para uma unidade de acesso a quem pertence o pacote da unidade de truncamento 42. No caso da Figura 7, a unidade de acesso i é a primeira unidade de acesso que passa a verificação 132 com sim, até então a verificação 132 voltar para si. Desde que a unidade de acesso do ponto de combinação interna AUi foi detectada, o pacote TU respectivo, ou seja, 42, é definido para registrar a parte da extremidade posterior da unidade de acesso do ponto de combinação interna (sua extremidade anterior respectiva) com o instante derivado do relógio externo 122. Após esta definição 134 pelo configurador do ponto de combinação 106, o multiplexador de combinação 108 alterna para o outro fluxo de dados, ou seja, o fluxo de dados de áudio 110, de modo que após a unidade de acesso de combinação interna atual AUi, as unidades de acesso do fluxo de dados 110 sejam colocadas na interface de saída 116, em vez das unidades de acesso subsequentes do fluxo de dados de áudio 40. Assumindo que o sinal de áudio que é para substituir o sinal de áudio do fluxo de dados de áudio 40 do instante da combinação interna adiante, é codificado no fluxo de dados de áudio 110 de forma que este sinal de áudio seja registrado com, ou seja, inicie imediatamente, com o início da primeira estrutura de áudio que está associada a uma primeira unidade de acesso AU’1, o combinador de fluxo 100 meramente adapta a informação de carimbo de data/hora compreendida pelo fluxo de dados de áudio 110, de modo que um carimbo de data/hora da estrutura à esquerda associada a uma primeira unidade de acesso AU’1, por exemplo, coincida com o instante de combinação interna, ou seja, o instante de AUi mais o comprimento temporal da estrutura de áudio associada com a AUi menos o comprimento temporal da parte da extremidade posterior, conforme definido na etapa 134. Isto é, após a comutação do multiplexador 136, a adaptação 138 é uma tarefa continuamente realizada para a unidade de acesso AU’ do fluxo de dados 110. Entretanto, durante este período, a rotina da combinação externa descrita a seguir é realizada também.
[00070] Em particular, a rotina da combinação externa realizada pelo combinador de fluxo 100 inicia-se com um circuito de espera de acordo com o qual as unidades de acesso do fluxo de dados de áudio 110 são continuamente verificadas para as mesmas serem fornecidas com um pacote TU 114 ou para serem a última unidade de acesso do fluxo de dados de áudio 110. Esta verificação 142 é continuamente realizada para a sequência de unidades de acesso AU’. Assim que a unidade de acesso de combinação externa foi encontrada, a saber AU’K no caso da Figura 7, então o configurador do ponto de combinação 106 define o pacote TU 114 desta unidade de acesso de combinação externa para registrar a parte da extremidade posterior a ser descartada em reprodução, a estrutura de áudio correspondente a esta unidade de acesso AUK com um instante obtido do relógio externo como um carimbo de data/hora de uma estrutura de vídeo, a saber, o primeiro após o anúncio ao qual o sinal de tom codificou no fluxo de dados de áudio 110 pertence. Após esta definição 144, o multiplexador de combinação 108 comuta de sua entrada na qual o fluxo de dados 110 é inserido, a sua outra entrada. Em particular, a comutação 146 é realizada de forma que no fluxo de dados de áudio combinado 120, a unidade de acesso AUj imediatamente siga a unidade de acesso AU’K. Em particular, a unidade de acesso AUj é a unidade de acesso do fluxo de dados 40, a estrutura de áudio que é temporalmente distanciada da estrutura de áudio associada com a unidade de acesso de combinação interna AUi por uma quantidade temporal que corresponde ao comprimento temporal do sinal de áudio codificado no fluxo de dados 110 ou desvia dele por menos do que uma quantidade predeterminada como um comprimento ou metade de um comprimento das estruturas de áudio das unidades de acesso do fluxo de dados de áudio 40.
[00071] Depois disso, o configurador do ponto de combinação 106 define, na etapa 148, o pacote TU 58 da unidade de acesso AUj para registrar a parte da extremidade anterior respectiva a ser descartada na reprodução, com o instante com o qual a parte da extremidade posterior da estrutura de áudio da unidade de acesso AU’K foi registrada na etapa 144. Por esta medida, o carimbo de data/hora da estrutura de áudio da unidade de acesso AUj é igual ao carimbo de data/hora da estrutura de áudio da unidade de acesso AU’K mais um comprimento temporal da estrutura de áudio da unidade de acesso AU’K menos a soma da parte da extremidade posterior da estrutura de áudio da unidade de acesso AU’K e da parte da extremidade anterior da estrutura de áudio da unidade de acesso AUj. Este fato se tornará mais claro observando os exemplos fornecidos mais abaixo.
[00072] Esta rotina de combinação interna também é iniciada após a comutação 146. Similar ao pingue-pongue, o combinador de fluxo 100 comuta entre o fluxo de dados de áudio contínuo 40, por um lado, e os fluxos de dados de áudio do comprimento predeterminado para substituir as partes predeterminadas, a saber estas entre as unidades de acesso com pacotes TU, por um lado, e os pacotes TU 58, por outro lado, e de volta novamente ao fluxo de áudio 40.
[00073] A comutação da interface 102 a 104 é realizada pela rotina de combinação interna, enquanto a rotina de combinação externa leva da interface 104 a 102.
[00074] Enfatiza-se, entretanto, novamente que o exemplo fornecido com relação à Figura 7 foi meramente escolhido para finalidades ilustrativas. Isto é, o combinador de fluxo 100 da Figura 7 não é restrito às partes de “ligação” a serem substituídas de um fluxo de dados de áudio 40 por fluxos de dados de áudio 110 tendo codificado neles os sinais de áudio com comprimento apropriado com a primeira unidade de acesso tendo a primeira estrutura de áudio codificado nele registrado ao início do sinal de áudio a ser inserido à parte temporal a ser substituída. Em vez disso, o combinador de fluxo pode ser, por exemplo, para realização de um processo de combinação único apenas. Além disso, o fluxo de dados de áudio 110 não é restrito para ter sua primeira estrutura de áudio registrada com o início do sinal de áudio a ser combinado internamente. Em vez disso, o próprio fluxo de dados de áudio 110 pode originar-se de alguma fonte tendo seu próprio relógio da estrutura de áudio que executa independentemente do relógio da estrutura de áudio subjacente ao fluxo de dados de áudio 40. Neste caso, a comutação do fluxo de dados de áudio 40 ao fluxo de dados de áudio 110, além das etapas mostradas na figura 8, compreenderia também a etapa de definição correspondente à etapa 148: a definição do pacote TU do fluxo de dados de áudio 110.
[00075] Deve ser observado que a descrição acima da operação do combinador de fluxo pode ser variada com relação ao carimbo de data/hora das AUs do fluxo de dados de áudio combinado 120 para o qual um pacote TU indica uma parte da extremidade anterior a ser descartada em reprodução. Em vez de deixar o original carimbo de data/hora da AU, o multiplexador de fluxo 108 poderia ser configurado para modificar o carimbo de data/hora original respectivo pela adição do comprimento temporal da parte da extremidade anterior ao carimbo de data/hora original, apontando assim para a extremidade posterior da parte da extremidade anterior e assim, ao tempo do qual o fragmento da estrutura de áudio da AU deve ser de fato reproduzido. Esta alternativa é ilustrada pelos exemplos de carimbo de data/hora na Figura 16 discutida posteriormente.
[00076] A Figura 10 mostra um decodificador de áudio 160, de acordo com uma aplicação do presente pedido. De forma exemplar, o decodificador de áudio 160 é mostrado como receptor do fluxo de dados de áudio combinado 120 gerado pelo combinador de fluxo 100. Entretanto, similar à declaração feita com relação ao combinador de fluxo, o decodificador de áudio 160 da Figura 10 não é restrito para receber os fluxos de dados de áudio combinado 120 do tipo explicado com relação às figuras 7 a 9, onde um fluxo de dados de áudio base é preliminarmente substituído por outros fluxos de dados de áudio tendo o comprimento do sinal de áudio correspondente codificado nele.
[00077] O decodificador de áudio 160 compreende um núcleo do decodificador de áudio 162 que recebe o fluxo de dados de áudio combinado e um truncador de áudio 164. O núcleo de decodificação de áudio 162 realiza a reconstrução do sinal de áudio em unidades de estruturas de áudio do sinal de áudio da sequência de pacotes de carga do fluxo de dados de áudio de entrada 120, em que, conforme explicado acima, os pacotes de carga são individualmente associados com uma respectiva da sequência de unidades de acesso na qual o fluxo de dados de áudio combinado 120 é dividido. Como cada unidade de acesso 120 está associada a uma estrutura respectiva das estruturas de áudio, o núcleo de decodificação de áudio 162 emite as amostras de áudio reconstruídas por estrutura de áudio e unidade de acesso associada, respectivamente. Conforme descrito acima, a decodificação pode envolver uma transformação espectral inversa e devido a um processo de sobreposição, adição ou, opcionalmente, conceitos de codificação preditiva, o núcleo de decodificação de áudio 162 pode reconstruir a estrutura de áudio de uma respectiva unidade de acesso enquanto adicionalmente utiliza, ou seja, dependendo da, uma unidade de acesso precursora. Entretanto, sempre que uma reprodução imediata unidade de acesso chega, como unidade de acesso AUj, o núcleo de decodificação de áudio 162 é capaz de utilizar os dados adicionais a fim de possibilitar uma reprodução imediata sem a necessidade ou expectativa de quaisquer dados de uma unidade de acesso prévia. Ainda, conforme explicado acima, o núcleo de decodificação de áudio 162 pode operar utilizando a decodificação preditiva linear. Isto é, o núcleo de decodificação de áudio 162 pode utilizar os coeficientes de previsão linear contidos na respectiva unidade de acesso a fim de formar um filtro de síntese e pode decodificar um sinal de excitação da unidade de acesso que envolve, por exemplo, a decodificação por transformada, ou seja, transformação inversa, visualizações de tabela utilizando índices contidos na respectiva unidade de acesso e/ou codificação preditiva ou atualizações de estado interno com a sujeição do sinal de excitação então obtido ao filtro de síntese ou, alternativamente, formatando o sinal de excitação no domínio espectral utilizando uma função de transferência formada para corresponder à função de transferência do filtro de síntese. O truncador de áudio 164 é responsivo aos pacotes de unidade de truncamento inseridos ao fluxo de dados de áudio 120 e trunca uma estrutura de áudio associada a uma certa unidade de acesso tendo tais pacotes TU para descartar a parte de extremidade respectiva, que é indicada para ser descartada na reprodução do pacote TU.
[00078] A Figura 11 mostra um modo de operação do decodificador de áudio 160 da Figura 10. Na detecção 170 de uma nova unidade de acesso, o decodificador de áudio verifica se ou não esta unidade de acesso é uma codificada utilizando o modo de reprodução imediata. Se a unidade de acesso atual for uma unidade de acesso de estrutura de reprodução imediata, o núcleo de decodificação de áudio 162 trata esta unidade de acesso como uma fonte independente da informação para reconstruir a estrutura de áudio associada com esta unidade de acesso atual. Isto é, conforme explicado acima, o núcleo de decodificação de áudio 162 pode preencher os registros internos para reconstrução da estrutura de áudio associada a uma unidade de acesso atual com base nos dados codificados nesta unidade de acesso. De modo adicional ou alternativo, o núcleo de decodificação de áudio 162 abstém-se de utilizar a previsão de qualquer unidade de acesso precursora como no modo não-IPF. De modo adicional ou alternativo, o núcleo de decodificação de áudio 162 não realiza qualquer processo de adição por sobreposição com qualquer unidade de acesso precursora ou sua estrutura de áudio associada precursora para finalidades de cancelamento de distorção temporalmente na extremidade anterior da estrutura de áudio da unidade de acesso atual. Em vez disso, por exemplo, o núcleo de decodificação de áudio 162 deriva a informação de cancelamento de distorção temporal da própria unidade de acesso atual. Assim, se a verificação 172 revelar que a unidade de acesso atual é uma unidade de acesso de IPF, então o modo de decodificação de IPD 174 é realizado pelo núcleo de decodificação de áudio 162, obtendo assim a reconstrução da estrutura de áudio atual. Alternativamente, se a verificação 172 revelar que a unidade de acesso atual não é uma de IPF, então o núcleo de decodificação de áudio 162 aplica-se como modo de decodificação não-IPF na unidade de acesso atual. Isto é, os registros internos do núcleo de decodificação de áudio 162 podem ser adotados da forma que estão após o processamento da unidade de acesso prévia. De modo alternativo ou adicional, um processo de adição por sobreposição pode ser utilizado para ajudar na reconstrução temporal da extremidade posterior da estrutura de áudio da unidade de acesso atual. De modo adicional ou alternativo, a previsão da unidade de acesso precursora pode ser utilizada. A decodificação de não-IPF 176 também termina em uma reconstrução da estrutura de áudio da unidade de acesso atual. Uma próxima verificação 178 verifica se qualquer truncamento deve ser realizado. A verificação 178 é realizada pelo truncador de áudio 164. Em particular, o truncador de áudio 164 verifica se a unidade de acesso atual tem um pacote TU e se o pacote TU indica uma parte de extremidade a ser descartada na reprodução. Por exemplo, o truncador de áudio 164 verifica se um pacote TU está contido no fluxo de dados para as unidades de acesso atual e se o indicador ativo de combinação 52 está definido e/ou se o comprimento do truncamento 48 está desigual a zero. Se nenhum truncamento ocorrer, a estrutura de áudio reconstruída como reconstruída de qualquer uma das etapas 174 ou 176 é reproduzida completamente na etapa 180. Entretanto, se o truncamento deve ser realizado, o truncador de áudio 164 realiza o truncamento e meramente a parte remanescente é reproduzida na etapa 182. No caso da parte de extremidade indicada pelo pacote TU sendo uma parte da extremidade posterior, o remanescente da estrutura de áudio reconstruída é reproduzido começando com o carimbo de data/hora associado com esta estrutura de áudio. No caso da parte de extremidade indicada para ser descartada na reprodução pelo pacote TU sendo uma parte da extremidade anterior, o remanescente da estrutura de áudio é reproduzido no carimbo de data/hora desta estrutura de áudio mais o comprimento temporal da parte da extremidade anterior. Isto é, a reprodução do remanescente da estrutura de áudio atual é diferida pelo comprimento temporal da parte da extremidade anterior. O processo é então ainda processado com a próxima unidade de acesso.
[00079] Vide exemplo na Figura 10: o núcleo de decodificação de áudio 162 realiza a decodificação de não-IPF 176 normal nas unidades de acesso AUi-1 e AUi. Entretanto, a última tem o pacote TU 42. Este pacote TU 42 indica u parte da extremidade posterior a ser descartada na reprodução, e, portanto, o truncador de áudio 164 impede uma extremidade posterior 184 da estrutura de áudio 14 associada com unidade de acesso AUi de ser reproduzida, ou seja, de participar na formação do sinal de áudio de saída 186. Depois disso, a unidade de acesso AU’1 chega. A mesma é uma unidade de acesso de estrutura de reprodução imediata e é, portanto, tratada pelo núcleo de decodificação de áudio 162 na etapa 174. Deve ser observado que o núcleo de decodificação de áudio 162 pode, por exemplo, compreender a habilidade de abrir mais do que uma instanciação sozinha. Isto é, sempre que uma decodificação de IPF for realizada, esta envolve a abertura de uma instanciação adicional do núcleo de decodificação de áudio 162. Em qualquer caso, como a unidade de acesso AU’1 é uma unidade de acesso de IPF, não é importante que o seu sinal de áudio seja, de fato, relacionado a uma cena de áudio completamente nova em comparação com suas precursoras AUi-1 e AUi. O núcleo de decodificação de áudio 162 não se preocupa com isso. Em vez disso, ele considera a unidade de acesso AU’1 como uma unidade de acesso independente e reconstrói a estrutura de áudio a partir dela. Como o comprimento da parte da extremidade posterior da estrutura de áudio da unidade de acesso precursora AUi provavelmente foi definida pelo combinador de fluxo 100, o início da estrutura de áudio da unidade de acesso AU’1 imediatamente encosta-se na extremidade posterior do remanescente da estrutura de áudio da unidade de acesso AUi. Isto é, eles encostam-se no momento de transição T1 algum lugar no meio da estrutura de áudio da unidade de acesso AUi. Ao encontrar a unidade de acesso AU’K, o núcleo de decodificação de áudio 162 decodifica sua unidade de acesso na etapa 176 a fim de revelar ou reconstruir esta estrutura de áudio, na qual esta estrutura de áudio é truncada em sua extremidade posterior devido à indicação da parte da extremidade posterior por seu pacote TU 114. Assim, meramente o remanescente da estrutura de áudio da unidade de acesso AU’K até a parte da extremidade posterior é reproduzido. Então, a unidade de acesso AUj é decodificada pelo núcleo de decodificação de áudio 162 na decodificação de IPF 174, ou seja, independentemente da unidade de acesso AU’K em uma forma independente e a estrutura de áudio obtida dela é truncada na sua extremidade anterior, pois seu pacote da unidade de truncamento 58 indica uma parte da extremidade anterior. Os remanescentes das estruturas de áudio das unidades de acesso AU’K e AUj encostam-se em um instante de transição T2.
[00080] As aplicações descritas acima basicamente utilizam uma sinalização que descreve se e quantas amostras de áudio de uma certa estrutura de áudio deveriam ser descartadas após a decodificação da unidade de acesso associada. As aplicações descritas acima podem, por exemplo, ser aplicadas para estender um codec de áudio como Áudio MPEG-H 3D. O padrão Áudio MEPG-H 3D define um formato de fluxo independente para transformar os dados de áudio MPEG-H 3D chamados MHAS [2]. De acordo com as aplicações descritas acima, os dados de truncamento dos pacotes de unidade de truncamento descritos acima poderiam ser sinalizados no nível MHAS. Assim, pode ser facilmente detectado e pode ser facilmente modificar de forma rápida pelos dispositivos de combinação de fluxo como o combinador de fluxo 100 da Figura 7. Tal novo tipo de pacote MHAS poderia ser identificado com PACTYP_CUTRUNCATION, por exemplo. A carga deste tipo de pacote poderia ter a sintaxe mostrada na Figura 12. A fim de facilitar a concordância entre o exemplo de sintaxe específico da Figura 12 e a descrição apresentada acima com relação às figuras 3 e 4, por exemplo, os sinais de referência das figuras 3 e 4 foram reutilizados a fim de identificar os elementos de sintaxe correspondentes na Figura 12. A semântica poderia ser, conforme segue:
[00081] isActive: Se 1, a mensagem de truncamento está ativa; se 0, o decodificador deve ignorar a mensagem.
[00082] canSplice: diz a um dispositivo de combinação que uma combinação pode iniciar ou continuar aqui. (Nota: isto é basicamente um indicador de começo de anúncio, mas o dispositivo de combinação pode redefinir a 0, pois não carrega informações para o decodificador.)
[00083] truncRight: se 0, truncar as amostras do final da AU; se 1, truncar as amostras do início da AU.
[00084] nTruncSamples: número de amostras para truncar.
[00085] Observe que o fluxo de MHAS garante que uma carga do pacote de MHAS é sempre alinhada por byte, assim, a informação do truncamento é facilmente acessível e pode ser facilmente inserida, removida ou modificada, por exemplo, por um dispositivo de combinação de fluxo. Um fluxo de áudio MPEG- H 3D poderia conter um tipo de pacote de MHAS com pactype PACTYP_CUTRUNCATION para cada AU ou para um subconjunto adequado de AUs com isActive definido a 0. Então, um dispositivo de combinação de fluxo pode modificar este pacote de MHAS, de acordo com sua necessidade. Caso contrário, um dispositivo de combinação de fluxo pode inserir facilmente tal pacote de MHAS sem adicionar taxa de bit significativa suplementar, como é descrito a seguir. O maior tamanho do grânulo do áudio MPEG-H 3D é 4096 amostras, assim, 13 bits para nTruncSamples são suficientes para sinalizar todos os valores de truncamento significativos. nTruncSamples e os 3 indicadores de um bit juntos ocupam 16 bits ou 2 bytes, de modo que nenhum alinhamento de byte adicional seja necessário.
[00086] As Figuras de 13A a C ilustram como o método de truncamento de CU pode ser utilizado para implementar a combinação do fluxo de precisão da amostra.
[00087] A Figura 13a mostra um fluxo de vídeo e um fluxo de áudio. Na estrutura de vídeo número 5, o programa é comutado para uma fonte diferente. O alinhamento do vídeo e do áudio na nova fonte é diferente do que na fonte antiga. Para permitir a comutação precisa da amostra do áudio decodificado, as amostras PCM no final da última CU do fluxo antigo e no começo do novo fluxo devem ser removidas. Um curto período de transição suave no domínio PCM decodificado pode ser necessário para evitar falhas no sinal PCM de saída. A Figura 13a mostra um exemplo com valores concretos. Se por alguma razão, a sobreposição de AUs/CUs não for desejada, as duas possíveis soluções representadas na Figura 13B) e na Figura 13C) existem. A primeira AU do novo fluxo tem que carregar os dados de configuração para o novo fluxo e todo o pre-roll (pré-rolagem) que é necessário para inicializar o decodificador com a nova configuração. Isto pode ser feito por meios de uma Estrutura de Reprodução Imediata (IPF | immediate playout frame) que é definida no padrão de áudio MPEG-H 3D.
[00088] Outro pedido do método de truncamento da CU está mudando a configuração de um fluxo de áudio MPEG-H 3D. Diferentes fluxos de áudio MPEG-H 3D podem ter muitas configurações diferentes. Por exemplo, um programa estéreo pode ser seguido por um programa com canais 11.1 e objetos de áudio adicionais. A configuração geralmente mudará em um limite de estrutura de vídeo que não é alinhado com os grânulos do fluxo de áudio. O método do truncamento de CU pode ser utilizado para implementar a mudança de configuração de áudio precisa, conforme ilustrado na Figura 14.
[00089] A Figura 14 mostra um fluxo de vídeo e um fluxo de áudio. Na estrutura de vídeo número 5, o programa é comutado em uma comutação diferente. A primeira CU com a nova configuração de áudio é alinhada com a estrutura de vídeo na qual a mudança de configuração ocorreu. Para permitir a mudança de configuração precisa da amostra, as amostras PCM de áudio no final da última CU com a configuração antiga devem ser removidas. A primeira AU com a nova configuração tem que carregar os novos dados de configuração e todo o pre-roll é necessário para inicializar o decodificador com a nova configuração. Isto pode ser realizado por meios de um padrão de Estrutura de Reprodução Imediata (IPF) que é definida no padrão de áudio MPEG-H 3D. Um codificador pode utilizar as amostras de áudio PCM da configuração antiga para codificar o pre-roll para a nova configuração para canais que são apresentados em ambas as configurações. Exemplo: se a mudança de configuração for de estéreo para 11.1, então os canais esquerdo e direito da nova configuração 11.1 podem utilizar os dados de pre-roll da esquerda e direita da configuração estéreo antiga. Os outros canais da nova configuração 11.1 utilizam zeros para pre-roll. A Figura 15 ilustra a operação do codificador e a operação do fluxo contínuo de dados para este exemplo.
[00090] A Figura 16 mostra mais exemplos para fluxo de dados de áudio combináveis ou combinados. Veja a Figura 16A, por exemplo. A Figura 16A mostra uma parte fora de um fluxo de dados de áudio combinável exemplarmente compreendendo sete unidades de acesso consecutivas de AU1 a AU7. A segunda e a sexta unidades de acesso são fornecidas com um pacote TU, respectivamente. Ambas não são utilizadas, ou seja, inativas, pela definição do indicador 52 a zero. O pacote TU da unidade de acesso AU6 é compreendido por uma unidade de acesso do tipo IPF, ou seja, permite uma combinação de volta ao fluxo de dados. Em B, a Figura 16 mostra o fluxo de dados de áudio de A após a inserção de um anúncio. O anúncio é codificado em um fluxo de dados das unidades de acesso de AU’1 a AU’4. Em C e D, a Figura 16 mostra um caso modificado em comparação com A e B. Em particular, aqui o codificador de áudio do fluxo de dados de áudio das unidades de acesso AU1..., decidiu mudar as definições da codificação em algum lugar dentro da estrutura de áudio da unidade de acesso AU6. Portanto, o fluxo de dados de áudio original de C já compreende duas unidades de acesso do carimbo de data/hora 6,0, a saber AU6 e AU’1 com a respectiva parte da extremidade posterior e a parte da extremidade anterior indicadas como para serem descartadas em reprodução, respectivamente. Aqui, a ativação do truncamento já é predefinida pelo decodificador de áudio. Entretanto, a unidade de acesso AU’1 é ainda utilizável como uma unidade de acesso de combinação interna de retorno e esta possibilidade é ilustrada em D.
[00091] Um exemplo da mudança das definições da codificação no ponto de combinação externa é ilustrado em E e F. Finalmente, em G e H o exemplo de A e B na Figura 16 é estendido em forma de outra unidade de acesso AU5 fornecida pelo pacote TU que pode servir como uma combinação interna ou ponto de continuação.
[00092] Conforme foi mencionado acima, embora a pré- disposição das unidades de acesso de um fluxo de dados de áudio com pacotes TU possa ser favorável em termos da habilidade de considerar o consumo da taxa de bit destes pacotes TU em um estágio muito prévio na geração da unidade de acesso, isto não é obrigatório. Por exemplo, o combinador de fluxo explicado acima com relação às figuras de 7 a 9 pode ser modificado em que o combinador de fluxo identifica os pontos de combinação interna ou de combinação externa por outros meios do que a ocorrência de um pacote TU no fluxo de dados de áudio de entrada na primeira interface 102. Por exemplo, o combinador de fluxo poderia reagir ao relógio externo 122 também com relação à detecção dos pontos de combinação interna e de combinação externa. De acordo com esta alternativa, o configurador do ponto de combinação 106 não definiria apenas o pacote TU, mas também inseriria ao fluxo de dados. Entretanto, observe que o codificador de áudio não está livre de qualquer tarefa de preparação: o codificador de áudio ainda teria que escolher o modo de codificação de IPF para as unidades de acesso que devem servir como pontos de combinação interna de retorno.
[00093] Finalmente, a Figura 17 mostra que a técnica de combinação favorável também pode ser utilizada dentro de um codificador de áudio que é capaz de mudar entre as diferentes configurações de configuração. O codificador de áudio 70 na Figura 17 é construído da mesma forma que o da Figura 5, mas neste momento, o codificador de áudio 70 é responsivo a um disparador de mudança de configuração 200. Isto é, veja, por exemplo, o caso C na Figura 16: o núcleo de codificação de áudio 72 continuamente codifica o sinal de áudio 12 em unidades de acesso de AU1 a AU6. Em algum local dentro da estrutura de áudio da unidade de acesso AU6, o instante de mudança da configuração é indicado pelo disparador 200. Portanto, o núcleo de codificação de áudio 72, que utiliza a mesma varredura da estrutura de áudio, também codifica a estrutura de áudio atual da unidade de acesso AU6 utilizando uma nova configuração como um modo de configuração de áudio envolvendo mais canais de áudio codificado ou similares. O núcleo de codificação de áudio 72 codifica a estrutura de áudio do outro momento utilizando a nova configuração, utilizando, ainda, o modo de codificação de IPF. Isto termina na unidade de acesso AU’1, que imediatamente segue uma ordem da unidade de acesso. Ambas as unidades de acesso, ou seja, a unidade de acesso AU6 e a unidade de acesso AU’1 são fornecidas com pacotes TU pelo insersor do pacote TU 74, a antiga tendo uma parte da extremidade posterior indicada para ser descartada na reprodução e a última tendo uma parte da extremidade anterior indicada a ser descartada na reprodução. A última pode também, como é uma unidade de acesso de IPF, servir como um ponto de combinação interna de retorno.
[00094] Para todas as aplicações descritas acima, deve ser observado que, possivelmente, a transição suave é realizada no decodificador entre o sinal de áudio reconstruído da subsequência de AUs do fluxo de dados de áudio combinado até uma AU de combinação externa (como AUi), que é, de fato, suposta para terminar na extremidade anterior da parte da extremidade posterior da estrutura de áudio desta AU de combinação externa, por um lado, e o sinal de áudio reconstruído da subsequência de AUs do fluxo de dados de áudio combinado da AU imediatamente subsequente à AU de combinação externa (como AU’1) que pode ser suposta iniciar imediatamente da extremidade anterior da estrutura de áudio da AU sucessora, ou na extremidade posterior da parte da extremidade anterior da estrutura de áudio desta AU sucessora: isto é, dentro de um intervalo temporal circundante e cruzando o instante onde as partes das AUs imediatamente consecutivas a serem reproduzidas encostam-se, o sinal de áudio de fato reproduzido como do fluxo de dados de áudio combinado pelo decodificador poderia ser formado por uma combinação das estruturas de áudio de ambas as AUs que encostam-se imediatamente com uma contribuição de combinação da estrutura de áudio da AU sucessora temporalmente aumentando dentro deste intervalo temporal e a contribuição de combinação da estrutura de áudio da AU de combinação externa temporalmente reduzindo no intervalo temporal. De modo similar, a transição suave poderia ser realizada entre as AUs de combinação interna como AUj e suas AUs precursoras imediatas (como AU’K), a saber, pela formação do sinal de áudio de fato reproduzido por uma combinação da estrutura de áudio da AU de combinação interna e a estrutura de áudio da AU precursora dentro de um intervalo de tempo circundante e cruzando o instante no qual a parte da extremidade anterior da estrutura de áudio da AU de combinação interna e a parte da extremidade posterior da estrutura de áudio da AU precursora encostam-se.
[00095] Utilizando outras palavras, as aplicações acima, nomeadamente, revelaram uma possibilidade de explorar a largura de banda disponível pelo fluxo de transporte, e decodificador MHz disponível: um tipo de Mensagem de Ponto de Combinação de Áudio é enviada junto com a estrutura de áudio que substituiria. Ambos o áudio de saída e o áudio de entrada ao redor do ponto de combinação são decodificados e uma transição suave entre eles pode ser realizada. A Mensagem do Ponto de Combinação de Áudio meramente diz aos decodificadores onde realizar a transição suave. Isto é, essencialmente, uma “perfeita” combinação, pois a combinação ocorre corretamente registrada no domínio de PCM.
[00096] Assim, a descrição acima revelou, nomeadamente, os seguintes aspectos:
[00097] A1. Fluxo de dados de áudio combinável 40, caracterizado por compreender: uma sequência de pacotes de carga 16, cada um dos pacotes de carga pertencente a uma sequência respectiva de uma sequência de unidades de acesso 18 na qual o fluxo de dados de áudio combinável é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio 14 de um sinal de áudio 12 que é codificado ao fluxo de dados de áudio combinável em unidades das estruturas de áudio; e um pacote da unidade de truncamento 42; 58 inserido no fluxo de dados de áudio combinável e sendo ajustável para indicar, para uma unidade de acesso predeterminado, uma parte de extremidade 44; 56 de uma estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução.
[00098] A2. Fluxo de dados de áudio combinável de acordo com o aspecto A1, caracterizado pela parte de extremidade da estrutura de áudio ser uma parte da extremidade posterior 44.
[00099] A3. Fluxo de dados de áudio combinável de acordo com o aspecto A1 ou A2, caracterizado pelo fluxo de dados de áudio combinável compreender, ainda: um pacote da unidade de truncamento adicional 58 inserido no fluxo de dados de áudio combinável e sendo ajustável de modo a indicar a uma unidade de acesso predeterminado adicional uma parte de extremidade 44; 56 de uma estrutura de áudio adicional à qual a unidade de acesso predeterminado adicional está associada, a ser descartada na reprodução.
[000100] A4. Fluxo de dados de áudio combinável de acordo com o aspecto A3, caracterizado pela parte de extremidade da estrutura de áudio adicional ser uma parte da extremidade anterior 56.
[000101] A5. Fluxo de dados de áudio combinável de acordo com o aspecto A3 ou A4, caracterizado pelo pacote da unidade de truncamento 42 e pelo pacote da unidade de truncamento adicional 58 compreenderem um elemento de sintaxe de combinação externa 50, respectivamente, que indica se um pacote respectivo do pacote da unidade de truncamento ou o pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa ou não.
[000102] A6. Fluxo de dados de áudio combinável de acordo com quaisquer aspectos de A3 a A5, caracterizado pela unidade de acesso predeterminado como AUi ter codificado nela a respectiva estrutura de áudio associada, de forma que uma reconstrução respectiva no lado da decodificação seja dependente de uma unidade de acesso imediatamente anterior à unidade de acesso predeterminado, e uma maioria das unidades de acesso tem codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva no lado da decodificação seja dependente da respectiva unidade de acesso imediatamente anterior, e a unidade de acesso predeterminado adicional AUj tem codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva no lado da decodificação seja independente da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional, permitindo assim a reprodução imediata.
[000103] A7. Fluxo de dados de áudio combinável de acordo com o aspecto A6, caracterizado pelo pacote da unidade de truncamento 42 e pelo pacote da unidade de truncamento adicional 58 compreenderem um elemento de sintaxe de combinação externa 50, respectivamente, que indica se um pacote respectivo do pacote da unidade de truncamento ou o pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa ou não, em que o elemento de sintaxe de combinação externa 50 compreendido pelo pacote da unidade de truncamento indica se o pacote da unidade de truncamento se refere a uma unidade de acesso de combinação externa e o elemento de sintaxe compreendido pelo pacote da unidade de truncamento adicional indica se o pacote da unidade de truncamento adicional não se refere a uma unidade de acesso de combinação externa.
[000104] A8. Fluxo de dados de áudio combinável de acordo com o aspecto A6, caracterizado pelo pacote da unidade de truncamento 42 e pelo pacote da unidade de truncamento adicional 58 compreenderem um elemento de sintaxe de combinação externa, respectivamente, que indica se um pacote respectivo do pacote da unidade de truncamento ou do pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa ou não, em que o elemento de sintaxe 50 compreendido pelo pacote da unidade de truncamento indica se o pacote da unidade de truncamento se refere a uma unidade de acesso de combinação externa e o elemento de sintaxe de combinação externa compreendido pelo pacote da unidade de truncamento adicional indica se o pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa, também, em que o pacote da unidade de truncamento adicional compreende um elemento de sintaxe de truncamento de extremidade anterior/posterior 54 e um elemento de comprimento do truncamento 48, em que o elemento de sintaxe de truncamento de extremidade anterior/posterior é para indicar se a parte de extremidade da estrutura de áudio adicional é uma parte da extremidade posterior 44 ou uma parte da extremidade anterior 56 e o elemento de comprimento do truncamento é para indicar um comprimento Δt da parte de extremidade da estrutura de áudio adicional.
[000105] A9. Fluxo de dados de áudio combinável de acordo com quaisquer aspectos de A1 a A8, que tem sua taxa controlada para variar ao redor e obedecer uma taxa de bit média predeterminada de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado, um valor dentro de um intervalo predeterminado que é menor do que ^ da largura do que uma faixa do desvio integrado da taxa de bit como variável sobre o completo fluxo de dados de áudio combinável.
[000106] A10. Fluxo de dados de áudio combinável de acordo com quaisquer aspectos de A1 a A8, que tem sua taxa controlada para variar ao redor e obedecer uma taxa de bit média predeterminada, de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado, um valor fixo menor do que ^ de um máximo do desvio integrado da taxa de bit como variável sobre o fluxo de dados de áudio combinável completo.
[000107] A11. Fluxo de dados de áudio combinável de acordo com quaisquer aspectos de A1 a A8, que tem sua taxa controlada para variar ao redor e obedecer uma taxa de bit média predeterminada de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado bem como outras unidades de acesso para as quais os pacotes de unidade de truncamento apresentam no fluxo de dados de áudio combinável, um valor predeterminado.
[000108] B1. Fluxo de dados de áudio combinado, caracterizado por compreender: uma sequência de pacotes de carga 16, cada um dos pacotes de carga pertencente a uma sequência respectiva de uma sequência de unidades de acesso 18 na qual o fluxo de dados de áudio combinado é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio 14; um pacote da unidade de truncamento 42; 58; 114 inserido no fluxo de dados de áudio combinado e indicando uma parte de extremidade 44; 56 de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, em que em uma primeira subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence a uma unidade de acesso AU# de um primeiro fluxo de dados de áudio tendo codificado nele um primeiro sinal de áudio em unidades de estruturas de áudio do primeiro sinal de áudio, e as unidades de acesso do primeiro fluxo de dados de áudio incluindo a unidade de acesso predeterminado, e em uma segunda subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence às unidades de acesso AU’# de um segundo fluxo de dados de áudio tendo codificado nele um segundo sinal de áudio em unidades de estruturas de áudio do segundo fluxo de dados de áudio, em que a primeira e a segunda subsequências dos pacotes de carga são imediatamente consecutivas com relação uma à outra e encostam-se na unidade de acesso predeterminado e a parte de extremidade é uma parte da extremidade posterior 44 no caso da primeira subsequência anterior à segunda subsequência e uma parte da extremidade anterior 56 no caso da segunda subsequência anterior à primeira subsequência.
[000109] B2. Fluxo de dados de áudio combinado de acordo com o aspecto B1, caracterizado pela primeira subsequência preceder a segunda subsequência e a parte de extremidade como uma parte da extremidade posterior 44.
[000110] B3. Fluxo de dados de áudio combinado de acordo com o aspecto B1 ou B2, caracterizado pelo fluxo de dados de áudio combinado compreender, ainda, um pacote da unidade de truncamento adicional 58 inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade anterior 58 de uma estrutura de áudio adicional à qual uma unidade de acesso predeterminado adicional AUj está associada, a ser descartada na reprodução, em que, em uma terceira subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence às unidades de acesso AU’’# de um terceiro fluxo de dados de áudio, tendo codificado nele um terceiro sinal de áudio, ou às unidades de acesso AU# do primeiro fluxo de dados de áudio, seguindo as unidades de acesso do primeiro fluxo de dados de áudio às quais os pacotes de carga da primeira subsequência pertencem, em que as unidades de acesso do segundo fluxo de dados de áudio incluem a unidade de acesso predeterminado adicional.
[000111] B4. Fluxo de dados de áudio combinado de acordo com o aspecto B3, caracterizado pela maioria das unidades de acesso do fluxo de dados de áudio combinado, incluindo a unidade de acesso predeterminado, ter codificada nela a respectiva estrutura de áudio associada, de forma que uma reconstrução respectiva no lado da decodificação seja dependente de uma respectiva unidade de acesso imediatamente anterior, em que a unidade de acesso como AUi+1, imediatamente subsequente à unidade de acesso predeterminado e formando um início das unidades de acesso do segundo fluxo de dados de áudio tem codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva seja independente da unidade de acesso predeterminado como AUi, permitindo, assim, a reprodução imediata, e a unidade de acesso predeterminado adicional AUj tem codificado nela a estrutura de áudio adicional de forma que a reconstrução respectiva seja independente da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional, permitindo, assim, a reprodução imediata, respectivamente.
[000112] B5. Fluxo de dados de áudio combinado de acordo com o aspecto B3 ou B4, caracterizado pelo fluxo de dados de áudio combinado compreender, ainda, um outro pacote da unidade de truncamento adicional 114 inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade posterior 44 de uma outra estrutura de áudio adicional à qual a unidade de acesso como AU’K imediatamente anterior à unidade de acesso predeterminado adicional como AUj está associada, a ser descartada na reprodução, em que o fluxo de dados de áudio combinado compreende informação de carimbo de data/hora 24 indicando para cada unidade de acesso do fluxo de dados de áudio combinado um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada, deve ser reproduzida, em que um carimbo de data/hora da unidade de acesso predeterminado adicional é igual ao carimbo de data/hora da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional está associada, menos a soma de um comprimento temporal da parte da extremidade anterior da estrutura de áudio adicional e a parte da extremidade posterior da outra estrutura de áudio adicional ou igual ao carimbo de data/hora da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional está associada, menos o comprimento temporal da parte da extremidade posterior da outra estrutura de áudio adicional.
[000113] B6. Fluxo de dados de áudio combinado de acordo com o aspecto B2, caracterizado pelo fluxo de dados de áudio combinado compreender, ainda, um outro pacote da unidade de truncamento adicional 58 inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade anterior 56 de uma outra estrutura de áudio adicional à qual a unidade de acesso como AUj imediatamente subsequente à unidade de acesso predeterminado como AU’K está associada, a ser descartada na reprodução, em que o fluxo de dados de áudio combinado compreende a informação de carimbo de data/hora 24 indicando para cada unidade de acesso do fluxo de dados de áudio combinado um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada, deve ser reproduzida, em que um carimbo de data/hora da unidade de acesso imediatamente subsequente à unidade de acesso predeterminado é igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada menos uma soma de um comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada e a parte da extremidade anterior da unidade de acesso adicional ou é igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada menos o comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada.
[000114] B7. Fluxo de dados de áudio combinado de acordo com o aspecto B6, caracterizado por uma maioria das unidades de acesso do fluxo de dados de áudio combinado tem codificada nela a respectiva estrutura de áudio associada de modo que uma reconstrução respectiva no lado da decodificação seja dependente de uma respectiva unidade de acesso imediatamente anterior, em que a unidade de acesso imediatamente subsequente à unidade de acesso predeterminado e formando um início das unidades de acesso do segundo fluxo de dados de áudio tem codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva no lado da decodificação seja independente da unidade de acesso predeterminado, permitindo, assim, a reprodução imediata.
[000115] B8. Fluxo de dados de áudio combinado de acordo com o aspecto B7, caracterizado pelo primeiro e pelo segundo fluxos de dados de áudio serem codificados utilizando diferentes configurações de codificação, em que a unidade de acesso imediatamente subsequente à unidade de acesso predeterminado e formando um início das unidades de acesso do segundo fluxo de dados de áudio tem codificado nela dados de configuração cfg para configuração de um novo decodificador.
[000116] B9. Fluxo de dados de áudio combinado de acordo com o aspecto B4, caracterizado pelo fluxo de dados de áudio combinado compreender, ainda, um outro pacote da unidade de truncamento adicional 112 inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade anterior de uma outra estrutura de áudio adicional à qual a unidade de acesso imediatamente subsequente à unidade de acesso predeterminado está associada, a ser descartada na reprodução, eu que o fluxo de dados de áudio combinado compreende informação de carimbo de data/hora 24 indicando para cada unidade de acesso um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada, deve ser reproduzido, em que um carimbo de data/hora da unidade de acesso imediatamente subsequente à unidade de acesso predeterminado é igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio associada com a unidade de acesso predeterminado menos uma soma de um comprimento temporal da parte da extremidade anterior da outra estrutura de áudio adicional e um comprimento temporal da parte da extremidade posterior da estrutura de áudio associada com a unidade de acesso predeterminado ou igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio associada com a unidade de acesso predeterminado menos o comprimento temporal do comprimento temporal da parte da extremidade posterior da estrutura de áudio associada com a unidade de acesso predeterminado.
[000117] B10. Fluxo de dados de áudio combinado de acordo com o aspecto B4, B5 ou B9, caracterizado por um carimbo de data/hora temporal da unidade de acesso imediatamente subsequente à unidade de acesso predeterminado ser igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada, menos um comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada.
[000118] C1. Combinador de fluxo para combinação de fluxos de dados de áudio, caracterizado por compreender: uma primeira interface de entrada de áudio 102 para recebimento de um primeiro fluxo de dados de áudio 40 compreendendo uma sequência de pacotes de carga 16, cada uma pertencendo a uma respectiva sequência de uma sequência de unidades de acesso 18 na qual o primeiro fluxo de dados de áudio é dividido, cada unidade de acesso do primeiro fluxo de dados de áudio sendo associada a uma estrutura respectiva das estruturas de áudio 14 de um primeiro sinal de áudio 12 que é codificado ao primeiro fluxo de dados de áudio em unidades de estruturas de áudio do primeiro sinal de áudio; uma segunda interface de entrada de áudio 104 para recebimento de um segundo fluxo de dados de áudio 110 compreendendo uma sequência de pacotes de carga, cada um pertencendo a uma respectiva sequência de uma sequência de unidades de acesso na qual o segundo fluxo de dados de áudio é dividido, cada unidade de acesso do segundo fluxo de dados de áudio sendo associado a uma estrutura respectiva das estruturas de áudio de um segundo sinal de áudio que é codificado ao segundo fluxo de dados de áudio em unidades de estruturas de áudio do segundo sinal de áudio; um configurador do ponto de combinação; e um multiplexador de combinação, em que o primeiro fluxo de dados de áudio compreende, ainda, um pacote da unidade de truncamento 42; 58 inserido no primeiro fluxo de dados de áudio e sendo ajustável de modo a indicar a uma unidade de acesso predeterminado, uma parte de extremidade 44; 56 de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, e o configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento 42; 58 de modo que o pacote da unidade de truncamento indique uma parte de extremidade 44; 56 da estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução, ou o configurador do ponto de combinação 106 é configurado para inserir um pacote da unidade de truncamento 42; 58 ao primeiro fluxo de dados de áudio e definir o mesmo para indicar para uma unidade de acesso predeterminado uma parte de extremidade 44; 56 de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução do pacote da unidade de truncamento 42; 58 de modo que o pacote da unidade de truncamento indique uma parte de extremidade 44; 56 da estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução; e em que o multiplexador de combinação 108 é configurado para cortar o primeiro fluxo de dados de áudio 40 na unidade de acesso predeterminado para obter uma subsequência de pacotes de carga do primeiro fluxo de dados de áudio dentro do qual cada pacote de carga pertence a uma respectiva unidade de acesso de uma execução de unidades de acesso do primeiro fluxo de dados de áudio incluindo a unidade de acesso predeterminado, e combinação da subsequência de pacotes de carga do primeiro fluxo de dados de áudio e da sequência de pacotes de carga do segundo fluxo de dados de áudio de modo que as mesmas sejam imediatamente consecutivas com relação uma à outra e encostem-se na unidade de acesso predeterminado, em que a parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada é uma parte da extremidade posterior 44 no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio anterior à sequência de pacotes de carga do segundo fluxo de dados de áudio e uma parte da extremidade anterior 56 no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio subsequente à sequência de pacotes de carga do segundo fluxo de dados de áudio.
[000119] C2. Combinador de fluxo de acordo com o aspecto C1, caracterizado pela subsequência de pacotes de carga do primeiro fluxo de dados de áudio preceder à segunda subsequência da sequência de pacotes de carga do segundo fluxo de dados de áudio e a parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada é uma parte da extremidade posterior 44.
[000120] C3. Combinador de fluxo de acordo com o aspecto C2, caracterizado pelo combinador de fluxo ser configurado para inspecionar um elemento de sintaxe de combinação externa 50 compreendido pelo pacote da unidade de truncamento e para realizar o corte e a combinação em uma condição se o elemento de sintaxe de combinação externa 50 indicar o pacote da unidade de truncamento como referente a uma unidade de acesso de combinação externa.
[000121] C4. Combinador de fluxo de acordo com quaisquer aspectos de C1 a C3, caracterizado pelo configurador do ponto de combinação ser configurado para definir um comprimento temporal da parte de extremidade para coincidir com um relógio externo.
[000122] C5. Combinador de fluxo de acordo com o aspecto C4, caracterizado pelo relógio externo ser um relógio da estrutura de vídeo.
[000123] C6. Fluxo de dados de áudio combinado de acordo com o aspecto C2, caracterizado pelo segundo fluxo de dados de áudio ter, ou o configurador do ponto de combinação 106 causar por inserção, um pacote da unidade de truncamento adicional 114 inserido no segundo fluxo de dados de áudio 110 e ajustável para indicar uma parte da extremidade de uma estrutura de áudio adicional à qual uma unidade de acesso de terminação como AU’K do segundo fluxo de dados de áudio 110 está associada, a ser descartada na reprodução, e o primeiro fluxo de dados de áudio compreende, ainda, um outro pacote da unidade de truncamento adicional 58 inserido no primeiro fluxo de dados de áudio 40 e ajustável para indicar uma parte da extremidade de uma outra estrutura de áudio adicional à qual a outra unidade de acesso predeterminado adicional como AUj está associada, a ser descartada na reprodução, em que uma distância temporal entre a estrutura de áudio da unidade de acesso predeterminado como AUi e a outra estrutura de áudio adicional da outra unidade de acesso predeterminado adicional como AUj coincide com um comprimento temporal do segundo sinal de áudio entre uma unidade de acesso anterior como AU’1 respectiva sucedendo, após a combinação, a unidade de acesso predeterminado como AUi e a unidade de acesso à direita como AU’K, em que o configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento adicional 114 de modo que o mesmo indique uma parte da extremidade posterior 44 da estrutura de áudio adicional, a ser descartada na reprodução, e o outro pacote da unidade de truncamento adicional 58 de modo que mesmo indique uma parte da extremidade anterior da outra estrutura de áudio adicional, a ser descartada na reprodução, em que o multiplexador de combinação 108 é configurado para adaptar a informação de carimbo de data/hora 24 compreendido pelo segundo fluxo de dados de áudio 110 e indicando para cada unidade de acesso um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada, deve ser reproduzido, de modo que um carimbo de data/hora de uma estrutura de áudio à esquerda, que a unidade de acesso anterior do segundo fluxo de dados de áudio 110 está associada, coincida com o carimbo de data/hora da estrutura de áudio à qual a unidade de acesso predeterminado está associada mais o comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada menos o comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada e o configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento adicional 114 e o outro pacote da unidade de truncamento adicional 58 de modo que um carimbo de data/hora da outra estrutura de áudio adicional seja igual ao carimbo de data/hora da estrutura de áudio adicional mais um comprimento temporal da estrutura de áudio adicional menos uma soma de um comprimento temporal da parte da extremidade posterior da estrutura de áudio adicional e a parte da extremidade anterior da outra estrutura de áudio adicional.
[000124] C7. Fluxo de dados de áudio combinado de acordo com o aspecto C2, caracterizado pelo segundo fluxo de dados de áudio 110 ter, ou o configurador do ponto de combinação 106 causar por inserção, um pacote da unidade de truncamento adicional 112 inserido no segundo fluxo de dados de áudio e ajustável para indicar uma parte da extremidade de uma estrutura de áudio adicional à qual uma unidade de acesso anterior como AU’1 do segundo fluxo de dados de áudio está associada, a ser descartada na reprodução, em que o configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento adicional 112 de modo que o mesmo indique a parte da extremidade anterior da estrutura de áudio adicional, a ser descartada na reprodução, em que a informação de carimbo de data/hora 24 compreendida pelo primeiro e pelo segundo fluxos de dados de áudio e indicando para cada unidade de acesso um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso do primeiro e do segundo fluxos de dados de áudio está associada, deve ser reproduzido, são temporalmente alinhados e o configurador do ponto de combinação 106 é configurado para definir o pacote da unidade de truncamento adicional 112 de modo que um carimbo de data/hora da estrutura de áudio adicional menos um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado como AUi está associada mais um comprimento temporal da parte da extremidade anterior seja igual ao carimbo de data/hora da estrutura de áudio à qual a unidade de acesso predeterminado está associada mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada menos o comprimento temporal da parte da extremidade posterior.
[000125] D1. Decodificador de áudio, caracterizado por compreender: um núcleo de decodificação de áudio 162 configurado para reconstruir um sinal de áudio 12, em unidades de estruturas de áudio 14 do sinal de áudio, de uma sequência de pacotes de carga 16 de um fluxo de dados de áudio 120, em que cada um dos pacotes de carga pertence a uma respectiva sequência de uma sequência de unidades de acesso 18 na qual o fluxo de dados de áudio é dividido, em que cada unidade de acesso está associada a uma estrutura respectiva das estruturas de áudio; e um truncador de áudio 164 configurado para ser responsivo a um pacote da unidade de truncamento 42; 58; 114 inserido no fluxo de dados de áudio para truncar uma estrutura de áudio associada a uma unidade de acesso predeterminado para descartar, na reprodução do sinal de áudio, uma parte de extremidade respectiva indicada a ser descartada na reprodução pelo pacote da unidade de truncamento.
[000126] D2. Decodificador de áudio de acordo com o aspecto D1, caracterizado pela parte de extremidade ser uma parte da extremidade posterior 44 ou uma parte da extremidade anterior 56.
[000127] D3. Decodificador de áudio de acordo com o aspecto D1 ou D2, caracterizado por uma maioria das unidades de acesso do fluxo de dados de áudio ter codificado nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva seja dependente de uma respectiva unidade de acesso imediatamente anterior, e o núcleo de decodificação de áudio 162 é configurado para reconstruir a estrutura de áudio à qual cada uma da maioria das unidades de acesso está associada dependendo da respectiva unidade de acesso imediatamente anterior.
[000128] D4. Decodificador de áudio de acordo com o aspecto D3, caracterizado pela unidade de acesso predeterminado ter codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva seja independente de uma unidade de acesso imediatamente anterior à unidade de acesso predeterminado, em que a unidade de decodificação de áudio 162 é configurada para reconstruir a estrutura de áudio à qual a unidade de acesso predeterminado está associada independente da unidade de acesso imediatamente anterior à unidade de acesso predeterminado.
[000129] D5. Decodificador de áudio de acordo com o aspecto D3 ou D4, caracterizado pela unidade de acesso predeterminado ter codificada nela dados de configuração e a unidade de decodificação de áudio 162 ser configurada para utilizar os dados de configuração para configuração das opções de decodificação de acordo com os dados de configuração e aplicam as opções de decodificação para reconstrução das estruturas de áudio à qual a unidade de acesso predeterminado e a execução de unidades de acesso imediatamente subsequente à unidade de acesso predeterminado estão associadas.
[000130] D6. Decodificador de áudio de acordo com quaisquer aspectos de D1 a D5, caracterizado pelo fluxo de dados de áudio compreender a informação de carimbo de data/hora 24 indicando para cada unidade de acesso do fluxo de dados de áudio um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada, deve ser reproduzido, em que o decodificador de áudio é configurado para reprodução das estruturas de áudio com alinhamento temporal das extremidades à esquerda das estruturas de áudio de acordo com a informação de carimbo de data/hora e com exclusão da parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada.
[000131] D7. Codificador de áudio de acordo com quaisquer aspectos de D1 a D6, configurado para realizar uma transição suave em uma junção da parte de extremidade e uma parte remanescente da estrutura de áudio.
[000132] E1. Codificador de áudio, caracterizado por compreender: um núcleo de codificação de áudio 72 configurado para codificar um sinal de áudio 12, em unidades de estruturas de áudio 14 do sinal de áudio, em pacotes de carga 16 de um fluxo de dados de áudio 40 de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso 18 na qual o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e um insersor de pacote de truncamento 74 configurado para inserir ao fluxo de dados de áudio um pacote da unidade de truncamento 44; 58 sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual a unidade de acesso predeterminado está associada, como sendo para ser descartada na reprodução.
[000133] E2. Codificador de áudio de acordo com o aspecto E1, caracterizado pelo codificador de áudio ser configurado para gerar um fluxo de dados de áudio combinável de acordo com quaisquer aspectos de A1 a A9.
[000134] E3. Codificador de áudio de acordo com os aspectos E1 ou E2, caracterizado pelo codificador de áudio ser configurado para selecionar a unidade de acesso predeterminado entre as unidades de acesso, dependendo de um relógio externo.
[000135] E4. Codificador de áudio de acordo com o aspecto E3, caracterizado pelo relógio externo ser um relógio da estrutura de vídeo.
[000136] E5. Codificador de áudio de acordo com quaisquer aspectos de E1 a E5, configurado para realizar um controle da taxa de modo que uma taxa de bit do fluxo de dados de áudio varie ao redor e obedeça uma taxa de bit média predeterminada de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado, um valor dentro de um intervalo predeterminado que é menor do que ^ a largura do que uma faixa do desvio integrado da taxa de bit como variável sobre o fluxo de dados de áudio combinável completo.
[000137] E6. Codificador de áudio de acordo com quaisquer aspectos de E1 a E5, configurado para realizar um controle da taxa de modo que uma taxa de bit do fluxo de dados de áudio varie ao redor e obedeça uma taxa de bit média predeterminada de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado, um valor fixo menor do que ^ de um máximo do desvio integrado da taxa de bit como variável sobre o fluxo de dados de áudio combinável completo.
[000138] E7. Codificador de áudio de acordo com quaisquer aspectos de E1 a E5, configurado para realizar um controle da taxa de modo que uma taxa de bit do fluxo de dados de áudio varie ao redor e obedeça uma taxa de bit média predeterminada de modo que um desvio integrado da taxa de bit da taxa de bit média predeterminada assuma, na unidade de acesso predeterminado bem como outras unidades de acesso para as quais os pacotes de unidade de truncamento são inseridos ao fluxo de dados de áudio, um valor predeterminado.
[000139] E8. Codificador de áudio de acordo com quaisquer aspectos de E1 a E7, configurado para realizar um controle da taxa por registro de um estado de enchimento do buffer do codificador de áudio codificado de modo que um estado de enchimento registrado assuma, na unidade de acesso predeterminado, um valor predeterminado.
[000140] E9. Codificador de áudio de acordo com o aspecto E8, caracterizado pelo valor predeterminado ser comum entre as unidades de acesso para as quais os pacotes de unidade de truncamento são inseridos ao fluxo de dados de áudio.
[000141] E10. Codificador de áudio de acordo com o aspecto E8, configurado para sinalizar o valor predeterminado dentro do fluxo de dados de áudio.
[000142] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é evidente que estes aspectos também representam uma descrição do método correspondente, onde um bloco ou dispositivo corresponde a uma etapa do método ou característica de uma etapa do método. De forma análoga, aspectos descritos no contexto de uma etapa do método também representam uma descrição de um bloco ou item ou característica correspondente de um aparelho correspondente. Algumas ou todas as etapas do método podem ser executadas por (ou utilizando) um aparelho de hardware, tal como, por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas aplicações, uma ou mais da(s) etapa(s) mais importante(s) do método pode(m) ser executada(s) pelo referido aparelho.
[000143] Os fluxos de dados de áudio combinados ou combináveis inventivos podem ser armazenados em um meio de armazenamento digital ou pode ser transmitido por um meio de transmissão, tal como um meio de transmissão sem frio ou um meio de transmissão cabeado, tal como a internet.
[000144] Dependendo de certas exigências de implementação, as aplicações da invenção podem ser implementadas em hardware ou em software. A implementação pode ser realizada utilizando um meio de armazenamento digital, por exemplo, um disquete, um DVD, um Blu-Ray, um CD, uma memória ROM, uma PROM, uma EPROM, uma EEPROM ou a memória flash, tendo sinais de controle eletronicamente legíveis armazenados nele, que cooperam (ou podem cooperar) com um sistema de computador programável, de modo que o respectivo método seja realizado. Assim, o meio de armazenamento digital pode ser legível por computador.
[000145] Algumas aplicações, de acordo com a invenção, compreendem um transportador de dados, tendo sinais de controle eletronicamente legíveis, que podem cooperar com um sistema de computador programável, de modo que um dos métodos descritos aqui seja realizado.
[000146] Geralmente, as aplicações da presente invenção podem ser implementadas como um produto do programa de computador com um código de programa, o código de programa sendo operativo para realizar um dos métodos quando o produto do programa de computador é executado em um computador. O código de programa pode, por exemplo, ser armazenado em um transportador legível por máquina.
[000147] Outras aplicações compreendem o programa de computador para realizar um dos métodos descritos aqui, armazenados em um transportador legível por máquina.
[000148] Em outras palavras, uma aplicação do método inventivo é, portanto, um programa de computador tendo um código de programa para realizar um dos métodos descritos aqui, quando o programa de computador é executado em um computador.
[000149] Outra aplicação do método inventivos é, portanto, um transportador de dados (ou um meio de armazenamento digital ou um meio legível por computador) compreendendo, gravado nele, o programa de computador para realizar um dos métodos descritos aqui. O transportador de dados, o meio de armazenamento digital ou o meio gravado são tipicamente tangíveis e/ou não transitórios.
[000150] Outra aplicação do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais representando o programa de computador para realizar um dos métodos descritos aqui. O fluxo de dados ou a sequência de sinais pode, por exemplo, ser configurado para ser transferido através de uma conexão de comunicação de dados, por exemplo, através da Internet.
[000151] Outra aplicação compreende um meio de processamento, por exemplo, um computador ou um dispositivo de lógica programável, configurado para ou adaptado para realizar um dos métodos descritos aqui.
[000152] Outra aplicação compreende um computador tendo instalado nele o programa de computador para realizar um dos métodos descrito aqui.
[000153] Outra aplicação de acordo com a invenção compreende um aparelho ou um sistema configurado para transferir (por exemplo, eletrônica ou opticamente) um programa de computador para realizar um dos métodos descritos aqui a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel, um dispositivo de memória ou semelhante. O aparelho ou sistema pode, por exemplo, compreender um servidor de arquivo para transferir o programa de computador ao receptor.
[000154] Em algumas aplicações, um dispositivo de lógica programável (por exemplo, um arranjo de portas programáveis de campo) pode ser utilizado para realizar algumas ou todas as funcionalidades dos métodos descritos aqui. Em algumas aplicações, um arranjo de portas programáveis de campo pode cooperar com um microprocessador, a fim de realizar um dos métodos descritos aqui. Geralmente, os métodos são preferivelmente realizados por qualquer aparelho de hardware.
[000155] O aparelho descrito aqui pode ser implementado utilizando um aparelho de hardware ou utilizando um computador ou utilizando uma combinação de um aparelho de hardware e um computador.
[000156] Os métodos descritos aqui podem ser realizados utilizando um aparelho de hardware ou utilizando um computador ou utilizando uma combinação de um aparelho de hardware e um computador.
[000157] As aplicações descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende- se que modificações e variações das disposições e os detalhes descritos serão evidentes a outros especialistas na técnica. É intenção, portanto, ser limitada apenas pelo escopo das reivindicações de patente iminentes e não pelos detalhes específicos apresentados em forma de descrição e explicação das aplicações neste documento.
REFERENCES
[000158] [1] METHOD AND ENCODER AND DECODER FOR SAMPLE-ACCURATE REPRESENTATION OF AN AUDIO SIGNAL, IIS1b-10 F51302 WO-ID, FH110401PID
[000159] [2] ISO/IEC 23008-3, Information technology - High efficiency coding and media delivery in heterogeneous environments - Part 3: 3D audio
[000160] [3] ISO/IEC DTR 14496-24: Information technology - Coding of audio-visual objects - Part 24: Audio and systems interaction.

Claims (27)

1. Um meio de armazenamento digital não transitório no qual um fluxo de dados de áudio emendável é armazenado para processamento, o fluxo de dados: uma sequência de pacotes de carga (16) , cada um dos pacotes de carga pertencente a uma sequência respectiva de uma sequência de unidades de acesso (18) na qual o fluxo de dados de áudio combinável é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio (14) de um sinal de áudio (12) que é codificado no fluxo de dados de áudio combinável em unidades das estruturas de áudio; um pacote da unidade de truncamento (42) inserido no fluxo de dados de áudio combinável e sendo ajustável para indicar, para uma unidade de acesso predeterminado, uma parte da extremidade (44) de uma estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução; um pacote adicional de unidade de truncamento (58) inserido no fluxo de dados de áudio combinável e sendo ajustável de modo a indicar, para uma unidade adicional de acesso predeterminada, uma parte adicional de extremidade (56) de uma estrutura de áudio à qual a unidade adicional de acesso predeterminado está associada, a ser descartada na reprodução; unidade de acesso predeterminado ter codificada nela a respectiva estrutura de áudio associada, de forma que uma reconstrução respectiva no lado da decodificação seja dependente de uma unidade de acesso imediatamente anterior à unidade de acesso predeterminado e uma maioria das unidades de acesso tenha codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva no lado da decodificação seja dependente da respectiva unidade de acesso imediatamente anterior e a unidade de acesso predeterminado adicional tenha codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva no lado da decodificação seja independente da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional, possibilitando, assim, a reprodução imediata.
2. Meio de armazenamento digital não transitório, de acordo com a reivindicação 1, caracterizado por o pacote da unidade de truncamento (42) e o pacote da unidade de truncamento adicional (58) do fluxo de dados de áudio combinável compreenderem um elemento de sintaxe de combinação externa (50), respectivamente, que indica se um pacote respectivo do pacote da unidade de truncamento ou do pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa ou não, em que o elemento de sintaxe de combinação externa (50) compreendido pelo pacote da unidade de truncamento indica se o pacote da unidade de truncamento se refere a uma unidade de acesso de combinação externa e o elemento de sintaxe compreendido pelo pacote da unidade de truncamento adicional indica se o pacote da unidade de truncamento adicional não se refere a uma unidade de acesso de combinação externa.
3. Meio de armazenamento digital não transitório, de acordo com a reivindicação 1, caracterizado pelo pacote da unidade de truncamento (42) e pelo pacote da unidade de truncamento adicional (58) do fluxo de dados de áudio combinável compreenderem um elemento de sintaxe de combinação externa, respectivamente, que indica se um pacote respectivo do pacote da unidade de truncamento ou do pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa ou não, em que o elemento de sintaxe (50) compreendido pelo pacote da unidade de truncamento indica se o pacote da unidade de truncamento se refere a uma unidade de acesso de combinação externa e o elemento de sintaxe de combinação externa compreendido pelo pacote da unidade de truncamento adicional indica se o pacote da unidade de truncamento adicional se refere a uma unidade de acesso de combinação externa, também, em que o pacote da unidade de truncamento adicional compreende um elemento de sintaxe de truncamento de extremidade anterior/posterior (54) e um elemento de comprimento do truncamento (48) , em que o elemento de sintaxe de truncamento de extremidade anterior/posterior serve para indicar se a parte de extremidade da estrutura de áudio adicional é uma parte da extremidade posterior (44) ou uma parte da extremidade anterior (56) e o elemento de comprimento do truncamento serve para indicar um comprimento (üt) da parte de extremidade da estrutura de áudio adicional.
4. Um meio de armazenamento digital não transitório no qual um fluxo de dados de áudio combinado é armazenado, o fluxo de dados de áudio emendado caracterizado pelo fato de que compreende: uma sequência de pacotes de carga(16), cada um dos pacotes de carga pertencente a uma sequência respectiva de uma sequência de unidades de acesso (18) na qual o fluxo de dados de áudio combinado é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio (14); um pacote da unidade de truncamento (42; 58; 114) inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade (44; 56) de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, em que, em uma primeira subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence a uma unidade de acesso (AU#) de um primeiro fluxo de dados de áudio, tendo codificado nele um primeiro sinal de áudio em unidades de estruturas de áudio do primeiro sinal de áudio, e as unidades de acesso do primeiro fluxo de dados de áudio incluindo a unidade de acesso predeterminado, e em uma segunda subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence às unidades de acesso (AU'#) de um segundo fluxo de dados de áudio tendo codificado nele um segundo sinal de áudio em unidades de estruturas de áudio do segundo fluxo de dados de áudio, em que a primeira e a segunda subsequências dos pacotes de carga são imediatamente consecutivas com relação uma à outra e encostam-se na unidade de acesso predeterminado, e a parte de extremidade é uma parte da extremidade posterior (44), no caso da primeira subsequência anterior à segunda subsequência, e uma parte da extremidade anterior (56), no caso da segunda subsequência anterior a primeira subsequência; em que o fluxo de dados de áudio combinado compreende, ainda, um pacote da unidade de truncamento adicional (58) inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade anterior (58) de uma estrutura de áudio adicional à qual uma unidade de acesso predeterminado adicional está associada, a ser descartada na reprodução, em que, em uma terceira subsequência de pacotes de carga da sequência de pacotes de carga, cada pacote de carga pertence às unidades de acesso (AU''#) de um terceiro fluxo de dados de áudio, tendo codificado nele um terceiro sinal de áudio, ou às unidades de acesso (AU#) do primeiro fluxo de dados de áudio, seguindo as unidades de acesso do primeiro fluxo de dados de áudio ao qual os pacotes de carga da primeira subsequência pertencem, em que as unidades de acesso do terceiro fluxo de dados de áudio incluem a unidade de acesso predeterminado adicional; por uma maioria das unidades de acesso do fluxo de dados de áudio combinado, incluindo a unidade de acesso predeterminado, ter codificada nela a respectiva estrutura de áudio associada, de forma que uma reconstrução respectiva no lado da decodificação seja dependente de uma respectiva unidade de acesso imediatamente anterior, em que a unidade de acesso imediatamente subsequente à unidade de acesso predeterminado e que forma um inicio das unidades de acesso do segundo fluxo de dados de áudio tem codificada nela a respectiva estrutura de áudio associada, de forma que a reconstrução respectiva seja independente da unidade de acesso predeterminado, possibilitando, assim, a reprodução imediata, e a unidade de acesso predeterminado adicional tendo codificada nela a estrutura de áudio adicional, de forma que a reconstrução respectiva seja independente da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional, possibilitando, assim, a reprodução imediata, respectivamente.
5. Meio de armazenamento digital não transitório, de acordo com a reivindicação 4, caracterizado pelo fluxo de dados de áudio combinado compreender, ainda, um outro pacote da unidade de truncamento adicional (114) inserido no fluxo de dados de áudio combinado e indicando uma parte da extremidade posterior (44) de uma outra estrutura de áudio adicional à qual a unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional está associada, a ser descartada na reprodução, em que o fluxo de dados de áudio combinado compreende informação de carimbo de data/hora (24), indicando, para cada unidade de acesso do fluxo de dados de áudio combinado, um respectivo carimbo de data/hora no qual a estrutura de áudio, à qual a respectiva unidade de acesso está associada, será reproduzida, em que um carimbo de data/hora da unidade de acesso predeterminado adicional é igual ao carimbo de data/hora da unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso imediatamente anterior à unidade de acesso predeterminado adicional está associada, menos a soma de um comprimento temporal da parte da extremidade anterior da estrutura de áudio adicional e da parte da extremidade posterior da outra estrutura de áudio adicional.
6. Meio de armazenamento digital não transitório, de acordo com a reivindicação 4, caracterizado por um carimbo de data/hora temporal da unidade de acesso imediatamente subsequente à unidade de acesso predeterminado ser igual ao carimbo de data/hora da unidade de acesso predeterminado mais um comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada, menos um comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada.
7. Combinador de fluxo para combinação de fluxos de dados de áudio, caracterizado por compreender: uma primeira interface de entrada de áudio (102) para recebimento de um primeiro fluxo de dado áudio (40), compreendendo uma sequência de pacotes de carga (16), cada um pertencendo a uma respectiva sequência de uma sequência de unidades de acesso (18) na qual o primeiro fluxo de dados de áudio é dividido, cada unidade de acesso do primeiro fluxo de dados de áudio sendo associado a uma estrutura respectiva das estruturas de áudio (14) de um primeiro sinal de áudio (12) que é codificado ao primeiro fluxo de dados de áudio em unidades de estruturas de áudio do primeiro sinal de áudio; uma segunda interface de entrada de áudio (104) para recebimento de um segundo fluxo de dados de áudio (110), compreendendo uma sequência de pacotes de carga, cada uma pertencendo a uma respectiva sequência de uma sequência de unidades de acesso na qual o segundo fluxo de dados de áudio é dividido, cada unidade de acesso do segundo fluxo de dados de áudio sendo associado com uma respetiva das estruturas de áudio de um segundo sinal de áudio que é codificado ao segundo fluxo de dados de áudio em unidades de estruturas de áudio do segundo sinal de áudio; um configurador do ponto de combinação; e um multiplexador de combinação, em que o primeiro fluxo de dados de áudio compreende, ainda, um pacote da unidade de truncamento (42; 58) inserido no primeiro fluxo de dados de áudio e sendo ajustável para indicar a uma unidade de acesso predeterminado uma parte da extremidade (44; 56) de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, e o configurador do ponto de combinação (106) é configurado para configurar o pacote da unidade de truncamento (42; 58) , de modo que o pacote da unidade de truncamento indique uma parte de extremidade (44; 56) da estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução, ou o configurador do ponto de combinação (106) é configurado para inserir um pacote da unidade de truncamento (42; 58) ao primeiro fluxo de dados de áudio e configura o mesmo para indicar para uma unidade de acesso predeterminado, uma parte da extremidade (44; 56) de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução; e em que o multiplexador de combinação (108) é configurado para cortar o primeiro fluxo de dados de áudio (40) na unidade de acesso predeterminado para obter uma subsequência de pacotes de carga do primeiro fluxo de dados de áudio dentro do qual cada pacote de carga pertence em uma respectiva unidade de acesso de uma execução de unidades de acesso do primeiro fluxo de dados de áudio incluindo a unidade de acesso predeterminado e combinar a subsequência de pacotes de carga do primeiro fluxo de dados de áudio e a sequência de pacotes de carga do segundo fluxo de dados de áudio, de modo que as mesmas sejam imediatamente consecutivas com relação uma à outra e encostem-se na unidade de acesso predeterminado, em que a parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada é uma parte da extremidade posterior (44) no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio antes da sequência de pacotes de carga do segundo fluxo de dados de áudio e uma parte da extremidade anterior (56) no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio subsequente à sequência de pacotes de carga do segundo fluxo de dados de áudio.
8. Combinador de fluxo de acordo com a reivindicação 7, caracterizado pela subsequência de pacotes de carga do primeiro fluxo de dados de áudio preceder a sequência de pacotes de carga do segundo fluxo de dados de áudio e a parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada é uma parte da extremidade posterior (44).
9. Combinador de fluxo de acordo com a reivindicação 7, caracterizado pelo configurador do ponto de combinação ser configurado para definir um comprimento temporal da parte de extremidade para coincidir com um relógio externo, em que o relógio externo é um relógio de estrutura de video.
10. Combinador de fluxo de acordo com a reivindicação 8, caracterizado pelo segundo fluxo de dados de áudio ter, ou o configurador do ponto de combinação (106) causar por inserção, um pacote da unidade de truncamento adicional (114) inserido no segundo fluxo de dados de áudio (110) e ajustável para indicar uma parte da extremidade de uma estrutura de áudio adicional à qual uma unidade de acesso de terminação do segundo fluxo de dados de áudio (110) está associada, a ser descartada na reprodução, e o primeiro fluxo de dados de áudio compreendendo, ainda, um outro pacote da unidade de truncamento adicional (58) inserido no primeiro fluxo de dados de áudio (40) e ajustável para indicar uma parte da extremidade de uma outra estrutura de áudio adicional à qual a outra unidade de acesso predeterminado adicional está associada, a ser descartada na reprodução, em que uma distância temporal entre a estrutura de áudio da unidade de acesso predeterminado e a outra estrutura de áudio adicional da outra unidade de acesso predeterminado adicional coincide com um comprimento temporal do segundo sinal de áudio entre uma unidade de acesso anterior respectiva sucedendo, após a combinação, a unidade de acesso predeterminado e a unidade de acesso de terminação, em que o configurador do ponto de combinação (106) é configurado para definir o pacote da unidade de truncamento adicional (114), de modo que o mesmo indique uma parte da extremidade posterior (44) da estrutura de áudio adicional, a ser descartada na reprodução, e o outro pacote da unidade de truncamento adicional (58), de modo que o mesmo indique uma parte da extremidade anterior da outra estrutura de áudio adicional, a ser descartada na reprodução, em que o multiplexador de combinação (108) é configurado para adaptar a informação de carimbo de data/hora (24) compreendida pelo segundo fluxo de dados de áudio (110) e indicar, para cada unidade de acesso, um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso está associada deve ser reproduzida, de modo que um carimbo de data/hora de uma estrutura de áudio anterior à qual a unidade de acesso anterior do segundo fluxo de dados de áudio (110) está associada coincida com o carimbo de data/hora da estrutura de áudio à qual a unidade de acesso predeterminado está associada mais o comprimento temporal da estrutura de áudio à qual a unidade de acesso predeterminado está associada, menos o comprimento temporal da parte da extremidade posterior da estrutura de áudio à qual a unidade de acesso predeterminado está associada, e o configurador do ponto de combinação (106) é configurado para definir o pacote da unidade de truncamento adicional (114) e o outro pacote da unidade de truncamento adicional (58), de modo que um carimbo de data/hora da outra estrutura de áudio adicional se iguale ao carimbo de data/hora da estrutura de áudio adicional mais um comprimento temporal da estrutura de áudio adicional, menos a soma de um comprimento temporal da parte da extremidade posterior da estrutura de áudio adicional e a parte da extremidade anterior da outra estrutura de áudio adicional.
11. Combinador de fluxo de acordo com a reivindicação 8, caracterizado pelo segundo fluxo de dados de áudio (110) ter, ou o configurador do ponto de combinação (106) causar por inserção, um pacote da unidade de truncamento adicional (112) inserido no segundo fluxo de dados de áudio que é ajustável para indicar uma parte da extremidade de uma estrutura de áudio adicional à qual uma unidade de acesso anterior do segundo fluxo de dados de áudio está associada, a ser descartada na reprodução, em que o configurador do ponto de combinação (106) é configurado para definir o pacote da unidade de truncamento adicional (112), de modo que o mesmo indique uma parte da extremidade anterior da estrutura de áudio adicional a ser descartada na reprodução, em que a informação de carimbo de data/hora (24), compreendida pelo primeiro e pelo segundo fluxos de dados de áudio e indicando, para cada unidade de acesso um respectivo carimbo de data/hora no qual a estrutura de áudio à qual a respectiva unidade de acesso do primeiro e do segundo fluxos de dados de áudio está associada, deve ser reproduzida, é temporariamente alinhada e o configurador do ponto de combinação (106) é configurado para definir o pacote da unidade de truncamento adicional, de modo que um carimbo de data/hora da estrutura de áudio adicional menos um comprimento temporal da estrutura de áudio ao qual a unidade de acesso predeterminado está associada mais um comprimento temporal da parte da extremidade anterior se iguale ao carimbo de data/hora da estrutura de áudio ao qual a unidade de acesso predeterminado está associada, mais um comprimento temporal da estrutura de áudio ao qual a unidade de acesso predeterminado está associada, menos o comprimento temporal da parte da extremidade posterior.
12. Decodificador de áudio, caracterizado por compreender: um núcleo de decodificação de áudio (162) configurado para reconstruir um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, de uma sequência de pacotes de carga (16) de um fluxo de dados de áudio (120), em que cada um dos pacotes de carga pertence a uma respectiva sequência de uma sequência de unidades de acesso (18) na qual o fluxo de dados de áudio é dividido, em que cada unidade de acesso está associada a uma estrutura respectiva das estruturas de áudio; e um truncador de áudio (164) configurado para ser reagente a um pacote da unidade de truncamento (42; 58; 114) inserido no fluxo de dados de áudio para truncar uma estrutura de áudio associada a uma unidade de acesso predeterminado para descartar, na reprodução do sinal de áudio, uma parte de extremidade respectiva indicada a ser descartada na reprodução pelo pacote da unidade de truncamento. em que o pacote de unidade de truncamento compreende ainda: um elemento de sintaxe de truncamento de extremidade anterior/posterior (54), e um elemento de comprimento do truncamento (48), e em que o decodificador utiliza o elemento de sintaxe de truncamento de extremidade anterior/posterior como indicação de se a parte de extremidade é uma parte de extremidade anterior (44) ou uma parte de extremidade posterior (56) e o elemento de comprimento do truncamento como uma indicação de um comprimento (Δt) da parte de extremidade da estrutura de áudio.
13. Codificador de áudio, caracterizado por compreender: um núcleo de codificação de áudio (72) configurado para codificar um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, em pacotes de carga (16) de um fluxo de dados de áudio (40) , de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso (18) nas quais o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e um insersor de pacote de truncamento (74) configurado para inserir ao fluxo de dados de áudio um pacote da unidade de truncamento (44; 58) sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, como sendo para ser descartada na reprodução; em que o codificador de áudio é configurado para realizar um controle de taxa, de modo que uma taxa de bit do fluxo de dados de áudio varie em torno de, e obedeça, uma taxa de bit média predeterminada, de modo que um desvio da taxa de bit integrado da taxa de bit média predeterminada assuma, na unidade de acesso predeterminada, um valor dentro de um intervalo predeterminado que é menor do que da amplitude de uma faixa do desvio da taxa de bit integrado como variante sobre o fluxo de dados de áudio combinável completo.
14. Codificador de áudio, caracterizado por compreender: um núcleo de codificação de áudio (72) configurado para codificar um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, em pacotes de carga (16) de um fluxo de dados de áudio (40) , de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso (18) nas quais o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e um insersor de pacote de truncamento (74) configurado para inserir ao fluxo de dados de áudio um pacote da unidade de truncamento (44; 58) sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, como sendo para ser descartada na reprodução; e em que o codificador de áudio é configurado para realizar um controle de taxa, de modo que uma taxa de bit do fluxo de dados de áudio varie em torno de, e obedeça, uma taxa de bit média predeterminada, de modo que um desvio da taxa de bit integrado da taxa de bit média predeterminada assuma, na unidade de acesso predeterminada, um valor fixo menor do que de um máximo do desvio da taxa de bit integrado como variante sobre o fluxo de dados de áudio combinável completo.
15. Codificador de áudio, caracterizado por compreender: um núcleo de codificação de áudio (72) configurado para codificar um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, em pacotes de carga (16) de um fluxo de dados de áudio (40) , de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso (18) nas quais o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e um insersor de pacote de truncamento (74) configurado para inserir ao fluxo de dados de áudio um pacote da unidade de truncamento (44; 58) sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, como sendo para ser descartada na reprodução; e em que o codificador de áudio é configurado para realizar um controle de taxa, de modo que uma taxa de bit do fluxo de dados de áudio varie em torno de, e obedeça, uma taxa de bit média predeterminada, de modo que um desvio da taxa de bit integrado da taxa de bit média predeterminada assuma, na unidade de acesso predeterminada, bem como em outras unidades de acesso para as quais os pacotes de unidade de truncamento são inseridos no fluxo de dados de áudio, um valor predeterminado.
16. Codificador de áudio, caracterizado por compreender: um núcleo de codificação de áudio (72) configurado para codificar um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, em pacotes de carga (16) de um fluxo de dados de áudio (40) , de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso (18) nas quais o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e um insersor de pacote de truncamento (74) configurado para inserir ao fluxo de dados de áudio um pacote da unidade de truncamento (44; 58) sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, como sendo para ser descartada na reprodução; e em que o codificador de áudio é configurado para realizar um controle de taxa pelo registro de um estado de enchimento do buffer do decodificador de áudio codificado, de modo que um estado de enchimento registrado assuma, na unidade de acesso predeterminada, um valor predeterminado.
17. Codificador de áudio de acordo com a reivindicação 16, caracterizado pelo valor predeterminado ser comum entre as unidades de acesso para as quais os pacotes de unidade de truncamento são inseridos no fluxo de dados de áudio.
18. Codificador de áudio de acordo com a reivindicação 17, caracterizado por ser configurado para sinalizar o valor predeterminado dentro do fluxo de dados de áudio.
19. Método para combinação dos fluxos de dados de áudio, caracterizado por compreender um primeiro fluxo de dados de áudio (40), compreendendo uma sequência de pacotes de carga (16), cada um pertencendo a uma respectiva sequência de uma sequência de unidades de acesso (18) na qual o primeiro fluxo de dados de áudio é dividido, cada unidade de acesso do primeiro fluxo de dados de áudio sendo associada a uma estrutura respectiva das estruturas de áudio (14) de um primeiro sinal de áudio (12) que é codificado no primeiro fluxo de dados de áudio em unidades de estruturas de áudio do primeiro sinal de áudio; e um segundo fluxo de dados de áudio (110) compreendendo uma sequência de pacotes de carga, cada um pertencendo a uma respectiva sequência de uma sequência de unidades de acesso na qual o segundo fluxo de dados de áudio é dividido, cada unidade de acesso do segundo fluxo de dados de áudio sendo associada a uma estrutura respectiva das estruturas de áudio de um segundo sinal de áudio que é codificado no segundo fluxo de dados de áudio em unidades de estruturas de áudio do segundo sinal de áudio; em que o primeiro fluxo de dados de áudio compreende, ainda, um pacote da unidade de truncamento (42; 58) inserido no primeiro fluxo de dados de áudio e sendo ajustável para indicar a uma unidade de acesso predeterminado uma parte da extremidade (44; 56) de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, e o método compreendendo a definição do pacote da unidade de truncamento (42; 58), de modo que o pacote da unidade de truncamento indique uma parte da extremidade (44; 56) da estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução, ou o método compreendendo a inserção de um pacote da unidade de truncamento (42; 58) no primeiro fluxo de dados de áudio e definindo o mesmo para indicar a uma unidade de acesso predeterminado uma parte da extremidade (44; 56) de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, a ser descartada na reprodução, e definindo o pacote da unidade de truncamento (42; 58) , de modo que o pacote da unidade de truncamento indique uma parte da extremidade (44; 56) da estrutura de áudio à qual a unidade de acesso predeterminado está associada, a ser descartada na reprodução; e o método compreendendo, ainda, o corte do primeiro fluxo de dados de áudio (40) na unidade de acesso predeterminado para obter uma subsequência de pacotes de carga do primeiro fluxo de dados de áudio dentro do qual cada pacote de carga pertence a uma respectiva unidade de acesso de uma execução de unidades de acesso do primeiro fluxo de dados de áudio, incluindo a unidade de acesso predeterminado, e combinação da subsequência de pacotes de carga do primeiro fluxo de dados de áudio e da sequência de pacotes de carga do segundo fluxo de dados de áudio, de modo que as mesmas sejam imediatamente consecutivas com relação uma à outra e encostem-se na unidade de acesso predeterminado, em que a parte de extremidade da estrutura de áudio à qual a unidade de acesso predeterminado está associada é uma parte da extremidade posterior (44) no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio anterior à sequência de pacotes de carga do segundo fluxo de dados de áudio e uma parte da extremidade anterior (56) no caso da subsequência de pacotes de carga do primeiro fluxo de dados de áudio subsequente à sequência de pacotes de carga do segundo fluxo de dados de áudio.
20. Método de codificação de áudio, caracterizado por compreender: reconstrução de um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, de uma sequência de pacotes de carga (16) de um fluxo de dados de áudio (120), em que cada um dos pacotes de carga pertence a uma respectiva sequência de uma sequência de unidades de acesso (18) na qual o fluxo de dados de áudio é dividido, em que cada unidade de acesso está associada a uma estrutura respectiva das estruturas de áudio; e resposta a um pacote da unidade de truncamento (42; 58; 114) inserido no fluxo de dados de áudio, truncando uma estrutura de áudio associada a uma unidade de acesso predeterminado para descartar, na reprodução do sinal de áudio, uma parte de extremidade respectiva indicada para ser descartada na reprodução pelo pacote da unidade de truncamento. em que o pacote de unidade de truncamento compreende: um elemento de sintaxe de truncamento de extremidade anterior/posterior (54) e um elemento de comprimento do truncamento (48) , em que o elemento de sintaxe de truncamento de extremidade anterior/posterior é usado como indicação de se a parte de extremidade é uma parte de extremidade anterior (44) ou uma parte de extremidade posterior (56) e o elemento de comprimento do truncamento como uma indicação de um comprimento (Δt) da parte de extremidade da estrutura de áudio.
21. Método de codificação de áudio, caracterizado por compreender: codificação de um sinal de áudio (12), em unidades de estruturas de áudio (14) do sinal de áudio, em pacotes de carga (16) de um fluxo de dados de áudio (40) , de modo que cada pacote de carga pertença a uma respectiva unidade das unidades de acesso (18) na qual o fluxo de dados de áudio é dividido, cada unidade de acesso sendo associada a uma estrutura respectiva das estruturas de áudio, e inserção do fluxo de dados de áudio em um pacote da unidade de truncamento (44; 58), sendo ajustável para indicar uma parte da extremidade de uma estrutura de áudio à qual uma unidade de acesso predeterminado está associada, de forma a ser descartada na reprodução; em que um controle de taxa é executado, de modo que uma taxa de bit do fluxo de dados de áudio varie em torno de, e obedeça, uma taxa de bit média predeterminada, de modo que um desvio da taxa de bit integrado da taxa de bit média predeterminada assuma, na unidade de acesso predeterminada, um valor dentro de um intervalo predeterminado que é menor do que da amplitude de uma faixa do desvio da taxa de bit integrado como variante sobre o fluxo de dados de áudio combinável completo.
22. Meio de armazenamento digital não transitório tendo um programa de computador nele armazenado para realizar o método para unir fluxos de dados de áudio, caracterizado pelo fato de que compreende: um primeiro fluxo de dados de áudio que compreende uma sequência de pacotes de carga útil, cada um dos quais pertence a um respectivo de uma sequência de unidades de acesso em que o primeiro fluxo de dados de áudio é particionado, cada unidade de acesso do primeiro fluxo de dados de áudio sendo associada a um respectivo um das estruturas de áudio de um primeiro sinal de áudio que é codificado no primeiro fluxo de dados de áudio em unidades de quadros de áudio do primeiro sinal de áudio; e um segundo fluxo de dados de áudio compreendendo uma sequência de pacotes de carga útil, cada um dos quais pertence a um respectivo de uma sequência de unidades de acesso em que o segundo fluxo de dados de áudio é particionado, cada unidade de acesso do segundo fluxo de dados de áudio sendo associada a um respectivo um das estruturas de áudio de um segundo sinal de áudio que é codificado no segundo fluxo de dados de áudio em unidades de quadros de áudio do segundo sinal de áudio; em que o primeiro fluxo de dados de áudio compreende ainda um pacote de unidade de truncamento (42; 58) inserido no primeiro fluxo de dados de áudio e sendo configurável de modo a indicar para uma unidade de acesso predeterminada, uma porção de extremidade de uma estrutura de áudio com o qual uma unidade de acesso predeterminada está associada, a ser descartado na reprodução, e o método compreendendo: definir o pacote da unidade de truncamento (42; 58) de modo que o pacote da unidade de truncamento (42; 58) indique uma porção final da estrutura de áudio com a qual a unidade de acesso predeterminada está associada, a ser descartada na reprodução, ou o método compreendendo: inserir um pacote de unidade de truncamento (42; 58) no primeiro fluxo de dados de áudio e define o mesmo de modo a indicar para uma unidade de acesso predeterminada, uma porção de extremidade de uma estrutura de áudio com a qual uma unidade de acesso predeterminada está associada, a ser descartada na reprodução e configurando a unidade de truncamento (42; 58) pacote de modo que o pacote da unidade de truncamento (42; 58) indique uma porção final da estrutura de áudio com a qual a unidade de acesso predeterminada está associada, para ser descartado na reprodução; e o método compreendendo ainda: cortar o primeiro fluxo de dados de áudio na unidade de acesso predeterminada de modo a adquirir uma subsequência de pacotes de carga útil do primeiro fluxo de dados de áudio dentro do qual cada pacote de carga útil pertence a uma respectiva unidade de acesso de uma série de unidades de acesso do primeiro fluxo de dados de áudio compreendendo a unidade de acesso predeterminada e a emenda da subsequência de pacotes de carga útil do primeiro fluxo de dados de áudio e a sequência de pacotes de carga útil do segundo fluxo de dados de áudio de modo que os mesmos sejam imediatamente consecutivos em relação um ao outro e confinem um ao outro na unidade de acesso predeterminada , em que a porção de extremidade da estrutura de áudio com a qual a unidade de acesso predeterminada está associada é uma porção de extremidade posterior no caso da subsequência de pacotes de carga útil do primeiro fluxo de dados de áudio precedendo a sequência de pacotes de carga útil do segundo fluxo de dados de áudio e um porção de extremidade principal no caso da subsequência de pacotes de carga útil do primeiro fluxo de dados de áudio que sucedem a sequência de pacotes de carga útil do segundo fluxo de dados de áudio, quando o referido programa de computador é executado por um computador.
23. Um meio de armazenamento digital não transitório tendo um programa de computador nele armazenado para realizar o método de decodificação de áudio, caracterizado pelo fato de que compreende: reconstrução de um sinal de áudio, em unidades de quadros de áudio do sinal de áudio, a partir de uma sequência de pacotes de carga de um fluxo de dados de áudio, em que cada um dos pacotes de carga pertence a um respectivo de uma sequência de unidades de acesso em que o fluxo de dados de áudio é particionado, em que cada unidade de acesso está associada a um respectivo das estruturas de áudio; e resposta um pacote de unidade de truncamento (42; 58) inserido no fluxo de dados de áudio, truncando uma estrutura de áudio associado a uma unidade de acesso predeterminada de modo a descartar, ao reproduzir o sinal de áudio, uma porção final do mesmo indicada para ser descartada na reprodução pelo pacote de unidade de truncamento (42; 58) , em que o pacote de unidade de truncamento (42; 58) compreende um elemento de sintaxe de truncamento inicial/final e um elemento de comprimento de truncamento, em que o elemento de sintaxe de truncamento de extremidade dianteira / traseira é usado como indicação se a porção de extremidade é uma porção de extremidade traseira ou uma porção de extremidade dianteira e o elemento de comprimento de truncamento como uma indicação de um comprimento da porção final da estrutura de á quando o referido programa de computador é executado por um computador.
24. Meio de armazenamento digital não transitório tendo um programa de computador nele armazenado para realizar o método de codificação de áudio, caracterizado pelo fato de que compreende: codificação de um sinal de áudio, em unidades de quadros de áudio do sinal de áudio, em pacotes de carga útil de um fluxo de dados de áudio de modo que cada pacote de carga pertença a uma respectiva unidade de acesso em que o fluxo de dados de áudio é particionado, cada unidade de acesso sendo associada com um respectivo dos quadros de áudio, e inserir no fluxo de dados de áudio um pacote de unidade de truncamento (42; 58) sendo configurável de modo a indicar uma porção de extremidade de um quadro de áudio com a qual uma unidade de acesso predeterminada está associada, como sendo descartada na reprodução, em que um controle de taxa é realizado de modo que uma taxa de bits do fluxo de dados de áudio varie e obedeça a uma taxa de bits média predeterminada de modo que um desvio de taxa de bits integrado da taxa de bits média predeterminada assuma, na unidade de acesso predeterminada, um valor dentro de um intervalo predeterminado que tem menos de de largura do que uma faixa do desvio de taxa de bits integrado, variando ao longo do fluxo de dados de áudio que pode ser dividido, quando o referido programa de computador é executado por um computador.
25. Método de codificação de áudio, caracterizado pelo fato de que compreende: codificação de um sinal de áudio, em unidades de quadros de áudio do sinal de áudio, em pacotes de carga útil de um fluxo de dados de áudio de modo que cada pacote de carga pertença a uma respectiva unidade de acesso em que o fluxo de dados de áudio é particionado, cada unidade de acesso sendo associada com um respectivo das estruturas de áudio, e inserir no fluxo de dados de áudio um pacote de unidade de truncamento (42; 58) sendo configurável de modo a indicar uma porção de extremidade de uma estrutura de áudio com a qual uma unidade de acesso predeterminada está associada, como sendo descartada na reprodução, em que um controle de taxa é realizado de modo que uma taxa de bits do fluxo de dados de áudio varie e obedeça a uma taxa de bits média predeterminada de modo que um desvio de taxa de bits integrado da taxa de bits média predeterminada assuma, na unidade de acesso predeterminada, um valor fixo menor que de um máximo do desvio de taxa de bits integrado variando ao longo do fluxo de dados de áudio que pode ser dividido.
26. Método de codificação de áudio, caracterizado pelo fato de que compreende: codificação de um sinal de áudio, em unidades de quadros de áudio do sinal de áudio, em pacotes de carga útil de um fluxo de dados de áudio de modo que cada pacote de carga pertença a uma respectiva unidade de acesso em que o fluxo de dados de áudio é particionado, cada unidade de acesso sendo associada com um respectivo das estruturas de áudio, e inserir no fluxo de dados de áudio um pacote de unidade de truncamento (42; 58) sendo configurável de modo a indicar uma porção de extremidade de uma estrutura de áudio com a qual uma unidade de acesso predeterminada está associada, como sendo descartada na reprodução, em que um controle de taxa é realizado de modo que uma taxa de bits do fluxo de dados de áudio varie em torno de, e obedeça, uma taxa de bits média predeterminada de modo que um desvio de taxa de bits integrado da taxa de bits média predeterminada assuma, na unidade de acesso predeterminada, bem como outras unidades de acesso para quais pacotes de unidade de truncamento (42; 58) são inseridos no fluxo de dados de áudio, um valor predeterminado.
27. Método de codificação de áudio, caracterizado pelo fato de que compreende: codificação de um sinal de áudio, em unidades de quadros de áudio do sinal de áudio, em pacotes de carga útil de um fluxo de dados de áudio de modo que cada pacote de carga pertença a uma respectiva unidade de acesso em que o fluxo de dados de áudio é particionado, cada unidade de acesso sendo associada com um respectivo das estruturas de áudio, e inserir no fluxo de dados de áudio um pacote de unidade de truncamento (42; 58) sendo configurável de modo a indicar uma porção de extremidade de uma estrutura de áudio com a qual uma unidade de acesso predeterminada está associada, como sendo descartada na reprodução, em que um controle de taxa é realizado registrando um estado de preenchimento do buffer de decodificador de áudio codificado de modo que um estado de preenchimento registrado assuma, na unidade de acesso predeterminada, um valor predeterminado.
BR112017003288-0A 2014-09-09 2015-09-08 Conceito de combinação de áudio BR112017003288B1 (pt)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP14184141 2014-09-09
EP14184141.1 2014-09-09
EP15154752.8A EP2996269A1 (en) 2014-09-09 2015-02-11 Audio splicing concept
EP15154752.8 2015-02-11
PCT/EP2015/070493 WO2016038034A1 (en) 2014-09-09 2015-09-08 Audio splicing concept

Publications (2)

Publication Number Publication Date
BR112017003288A2 BR112017003288A2 (pt) 2017-11-28
BR112017003288B1 true BR112017003288B1 (pt) 2023-09-19

Family

ID=

Similar Documents

Publication Publication Date Title
US11477497B2 (en) Audio splicing concept
AU2014336243B2 (en) Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder
US9883213B2 (en) Embedding encoded audio into transport stream for perfect splicing
KR102406318B1 (ko) 적응 스트리밍 정렬을 위한 프레임 변환
BR112012026326B1 (pt) método e codificador e decodificador para representação com amostragem precisa de um sinal de áudio
BR112017003288B1 (pt) Conceito de combinação de áudio