BR122020017000B1

BR122020017000B1 - METHOD OF GENERATING AN AUDIO SIGNAL FOR AN AUDIOVISUAL CONTENT ITEM AND APPARATUS FOR GENERATING AN AUDIO SIGNAL FOR AN AUDIOVISUAL CONTENT ITEM

Info

Publication number: BR122020017000B1
Application number: BR122020017000-0A
Authority: BR
Inventors: Robert Albertus Brondijk; Arnoldus Werner Johannes Oomen; Fransiscus Marinus Jozephus De Bont
Original assignee: Koninklijke Philips N.V
Priority date: 2014-03-18
Filing date: 2015-03-16
Publication date: 2024-01-23

Abstract

trata-se de um aparelho de transmissão que gera um fluxo de dados do item de conteúdo audiovisual (por exemplo, fluxo de transporte) compreendendo uma pluralidade de fluxos (streams) de dados audiovisuais individuais com componentes audiovisuais para o item de conteúdo. um gerador (301-307) gera um primeiro fluxo que compreende tanto dados de áudio obrigatórios, quanto dados de áudio substituíveis para a representação de áudio, sendo que os dados de áudio substituíveis são dados que podem ser substituídos por dados de áudio alternativos. um combinador (309) inclui o fluxo resultante no fluxo de dados do item de conteúdo. um aparelho receptor inclui um extrator (403) que extrai os dados de áudio obrigatórios do fluxo recebido. um substituidor (415) pode substituir os dados de áudio substituíveis por dados de áudio alternativos, e uma saída (415) pode gerar um sinal de áudio a partir dos dados de sinais obrigatórios e alternativos. a abordagem pode fornecer, especificamente, um fluxo de dados aprimorado e mais flexível para o conteúdo audiovisual.is a transmission apparatus that generates an audiovisual content item data stream (e.g., transport stream) comprising a plurality of individual audiovisual data streams with audiovisual components for the content item. a generator (301-307) generates a first stream comprising both mandatory audio data and substitutable audio data for the audio representation, with substitutable audio data being data that can be replaced with alternative audio data. a combiner (309) includes the resulting stream in the content item data stream. a receiving apparatus includes an extractor (403) that extracts the required audio data from the received stream. a substitutor (415) can replace the substitutable audio data with alternative audio data, and an output (415) can generate an audio signal from the mandatory and alternative signal data. The approach can specifically provide an improved and more flexible data flow for audiovisual content.

Description

[001] O presente pedido de patente consiste em pedido dividido do pedido de patente de invenção BR 112016021214-2, de 16/03/2015.[001] This patent application consists of a split application from the invention patent application BR 112016021214-2, dated 03/16/2015.

FIELD OF INVENTION

[002] A invenção refere-se a fluxos (streams) de dados de item de conteúdo audiovisual e, em particular, mas não exclusivamente, a fluxos (streams) de dados de item de conteúdo audiovisual como o Fluxo (stream) de Transporte MPEG-2.[002] The invention relates to audiovisual content item data streams and, in particular, but not exclusively, audiovisual content item data streams such as the MPEG Transport Stream -two.

BACKGROUND OF THE INVENTION

[003] A codificação digital de diversos sinais de fonte tem se tornado cada vez mais importante nas últimas décadas, à medida que a comunicação e a representação por sinal digital têm substituído cada vez mais a comunicação e a representação analógica. Por exemplo, sistemas de telefonia móvel, como o Global System para comunicação móvel, são baseados em codificação de voz digital. Além disso, a distribuição de conteúdo de mídia, como vídeo e música, está cada vez mais baseada na codificação de conteúdo digital.[003] Digital coding of various source signals has become increasingly important in recent decades, as digital signal communication and representation have increasingly replaced analog communication and representation. For example, mobile phone systems, such as the Global System for mobile communication, are based on digital voice coding. Additionally, the distribution of media content such as video and music is increasingly based on digital content encoding.

[004] Geralmente, um item de conteúdo audiovisual compreende uma série de diferentes componentes audiovisuais e tipos de dados. Por exemplo, um item de conteúdo que corresponda a um filme ou programa de televisão pode incluir ao menos um componente de sinal de vídeo, geralmente uma pluralidade de diferentes componentes de áudio, dados de controle, dados de sincronização, metadados, por exemplo, caracterizando o conteúdo etc. Por exemplo, um filme pode incluir um componente de vídeo principal, uma pluralidade de trilhas de áudio (por exemplo, para diferentes idiomas), dados de legenda, atores principais etc. Dessa forma, com frequência, é necessário incluir um número relativamente grande de diferentes tipos de dados em um único fluxo (stream) de dados combinado para o item de conteúdo audiovisual.[004] Generally, an audiovisual content item comprises a series of different audiovisual components and data types. For example, a content item corresponding to a film or television program may include at least one video signal component, generally a plurality of different audio components, control data, synchronization data, metadata, for example, characterizing the content etc. For example, a film may include a main video component, a plurality of audio tracks (e.g. for different languages), subtitle data, main actors, etc. Therefore, it is often necessary to include a relatively large number of different data types in a single combined data stream for the audiovisual content item.

[005] De modo a acomodar uma representação de um item de conteúdo audiovisual que inclua uma faixa de dados de diferentes tipos, pode ser gerado, com frequência, um fluxo (stream) de dados de item de conteúdo audiovisual de (sub) fluxos (streams) de dados audiovisuais que forneçam componentes audiovisuais ao item de conteúdo audiovisual. Além disso, podem estar incluídos fluxos (streams) de dados que compreendam dados, metadados etc.[005] In order to accommodate a representation of an audiovisual content item that includes a range of data of different types, an audiovisual content item data stream of (sub)streams may frequently be generated ( streams) of audiovisual data that provide audiovisual components to the audiovisual content item. Additionally, data streams comprising data, metadata, etc. may be included.

[006] O fluxo (stream) de dados de item de conteúdo audiovisual pode compreender todos os dados relacionados à renderização do item de conteúdo. O fluxo de dados do item de conteúdo audiovisual é geralmente chamado de fluxo de transporte ou, possivelmente, como um fluxo de sistema, fluxo de programa ou fluxo de recipiente. O fluxo de dados audiovisuais individuais geralmente é chamado de um fluxo de dados elementar.[006] The audiovisual content item data stream may comprise all data related to the rendering of the content item. The data stream of the audiovisual content item is often referred to as a transport stream, or possibly as a system stream, program stream, or container stream. The individual audiovisual data stream is often called an elementary data stream.

[007] Para fornecer uma representação eficiente do item de conteúdo audiovisual, é importante que seja definida uma estrutura de dados efetiva para o fluxo (stream) de dados de item de conteúdo audiovisual. O uso de uma estrutura de dados compreendendo uma série de fluxos (streams) de dados audiovisuais separados que represente, cada um, componentes audiovisuais, fornece uma abordagem flexível e ainda eficiente. A abordagem possibilita, por exemplo, uma inclusão flexível de diferentes trilhas de áudio para um dado componente de vídeo, por exemplo, sinais de áudio correspondentes a diferentes idiomas podem ser fornecidos em diferentes fluxos (streams) de dados audiovisuais.[007] To provide an efficient representation of the audiovisual content item, it is important that an effective data structure be defined for the audiovisual content item data stream. The use of a data structure comprising a series of separate audiovisual data streams that each represent audiovisual components provides a flexible yet efficient approach. The approach enables, for example, flexible inclusion of different audio tracks for a given video component, for example, audio signals corresponding to different languages can be provided in different audiovisual data streams.

[008] Um exemplo de uma estrutura de dados é fornecido em ETSI DVB (Digital Video Broadcasting) Standard EN 300 468 V I.14.1, onde a seção 6.4.10 refere-se especificamente ao fluxo de transporte MPEG usado para DVB. ENGDEGÂRD JONAS ET AL: “MPEG Spatial Audio Object Coding The ISO/MPEG Standard for Efficient Coding of Interactive Audio Scenes”, AES CONVENTION 129; NOVEMBER 2010, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, EUA, 4 de Novembro de 2010 (04-11-2010), XP040567234, fornece uma introdução e visão geral da especificação ISO-MPEG SAOC. Steffens et al: “Interactivity in MPEG-H 3D Audio Content - Proposal for Extension of OAM Format and Test Procedure” 16 de janeiro de 2013, XP030056683 propõe que revela o uso de um sinalizador de interatividade em uma abordagem de codificador/decodificador baseado em objeto para indicar que um objeto de áudio específico deve ser disponibilizado separadamente de todos os outros objetos de áudio no lado do receptor.[008] An example of a data structure is provided in ETSI DVB (Digital Video Broadcasting) Standard EN 300 468 V I.14.1, where section 6.4.10 specifically refers to the MPEG transport stream used for DVB. ENGDEGÂRD JONAS ET AL: “MPEG Spatial Audio Object Coding The ISO/MPEG Standard for Efficient Coding of Interactive Audio Scenes”, AES CONVENTION 129; NOVEMBER 2010, AES, 60 EAST 42ND STREET, ROOM 2520 NEW YORK 10165-2520, USA, November 4, 2010 (2010-11-04), XP040567234, provides an introduction and overview of the ISO-MPEG SAOC specification. Steffens et al: “Interactivity in MPEG-H 3D Audio Content - Proposal for Extension of OAM Format and Test Procedure” January 16, 2013, XP030056683 proposes that reveals the use of an interactivity flag in an encoder/decoder-based approach object to indicate that a specific audio object should be made available separately from all other audio objects on the receiver side.

[009] Uma série de diferentes estruturas para fluxos (streams) de dados de item de conteúdo audiovisual foi padronizada. Uma das estruturas mais amplamente distribuídas e frequentemente usadas para fluxos (streams) de dados de item de conteúdo audiovisual é o Fluxo (stream) de Transporte MPEG-2, que é usado, por exemplo, para broadcast de televisão digital ou Blu-rays.[009] A number of different structures for audiovisual content item data streams have been standardized. One of the most widely distributed and frequently used structures for audiovisual content item data streams is the MPEG-2 Transport Stream, which is used, for example, for broadcast digital television or Blu-rays.

[010] O Fluxo (stream) de Transporte MPEG-2 é um exemplo de uma estrutura de dados na qual o fluxo de dados é constituído de uma pluralidade de pacotes de dados sequenciais multiplexados no tempo. Cada pacote de dados pode fornecer dados para um componente específico do item de conteúdo audiovisual.[010] The MPEG-2 Transport Stream is an example of a data structure in which the data stream is made up of a plurality of time-multiplexed sequential data packets. Each data packet can provide data for a specific component of the audiovisual content item.

[011] Entretanto, um problema com a abordagem convencional aos fluxos (streams) de dados de item de conteúdo audiovisual reside em que a estrutura de dados é sub-ótima para algumas finalidades, e, em particular, tende a não fornecer flexibilidade ideal.[011] However, a problem with the conventional approach to audiovisual content item data streams lies in that the data structure is sub-optimal for some purposes, and, in particular, tends not to provide optimal flexibility.

[012] Por exemplo, fluxos (streams) de dados de item de conteúdo audiovisual como Fluxo (streams) de Transporte MPEG-2 suportam representações de áudio alternativas para uma dada cena ao possibilitarem que sejam fornecidas diferentes representações de áudio em diferentes fluxos elementares. Então, um receptor pode fazer a seleção entre esses fluxos elementares alternativos para fornecer uma trilha de áudio desejada. Por exemplo, um Fluxo (stream) de Transporte MPEG-2 pode compreender um fluxo elementar compreendendo um componente de vídeo junto com dois fluxos elementares que fornecem, cada um, uma representação de áudio que pode ser renderizada junto com o componente de vídeo. Por exemplo, um fluxo de áudio elementar pode compreender o áudio do componente de vídeo no idioma original, enquanto um outro fluxo de áudio elementar pode compreender o áudio para o componente de vídeo, mas com a voz dublada em um idioma diferente. Então, um decodificador ou renderizador pode fazer a seleção entre as trilhas de áudio alternativas para o vídeo por meio da seleção do fluxo elementar adequado.[012] For example, audiovisual content item data streams such as MPEG-2 Transport streams support alternative audio representations for a given scene by enabling different audio representations to be provided in different elementary streams. Then, a receiver can select between these alternative elementary streams to provide a desired audio track. For example, an MPEG-2 Transport Stream may comprise an elementary stream comprising a video component together with two elementary streams that each provide an audio representation that can be rendered along with the video component. For example, one elementary audio stream may comprise the audio for the video component in the original language, while another elementary audio stream may comprise the audio for the video component, but with the voice dubbed in a different language. Then, a decoder or renderer can select between alternative audio tracks for the video by selecting the appropriate elementary stream.

[013] Entretanto, tal abordagem não fornece flexibilidade ideal ao áudio e também resulta em uma taxa de dados relativamente alta devido às representações de áudio paralelas fornecidas pelos fluxos elementares alternativos.[013] However, such an approach does not provide optimal audio flexibility and also results in a relatively high data rate due to the parallel audio representations provided by alternative elementary streams.

[014] Consequentemente, seria desejável fornecer uma abordagem aprimorada para fluxos (streams) de dados de item de conteúdo audiovisual e, em particular, uma abordagem que forneça flexibilidade adicional e/ou uma taxa de dados reduzida.[014] Consequently, it would be desirable to provide an improved approach to audiovisual content item data streams and, in particular, an approach that provides additional flexibility and/or a reduced data rate.

[015] Entretanto, um desafio crítico é aquele de como tal aperfeiçoamento é possível ao mesmo tempo em que se mantém um alto grau de existência de atributos comuns com as abordagens existentes. Por exemplo, é desejável ser capaz de melhorar ainda mais o Fluxo (stream) de Transporte MPEG- 2, mas tal aprimoramento deve manter, de preferência, tanta compatibilidade retrógrada quanto possível. As considerações necessárias para aprimorar as abordagens a fluxos (streams) de dados de item de conteúdo audiovisual podem, além disso, não estar limitadas apenas a que dados adicionais devem ser fornecidos, como ou em que formato devem ser fornecidos. Ao invés disso, existem desafios adicionais na determinação de como tais dados devem ser incluídos em um fluxo de dados do item de conteúdo audiovisual para não apenas obter um fluxo de dados do item de conteúdo audiovisual eficiente, como também possibilitar uma operação eficiente e, preferencialmente, retrocompatibilidade otimizada.[015] However, a critical challenge is how such improvement is possible while maintaining a high degree of common attributes with existing approaches. For example, it is desirable to be able to further improve the MPEG-2 Transport stream, but such enhancement should ideally maintain as much backward compatibility as possible. Considerations needed to improve approaches to audiovisual content item data streams may furthermore not be limited to just what additional data should be provided, how, or in what format it should be provided. Instead, there are additional challenges in determining how such data should be included in an audiovisual content item data stream to not only achieve an efficient audiovisual content item data stream, but also enable efficient operation and, ideally, , optimized backward compatibility.

[016] Assim, seria vantajosa uma abordagem aprimorada para fluxos (streams) de dados de item de conteúdo audiovisual.[016] Thus, an improved approach to audiovisual content item data streams would be advantageous.

SUMMARY OF THE INVENTION

[017] Consequentemente, a Invenção busca, de preferência, mitigar, aliviar ou eliminar uma ou mais das desvantagens mencionadas acima, individualmente ou em qualquer combinação.[017] Consequently, the Invention preferably seeks to mitigate, alleviate or eliminate one or more of the disadvantages mentioned above, individually or in any combination.

[018] De acordo com um outro aspecto da invenção, é apresentado um método de geração de um sinal de áudio para um item de conteúdo audiovisual, sendo que o método compreende: receber um fluxo de dados de item de conteúdo audiovisual compreendendo uma pluralidade de fluxos (streams) de dados audiovisuais individuais, sendo que a pluralidade de fluxos (streams) de dados audiovisuais individuais compreende componentes audiovisuais para um item de conteúdo audiovisual; sendo que cada fluxo de dados audiovisuais compreende dados codificados representando ao menos um componente audiovisual e dados de sincronização; sendo que o fluxo de dados do item de conteúdo audiovisual compreende um primeiro fluxo de dados audiovisuais individuais compreendendo primeiros dados de áudio para uma representação de áudio para o item de conteúdo audiovisual, sendo que o primeiro dado de áudio compreende dados de áudio obrigatórios para a representação de áudio e dados de áudio substituíveis para a representação de áudio, os dados de áudio obrigatórios correspondentes a um componente de áudio que deve ser renderizado quando a representação de áudio é renderizada e os dados de áudio substituíveis correspondentes a um componente de áudio substituível que pode ser substituído por um componente de áudio alternativo quando a representação de áudio é renderizada, o fluxo de dados de item de conteúdo audiovisual compreendendo ainda uma tabela de mapa de item de conteúdo para o item de conteúdo audiovisual, a tabela de mapa de item de conteúdo compreendendo uma lista de identificadores de pacote de fluxo de dados audiovisual para pacotes de dados para fluxos de dados audiovisuais ligados ao item de conteúdo audiovisual, e a tabela de mapa de item de conteúdo compreendendo um identificador de pacote de fluxo de dados comuns para o item de conteúdo audiovisual para um conjunto de pelo menos dois da pluralidade de fluxos de dados audiovisuais individuais; o método compreendendo ainda: extrair os dados de áudio obrigatórios dos primeiros dados de áudio em resposta ao identificador de pacote de fluxo de dados comum; recuperar dados de áudio alternativos; substituir os dados de áudio substituíveis pelos dados de áudio alternativos; gerar o sinal de áudio a partir dos dados de áudio obrigatórios e os dados de áudio alternativos; em que o método compreende ainda: gerar um único fluxo de dados audiovisuais individual a partir da pluralidade de fluxos de dados audiovisuais individuais únicos; gerar um descritor de processamento de dados de áudio para segundos dados de áudio de pelo menos um dos fluxos de dados audiovisuais, inserir o descritor de processamento de dados de áudio no único fluxo de dados audiovisuais e alimentar o único fluxo de dados audiovisuais para um decodificador de áudio; e em que a geração do sinal de áudio compreende o decodificador de áudio que gera o sinal de áudio a partir de dados de áudio do único fluxo de dados audiovisuais individual, extraindo o descritor de processamento de dados de áudio do segundo fluxo de dados audiovisuais; e gerar o sinal de áudio em resposta ao descritor de processamento de dados de áudio.[018] According to another aspect of the invention, there is provided a method of generating an audio signal for an audiovisual content item, the method comprising: receiving an audiovisual content item data stream comprising a plurality of individual audiovisual data streams, wherein the plurality of individual audiovisual data streams comprises audiovisual components for an audiovisual content item; wherein each audiovisual data stream comprises encoded data representing at least one audiovisual component and synchronization data; wherein the audiovisual content item data stream comprises a first individual audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, the first audio data comprising audio data required for the audio representation and substitutable audio data for the audio representation, the mandatory audio data corresponding to an audio component that must be rendered when the audio representation is rendered, and the substitutable audio data corresponding to a substitutable audio component that may be replaced by an alternative audio component when the audio representation is rendered, the audiovisual content item data stream further comprising a content item map table for the audiovisual content item, the audiovisual content item map table content comprising a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the audiovisual content item, and the content item map table comprising a common data stream packet identifier for the audiovisual content item for a set of at least two of the plurality of individual audiovisual data streams; the method further comprising: extracting the required audio data from the first audio data in response to the common data stream packet identifier; recover alternative audio data; replace the substitutable audio data with alternative audio data; generating the audio signal from the mandatory audio data and the alternative audio data; wherein the method further comprises: generating a single individual audiovisual data stream from the plurality of single individual audiovisual data streams; generating an audio data processing descriptor for second audio data from at least one of the audiovisual data streams, inserting the audio data processing descriptor into the single audiovisual data stream, and feeding the single audiovisual data stream to a decoder audio; and wherein generating the audio signal comprises the audio decoder generating the audio signal from audio data of the single individual audiovisual data stream, extracting the audio data processing descriptor from the second audiovisual data stream; and generating the audio signal in response to the audio data processing descriptor.

[019] A invenção pode possibilitar a geração aprimorada de áudio para um item de conteúdo. Geralmente, é possível obter um processamento, comunicação ou funcionalidade mais eficiente e/ou flexível.[019] The invention may enable enhanced audio generation for a content item. More efficient and/or flexible processing, communication or functionality can generally be achieved.

[020] Uma seleção e geração de áudio mais eficiente pode ser obtida em muitos cenários.[020] More efficient audio selection and generation can be achieved in many scenarios.

[021] A abordagem pode muitas vezes proporcionar retrocompatibilidade aprimorada. Deve-se considerar que os comentários fornecidos anteriormente com relação à geração do fluxo de dados do item de conteúdo audiovisual se aplicarão igualmente, mutatis mutandis, ao processamento do fluxo de dados do item de conteúdo audiovisual.[021] The approach can often provide improved backwards compatibility. It should be considered that the comments provided previously regarding the generation of the audiovisual content item data stream will apply equally, mutatis mutandis, to the processing of the audiovisual content item data stream.

[022] A substituição dos dados de áudio substituíveis pelos dados de áudio alternativos pode se dar por meio de uma seleção dos dados de áudio alternativos e uma de-seleção (ou não seleção) dos dados de áudio substituíveis para processamento. Em algumas modalidades, a seleção/de-seleção pode ser uma seleção/de-seleção de componentes de áudio que correspondem aos dados de áudio substituíveis e dados de áudio alternativos, isto é, por uma seleção/de-seleção de um componente de áudio substituível e um componente de áudio alternativo gerado pela decodificação dos dados de áudio substituíveis e dados de áudio alternativos, respectivamente. Em outras modalidades, a substituição pode ser, por exemplo, por sobreposição dos dados de áudio substituíveis pelos dados de áudio alternativos, por exemplo, em um fluxo de dados/fluxo de bits ou na memória.[022] Replacing the substitutable audio data with alternative audio data may occur through a selection of the alternative audio data and a de-selection (or non-selection) of the substitutable audio data for processing. In some embodiments, the selection/de-selection may be a selection/de-selection of audio components that correspond to the replaceable audio data and alternative audio data, i.e., by a selection/de-selection of an audio component. replaceable and an alternative audio component generated by decoding the replaceable audio data and alternative audio data, respectively. In other embodiments, the replacement may be, for example, by overlaying the replaceable audio data with alternative audio data, for example, in a data stream/bitstream or in memory.

[023] Em algumas modalidades, o método pode compreender recuperar apenas um dentre os dados de áudio substituíveis e os dados de áudio alternativos, e usar apenas os dados de áudio recuperados para a geração do sinal de áudio.[023] In some embodiments, the method may comprise recovering only one of the replaceable audio data and the alternative audio data, and using only the recovered audio data for generating the audio signal.

[024] Em algumas modalidades, a recuperação compreende recuperar os dados de áudio alternativos do primeiro fluxo de dados audiovisuais. Em algumas modalidades, a recuperação compreende recuperar os dados de áudio alternativos de um fluxo de dados audiovisuais diferente dentre a pluralidade de fluxos de dados audiovisuais individuais do primeiro fluxo de dados audiovisuais.[024] In some embodiments, recovery comprises recovering alternative audio data from the first audiovisual data stream. In some embodiments, the recovery comprises recovering the alternative audio data from a different audiovisual data stream among the plurality of individual audiovisual data streams of the first audiovisual data stream.

[025] Em algumas modalidades, a recuperação compreende recuperar os dados de áudio alternativos de um fluxo de dados diferente do fluxo de dados do item de conteúdo audiovisual.[025] In some embodiments, retrieval comprises retrieving alternative audio data from a data stream other than the data stream of the audiovisual content item.

[026] Um fluxo de dados pode, por exemplo, corresponder a um arquivo separado ou a um segmento de um arquivo.[026] A data stream may, for example, correspond to a separate file or a segment of a file.

[027] De acordo com um aspecto da invenção, é fornecido um aparelho para gerar um sinal de áudio para um item de conteúdo audiovisual, sendo que o aparelho compreende: um receptor para receber um fluxo de dados de item de conteúdo audiovisual compreendendo uma pluralidade de fluxos (streams) de dados audiovisuais individuais, sendo que a pluralidade de fluxos (streams) de dados audiovisuais individuais compreende componentes audiovisuais para um item de conteúdo audiovisual; sendo que cada fluxo de dados audiovisuais compreende dados codificados representando ao menos um componente audiovisual e dados de sincronização; sendo que o fluxo de dados do item de conteúdo audiovisual compreende um primeiro fluxo de dados audiovisuais compreendendo primeiros dados de áudio para uma representação de áudio para o item de conteúdo audiovisual, sendo que o primeiro dado de áudio compreende dados de áudio obrigatórios para a representação de áudio e dados de áudio substituíveis para a representação de áudio, os dados de áudio obrigatórios correspondentes a um componente de áudio que deve ser renderizado quando a representação de áudio é renderizada e os dados de áudio substituíveis correspondentes a um componente de áudio substituível que pode ser substituído por um componente de áudio alternativo quando a representação de áudio é renderizada, o fluxo de dados de item de conteúdo audiovisual compreendendo ainda uma tabela de mapa de item de conteúdo para o item de conteúdo audiovisual, a tabela de mapa de item de conteúdo compreendendo uma lista de identificadores de pacote de fluxo de dados audiovisual para pacotes de dados para fluxos de dados audiovisuais ligados ao item de conteúdo audiovisual, e a tabela de mapa de item de conteúdo compreendendo um identificador de pacote de fluxo de dados comuns para o item de conteúdo audiovisual para um conjunto de pelo menos dois da pluralidade de fluxos de dados audiovisuais individuais; o aparelho compreende ainda: um extrator para extrair os dados de áudio obrigatórios dos primeiros dados de áudio em resposta ao identificador de pacote de fluxo de dados comuns; um recuperador recuperando dados de áudio alternativos; um substituidor para substituir os dados de áudio substituíveis pelos dados de áudio alternativos; uma saída para gerar o sinal de áudio dos dados de áudio obrigatórios e os dados de áudio alternativos; um decodificador de áudio para gerar o sinal de áudio a partir de dados de áudio de um único fluxo de dados audiovisuais individual, o decodificador de áudio compreendendo o extrator, o recuperador, o substituidor e a saída; e em que o receptor está disposto para gerar o único fluxo de dados audiovisuais individual a partir da pluralidade de fluxos de dados audiovisuais individuais e para gerar um descritor de processamento de dados de áudio para segundos dados de áudio de pelo menos um dos fluxos de dados audiovisuais e para inserir o descritor de processamento de dados de áudio no único fluxo de dados audiovisuais e para alimentar o único fluxo de dados audiovisuais para o decodificador de áudio; e o decodificador de áudio compreende ainda um extrator de descritor de processamento de dados de áudio para extrair o descritor de processamento de dados de áudio do segundo fluxo de dados audiovisuais; e o decodificador de áudio é disposto para gerar o sinal de áudio em resposta ao descritor de processamento de dados de áudio.[027] According to one aspect of the invention, there is provided an apparatus for generating an audio signal for an audiovisual content item, the apparatus comprising: a receiver for receiving an audiovisual content item data stream comprising a plurality of individual audiovisual data streams, wherein the plurality of individual audiovisual data streams comprises audiovisual components for an audiovisual content item; wherein each audiovisual data stream comprises encoded data representing at least one audiovisual component and synchronization data; wherein the audiovisual content item data stream comprises a first audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, the first audio data comprising audio data required for the representation audio data and substitutable audio data for the audio representation, the mandatory audio data corresponding to an audio component that must be rendered when the audio representation is rendered, and the substitutable audio data corresponding to a substitutable audio component that can be replaced by an alternative audio component when the audio representation is rendered, the audiovisual content item data stream further comprising a content item map table for the audiovisual content item, the content item map table comprising a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the audiovisual content item, and the content item map table comprising a common data stream packet identifier for the item of audiovisual content for a set of at least two of the plurality of individual audiovisual data streams; the apparatus further comprises: an extractor for extracting the required audio data from the first audio data in response to the common data stream packet identifier; a recoverer recovering alternative audio data; a replacer for replacing the replaceable audio data with the alternative audio data; an output for generating the audio signal of the mandatory audio data and the alternative audio data; an audio decoder for generating the audio signal from audio data of a single individual audiovisual data stream, the audio decoder comprising the extractor, the recoverer, the replacer and the output; and wherein the receiver is arranged to generate the single individual audiovisual data stream from the plurality of individual audiovisual data streams and to generate an audio data processing descriptor for second audio data from at least one of the data streams audiovisual data streams and to insert the audio data processing descriptor into the single audiovisual data stream and to feed the single audiovisual data stream to the audio decoder; and the audio decoder further comprises an audio data processing descriptor extractor for extracting the audio data processing descriptor from the second audiovisual data stream; and the audio decoder is arranged to generate the audio signal in response to the audio data processing descriptor.

[028] Um método para gerar um fluxo de dados de item de conteúdo audiovisual compreende uma pluralidade de fluxos de dados audiovisuais individuais, a pluralidade de fluxos de dados audiovisuais individuais compreendendo componentes audiovisuais para um item de conteúdo audiovisual; cada fluxo de dados audiovisuais compreendendo dados codificados representando pelo menos um componente audiovisual e dados de sincronização; compreendendo: gerar um primeiro fluxo de dados audiovisuais compreendendo primeiros dados de áudio para uma representação de áudio para o item de conteúdo audiovisual, sendo que os primeiros dados de áudio compreendem dados de áudio obrigatórios para a representação de áudio e dados de áudio substituíveis para a representação de áudio, sendo que os dados de áudio substituíveis são dados substituíveis por dados de áudio alternativos; e incluir o primeiro fluxo de dados audiovisuais no fluxo de dados do item de conteúdo audiovisual.[028] A method for generating an audiovisual content item data stream comprises a plurality of individual audiovisual data streams, the plurality of individual audiovisual data streams comprising audiovisual components for an audiovisual content item; each audiovisual data stream comprising encoded data representing at least one audiovisual component and synchronization data; comprising: generating a first audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, wherein the first audio data comprises mandatory audio data for the audio representation and substitutable audio data for the audio representation, wherein substitutable audio data is data substitutable with alternative audio data; and including the first audiovisual data stream in the audiovisual content item data stream.

[029] A abordagem pode fornecer um fluxo de dados do item de conteúdo audiovisual aprimorado. Em particular, é possível obter um fluxo de transporte com maior flexibilidade e/ou taxa de dados reduzida em muitos cenários.[029] The approach can provide an enhanced audiovisual content item data stream. In particular, it is possible to achieve a transport flow with greater flexibility and/or reduced data rate in many scenarios.

[030] Uma provisão mais eficiente de áudio alternativo pode ser conseguida em muitos cenários. Geralmente, a abordagem pode ser implementada como um aprimoramento a ou desenvolvimento adicional de fluxos de transporte existentes, requerendo ao mesmo tempo um nível de modificação relativamente baixo. Com frequência, pode-se conseguir maior retrocompatibilidade.[030] A more efficient provision of alternative audio can be achieved in many scenarios. Generally, the approach can be implemented as an enhancement to or further development of existing transport flows, while requiring a relatively low level of modification. Greater backward compatibility can often be achieved.

[031] Como um exemplo específico, a abordagem pode possibilitar um aprimoramento eficiente e prático de fluxos de transporte como o Fluxo (stream) de Transporte MPEG-2. O fluxo de transporte pode manter a abordagem e a filosofia de design geral de Fluxos (stream) de Transporte MPEG-2 tradicionais ao mesmo tempo em que possibilita que isso seja melhorado para fornecer uma representação mais flexível e eficiente de representações de áudio alternativas.[031] As a specific example, the approach can enable efficient and practical enhancement of transport streams such as the MPEG-2 Transport stream. The transport stream can maintain the general design approach and philosophy of traditional MPEG-2 Transport Streams while allowing it to be improved to provide a more flexible and efficient representation of alternative audio representations.

[032] Os dados de áudio substituíveis podem ser repostos/substituídos/trocados/mudados pelos dados de áudio alternativos. Dessa forma, o fluxo de transporte fornece representações de áudio alternativas para o item de conteúdo com uma alternativa, por exemplo, sendo uma representação padrão representada pelos dados de áudio obrigatórios e os dados de áudio substituíveis, e a outra sendo uma representação alternativa representada pelos dados de áudio obrigatórios e os dados de áudio alternativos.[032] The replaceable audio data can be replaced/replaced/swapped/changed with the alternative audio data. In this way, the transport stream provides alternative audio representations for the content item with one alternative, for example, being a default representation represented by the required audio data and the replaceable audio data, and the other being an alternative representation represented by the mandatory audio data and alternative audio data.

[033] Em muitos cenários, o método pode compreender adicionalmente incluir os dados de áudio alternativos no fluxo de transporte, com frequência no primeiro fluxo de dados audiovisuais ou em um outro fluxo de dados do item de conteúdo audiovisual da pluralidade de fluxos de dados audiovisuais. Dessa forma, os dados de áudio alternativos podem estar compreendidos em um fluxo de dados audiovisuais da pluralidade de fluxos (streams) de dados audiovisuais individuais.[033] In many scenarios, the method may further comprise including the alternative audio data in the transport stream, often in the first audiovisual data stream or in another data stream of the audiovisual content item of the plurality of audiovisual data streams. . In this way, the alternative audio data can be comprised in an audiovisual data stream of the plurality of individual audiovisual data streams.

[034] Os dados de áudio obrigatórios podem definir um componente de áudio obrigatório para a representação de áudio. Os dados de áudio substituíveis podem definir um componente de áudio substituível para a representação de áudio. Os dados de áudio alternativos podem definir um componente de áudio alternativo para a representação de áudio.[034] Mandatory audio data may define a mandatory audio component for the audio representation. Replaceable audio data may define a replaceable audio component for the audio representation. Alternate audio data can define an alternate audio component for the audio representation.

[035] Dessa forma, os primeiros dados de áudio podem compreender dados de áudio obrigatórios para um componente de áudio obrigatório da representação e dados de áudio substituíveis para um componente de áudio substituível para a representação, sendo que o componente de áudio substituível é um dado que pode ser substituído por dados de áudio alternativos para um componente de áudio alternativo no componente de áudio substituível.[035] In this way, the first audio data may comprise mandatory audio data for a mandatory audio component of the representation and replaceable audio data for a replaceable audio component for the representation, the replaceable audio component being a data which can be replaced with alternative audio data for an alternative audio component in the replaceable audio component.

[036] Os dados de áudio substituíveis podem corresponder a uma trilha de áudio padrão para o item de conteúdo.[036] The replaceable audio data may correspond to a standard audio track for the content item.

[037] O fluxo de transporte pode incluir uma designação de uma ou mais representações de áudio para o item de conteúdo. Uma representação de áudio pode corresponder a um conjunto de componentes de áudio que é suficiente para fornecer uma saída de áudio para o item de conteúdo. Por conseguinte, o fluxo de transporte pode designar ao menos uma trilha/representação de som de áudio para o item de conteúdo. Em muitas modalidades, ao menos uma representação de áudio designada (ou definida) no fluxo de transporte compreende uma pluralidade de componentes de áudio, sendo que ao menos um componente de áudio é um componente de áudio obrigatório e ao menos um componente de áudio é um componente de áudio substituível. O componente de áudio obrigatório é representado pelos dados de áudio obrigatórios e o componente de áudio substituível é representado por dados de áudio substituíveis. O componente de áudio obrigatório precisa ser incluído na saída de áudio para o item de conteúdo quando a representação for selecionada. Entretanto, quando um receptor seleciona essa representação, o componente de áudio substituível pode ser incluído ou pode ser substituído por um componente de áudio alternativo. O componente de áudio alternativo é representado por dados de áudio alternativos, muitas vezes (mas não sempre/necessariamente) compreendidos no fluxo de transporte em si.[037] The transport stream may include an assignment of one or more audio representations to the content item. An audio representation can correspond to a set of audio components that is sufficient to provide an audio output for the content item. Therefore, the transport stream may assign at least one audio sound track/representation to the content item. In many embodiments, at least one designated (or defined) audio representation in the transport stream comprises a plurality of audio components, wherein at least one audio component is a required audio component and at least one audio component is a replaceable audio component. The mandatory audio component is represented by mandatory audio data, and the replaceable audio component is represented by replaceable audio data. The required audio component must be included in the audio output for the content item when representation is selected. However, when a receiver selects this representation, the replaceable audio component may be included or may be replaced with an alternative audio component. The alternate audio component is represented by alternate audio data, often (but not always/necessarily) comprised in the transport stream itself.

[038] Na abordagem, os dados de áudio para uma representação de áudio definida/especificada/descrita/designada no fluxo de transporte podem compreender, consequentemente, dados de áudio obrigatórios para ao menos um componente de áudio obrigatório e dados de áudio substituíveis para ao menos um componente de áudio substituível. Quando a representação de áudio designado no fluxo de transporte é selecionada para, por exemplo, renderização, o componente de áudio obrigatório precisa ser incluído, enquanto que o componente de áudio substituível precisa ser incluído ou substituído por um componente de áudio alternativo.[038] In the approach, audio data for a defined/specified/described/designated audio representation in the transport stream may consequently comprise mandatory audio data for at least one mandatory audio component and substitutable audio data for the one less replaceable audio component. When the designated audio representation in the transport stream is selected for, for example, rendering, the mandatory audio component needs to be included, while the replaceable audio component needs to be added or replaced with an alternative audio component.

[039] Uma representação de áudio para um item de conteúdo pode corresponder a um conjunto de componentes de áudio que seja suficiente para fornecer uma apresentação/trilha de áudio para o item de conteúdo. Especificamente, uma representação de áudio para um item de conteúdo pode corresponder a um conjunto de componentes de áudio que é indicado no fluxo de transporte como suficiente para fornecer uma trilha de som para o item de conteúdo. Um conjunto de componentes de áudio que não é definido no fluxo de transporte como suficiente para fornecer uma representação de áudio para o item de conteúdo, a menos que combinado com ao menos um outro componente de áudio, não forma uma representação de áudio.[039] An audio representation for a content item may correspond to a set of audio components that is sufficient to provide an audio presentation/track for the content item. Specifically, an audio representation for a content item may correspond to a set of audio components that is indicated in the transport stream as sufficient to provide a sound track for the content item. A set of audio components that is not defined in the transport stream as sufficient to provide an audio representation for the content item, unless combined with at least one other audio component, does not form an audio representation.

[040] Dessa forma, o fluxo de transporte pode incluir dados que definam uma ou mais representações de áudio para o item de conteúdo. Os dados de áudio obrigatórios podem ser obrigatórios para uma primeira representação de áudio das representações de áudio definidas. Os dados de áudio substituíveis fornecem dados de áudio necessários para a primeira representação de áudio, a menos que sejam substituídos pelos dados de áudio alternativos. O fluxo de transporte pode, possivelmente, designar mais de uma representação de áudio para o item de conteúdo. Nesse caso, os dados de áudio obrigatórios não precisam ser obrigatórios para uma segunda representação de áudio.[040] In this way, the transport stream may include data that defines one or more audio representations for the content item. Mandatory audio data may be mandatory for a first audio representation of the defined audio representations. Replaceable audio data provides audio data required for the first audio representation unless replaced by the alternate audio data. The transport stream can possibly assign more than one audio representation to the content item. In this case, the mandatory audio data need not be mandatory for a second audio representation.

[041] Um fluxo de dados pode, por exemplo, corresponder a um arquivo separado ou a um segmento de um arquivo.[041] A data stream may, for example, correspond to a separate file or a segment of a file.

[042] O método pode compreender adicionalmente a etapa de incluir os dados de áudio alternativos no primeiro fluxo de dados audiovisuais.[042] The method may further comprise the step of including the alternative audio data in the first audiovisual data stream.

[043] Isso pode proporcionar uma abordagem eficiente e flexível e fluxo de dados do item de conteúdo audiovisual. Em particular, em muitos cenários, isso pode fornecer uma estrutura de dados muito eficiente para áudio alternativo. A abordagem pode proporcionar, por exemplo, um agrupamento aprimorado de áudio alternativo que, em algumas modalidades, pode facilitar a operação.[043] This can provide an efficient and flexible approach and data flow of the audiovisual content item. In particular, in many scenarios this can provide a very efficient data structure for alternative audio. The approach may provide, for example, improved grouping of alternative audio that, in some embodiments, may facilitate operation.

[044] A etapa de incluir os dados de áudio alternativo no primeiro fluxo de dados audiovisual pode compreender incluir os dados de áudio alternativo em um fluxo de dados audiovisuais diferente da pluralidade de fluxos de dados audiovisuais individuais do primeiro fluxo de dados audiovisuais.[044] The step of including the alternative audio data in the first audiovisual data stream may comprise including the alternative audio data in an audiovisual data stream other than the plurality of individual audiovisual data streams of the first audiovisual data stream.

[045] Isso pode proporcionar uma abordagem eficiente, e um fluxo de dados do item de conteúdo audiovisual eficiente e flexível. Em particular, em muitos cenários, isso pode fornecer uma estrutura de dados muito eficiente para áudio alternativo. A abordagem pode facilitar, por exemplo, a geração do fluxo de transporte e/ou facilitar a extração de dados desejados a partir dali.[045] This can provide an efficient approach, and an efficient and flexible audiovisual content item data flow. In particular, in many scenarios this can provide a very efficient data structure for alternative audio. The approach can facilitate, for example, the generation of the transport flow and/or facilitate the extraction of desired data from there.

[046] Em alguns cenários, o fluxo diferente de dados audiovisuais pode fornecer uma representação de áudio alternativa da cena de áudio. Por exemplo, o fluxo diferente de dados audiovisuais pode ser designado no fluxo de transporte como um fluxo elementar que fornecer uma representação de áudio para um item de conteúdo. Especificamente, pode compreender dados para um conjunto de componentes de áudio suficientes para gerar uma saída de áudio para o item de conteúdo sem incluir qualquer componente de áudio para outros fluxos.[046] In some scenarios, the different stream of audiovisual data may provide an alternative audio representation of the audio scene. For example, the different stream of audiovisual data may be designated in the transport stream as an elementary stream that provides an audio representation for a content item. Specifically, it may comprise data for a set of audio components sufficient to generate an audio output for the content item without including any audio components for other streams.

[047] O fluxo de dados do item de conteúdo audiovisual pode ser um fluxo de transporte e o primeiro fluxo de dados audiovisuais pode ser um fluxo elementar.[047] The data stream of the audiovisual content item may be a transport stream and the first audiovisual data stream may be an elementary stream.

[048] A abordagem pode fornecer um fluxo de transporte aprimorado que é baseado em uma série de fluxos elementares individuais. A abordagem pode proporcionar uma estrutura flexível, ainda que eficiente, para representar um item de conteúdo. Além disso, a mesma pode possibilitar retrocompatibilidade aprimorada com sistemas convencionais.[048] The approach can provide an improved transport flow that is based on a series of individual elementary flows. The approach can provide a flexible yet efficient structure for representing a content item. Furthermore, it can enable improved backwards compatibility with conventional systems.

[049] Os dados de áudio substituíveis podem representar um componente de áudio de voz em um primeiro idioma e os dados de áudio alternativos representam um componente de áudio de voz em um segundo idioma.[049] The substitutable audio data may represent a speech audio component in a first language and the alternative audio data represents a speech audio component in a second language.

[050] A abordagem pode proporcionar uma abordagem particularmente eficiente para proporcionar uma pluralidade de idiomas diferentes/alternativos para um dado item de conteúdo.[050] The approach can provide a particularly efficient approach to providing a plurality of different/alternative languages for a given content item.

[051] Os dados de áudio obrigatórios podem representar um componente de áudio de fundo e os dados de áudio substituíveis representam um componente de áudio de voz.[051] The mandatory audio data may represent a background audio component and the replaceable audio data represents a voice audio component.

[052] A abordagem pode proporcionar uma abordagem particularmente eficiente para fornecer som diferenciado para áudio de fundo e áudio de voz, e em particular, pode facilitar o suporte de componentes de voz alternativos sem aumentar a taxa de dados de modo inaceitável.[052] The approach may provide a particularly efficient approach to providing differentiated sound for background audio and voice audio, and in particular, may facilitate support of alternative voice components without increasing the data rate to an unacceptable extent.

[053] Os dados de áudio substituíveis e os dados de áudio alternativos podem representar o mesmo que um conteúdo de áudio codificado usando diferentes características de codificação.[053] Replaceable audio data and alternative audio data may represent the same as audio content encoded using different encoding characteristics.

[054] As diferentes características de codificação podem ser, por exemplos, diferentes taxas de dados, diferentes algoritmos de codificação etc. Especificamente, em algumas modalidades, os dados de áudio substituíveis e os dados de áudio alternativos podem representar um mesmo conteúdo ou componente de áudio codificado com diferentes características de codificação, como diferentes taxas de bit.[054] Different coding characteristics can be, for example, different data rates, different coding algorithms, etc. Specifically, in some embodiments, the substitutable audio data and the alternative audio data may represent the same content or audio component encoded with different encoding characteristics, such as different bit rates.

[055] A abordagem pode possibilitar maior flexibilidade e pode possibilitar, especificamente, uma adaptação flexível de características de um fluxo de transporte. Além do mais, a abordagem pode possibilitar que o fluxo de transporte seja modificado de modo relativamente fácil por, por exemplo, entidades ou sistemas intermediários.[055] The approach can enable greater flexibility and can specifically enable flexible adaptation of characteristics of a transport flow. Furthermore, the approach can enable the transport flow to be modified relatively easily by, for example, intermediate entities or systems.

[056] Os dados de áudio alternativos podem representar, por exemplo, um objeto de áudio que pode incluir sub-objetos adicionais.[056] Alternative audio data may represent, for example, an audio object that may include additional sub-objects.

[057] O método pode compreender adicionalmente a etapa de incluir renderização de dados de controle no fluxo de dados do item de conteúdo audiovisual, sendo que os dados de controle de renderização fornecem um parâmetro de renderização para uma renderização que usa os dados de áudio substituíveis diferente de uma renderização que usa os dados de áudio alternativos.[057] The method may further comprise the step of including rendering control data in the data stream of the audiovisual content item, wherein the rendering control data provides a rendering parameter for a rendering that uses the replaceable audio data different from a rendering that uses the alternate audio data.

[058] Isso pode fornecer funcionalidade vantajosa e/ou renderização aprimorada do áudio para o item de conteúdo.[058] This may provide advantageous functionality and/or improved audio rendering for the content item.

[059] O método pode compreender especificamente a etapa de incluir renderização de dados de controle no fluxo de dados do item de conteúdo audiovisual, sendo que os dados de controle de renderização são indicativos de um ajuste de renderização para uma renderização dos dados de áudio substituíveis diferente daquele para uma renderização dos dados de áudio alternativos.[059] The method may specifically comprise the step of including rendering control data in the data stream of the audiovisual content item, wherein the rendering control data is indicative of a rendering adjustment for a rendering of the replaceable audio data different from that for a rendering of the alternative audio data.

[060] O método pode compreender adicionalmente a etapa de incluir uma indicação no fluxo de dados do item de conteúdo audiovisual do primeiro fluxo de dados audiovisual que compreende dados de áudio substituíveis.[060] The method may further comprise the step of including an indication in the data stream of the audiovisual content item of the first audiovisual data stream comprising replaceable audio data.

[061] Isso pode possibilitar uma adaptação eficiente da funcionalidade de um receptor que processa o fluxo de dados do item de conteúdo audiovisual.[061] This may enable efficient adaptation of the functionality of a receiver that processes the data stream of the audiovisual content item.

[062] O método pode compreender adicionalmente a etapa de incluir dados de extração para os dados de áudio substituíveis no fluxo de dados do item de conteúdo audiovisual.[062] The method may further comprise the step of including extraction data for the substitutable audio data in the data stream of the audiovisual content item.

[063] Isso pode possibilitar uma adaptação eficiente da funcionalidade de um receptor que processa o fluxo de dados do item de conteúdo audiovisual.[063] This may enable efficient adaptation of the functionality of a receiver that processes the data stream of the audiovisual content item.

[064] O método pode compreender adicionalmente as etapas de: gerar uma tabela de mapa de itens de conteúdo, sendo que a tabela de mapa de itens de conteúdo para um item de conteúdo compreende uma lista de identificadores de pacote de fluxo de dados audiovisuais para pacotes de dados para fluxos (streams) de dados audiovisuais ligados ao item de conteúdo; e incluir a tabela de mapa de itens de conteúdo no fluxo de dados do item de conteúdo audiovisual; sendo que a etapa de gerar a tabela de mapa de itens de conteúdo compreende gerar a tabela de mapa de itens de conteúdo de modo a incluir um identificador de pacote de fluxo de dados para o item de conteúdo de ao menos dois dentre a pluralidade de fluxos (streams) de dados audiovisuais individuais.[064] The method may further comprise the steps of: generating a content item map table, wherein the content item map table for a content item comprises a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the content item; and include the content item map table in the audiovisual content item data stream; wherein the step of generating the content item map table comprises generating the content item map table to include a data stream packet identifier for the content item of at least two of the plurality of streams (streams) of individual audiovisual data.

[065] Isso pode proporcionar operação aprimorada e/ou facilitada em muitas modalidades. Especificamente, pode possibilitar que seja gerado um fluxo (stream) de dados de item de conteúdo que pode ser processado com complexidade reduzida por equipamento diferente, como multiplexadores, extratores de dados etc.[065] This can provide improved and/or facilitated operation in many modalities. Specifically, it can enable a stream of content item data to be generated that can be processed with reduced complexity by different equipment, such as multiplexers, data extractors, etc.

[066] A etapa de gerar a tabela de mapa de item de conteúdo pode compreender incluir apenas um identificador de pacote de fluxo de dados audiovisuais para o item de conteúdo na tabela de mapa de itens de conteúdo.[066] The step of generating the content item map table may comprise including only an audiovisual data stream packet identifier for the content item in the content item map table.

[067] Isso pode proporcionar operação aprimorada e/ou facilitada em muitas modalidades. Em particular, pode possibilitar que várias funcionalidades processem o fluxo de dados do item de conteúdo audiovisual como se apenas um incluísse um único fluxo de dados audiovisuais.[067] This can provide improved and/or facilitated operation in many modalities. In particular, it may enable multiple functionalities to process the audiovisual content item data stream as if only one included a single audiovisual data stream.

[068] A etapa de gerar a tabela de mapa de item de conteúdo pode compreender incluir apenas um identificador de pacote de fluxo de dados audiovisuais para o item de conteúdo na tabela de mapa de itens de conteúdo.[068] The step of generating the content item map table may comprise including only an audiovisual data stream packet identifier for the content item in the content item map table.

[069] Isso pode proporcionar operação aprimorada e/ou facilitada em muitas modalidades. Em particular, pode admitir que várias funcionalidades processem o fluxo de dados do item de conteúdo audiovisual como se apenas um incluísse um único fluxo de dados audiovisuais.[069] This can provide improved and/or facilitated operation in many modalities. In particular, it may allow multiple functionalities to process the audiovisual content item data stream as if only one included a single audiovisual data stream.

[070] A etapa de gerar a tabela de mapa de itens de conteúdo pode compreender, para o identificador de pacote de fluxo de dados comuns, incluir uma pluralidade de identificadores de pacote secundários, sendo que cada identificador de pacote secundário identifica um fluxo de dados audiovisuais do conjunto de ao menos dois dentre a pluralidade de fluxos (streams) de dados audiovisuais individuais.[070] The step of generating the content item map table may comprise, for the common data stream packet identifier, including a plurality of secondary packet identifiers, each secondary packet identifier identifying a data stream audiovisual data from the set of at least two of the plurality of individual audiovisual data streams.

[071] Isso pode proporcionar maior flexibilidade e funcionalidade. Por exemplo, pode possibilitar acesso e seleção eficiente de fluxos (streams) de dados audiovisuais individuais. Os identificadores de pacote primário e secundário podem, em algumas modalidades, ser incluídos em uma estrutura de dados estruturada ou aninhada ou podem, em outras modalidades, por exemplo, ser fornecidos em uma estrutura plana, onde, por exemplo, os identificadores de pacote primário e secundário são fornecidos como entradas sequenciais em uma única lista.[071] This can provide greater flexibility and functionality. For example, it can enable efficient access and selection of individual audiovisual data streams. The primary and secondary package identifiers may, in some embodiments, be included in a structured or nested data structure or may, in other embodiments, for example, be provided in a flat structure, where, for example, the primary package identifiers and secondary are provided as sequential entries in a single list.

[072] O método pode compreender adicionalmente as etapas de: gerar um descritor de processamento de dados de áudio para o segundo dado de áudio de ao menos um dentre os fluxos de dados audiovisuais, sendo que o descritor de processamento de dados de áudio é indicativo do segundo dado de áudio ser dado de áudio alternativo ou dado de áudio adicional; e incluir a tabela de mapa de itens de conteúdo no fluxo de dados do item de conteúdo audiovisual.[072] The method may additionally comprise the steps of: generating an audio data processing descriptor for the second audio data of at least one of the audiovisual data streams, wherein the audio data processing descriptor is indicative the second audio data is alternative audio data or additional audio data; and include the content item map table in the audiovisual content item data stream.

[073] Isso pode proporcionar maior funcionalidade e pode possibilitar, em particular, uma maneira eficiente de indicar como diferentes dados de áudio podem ser processados por um decodificador.[073] This can provide greater functionality and can enable, in particular, an efficient way to indicate how different audio data can be processed by a decoder.

[074] O método pode compreender adicionalmente a etapa de gerar uma tabela de mapa de itens de conteúdo, sendo que a tabela de mapa de itens de conteúdo para um item de conteúdo compreende uma lista de identificadores de pacote de fluxo de dados audiovisuais para pacotes de dados para fluxos (streams) de dados audiovisuais ligados ao item de conteúdo; e sendo que a etapa de gerar a tabela de mapa de itens de conteúdo compreende gerar a tabela de mapa de itens de conteúdo para incluir o descritor de processamento de dados de áudio.[074] The method may further comprise the step of generating a content item map table, wherein the content item map table for a content item comprises a list of audiovisual data stream packet identifiers for packets of data for streams of audiovisual data linked to the content item; and wherein the step of generating the content item map table comprises generating the content item map table to include the audio data processing descriptor.

[075] Isso pode fornecer representação particularmente vantajosa da informação em muitas modalidades.[075] This can provide particularly advantageous representation of information in many modalities.

[076] De acordo com uma característica opcional da invenção, o método compreende adicionalmente receber um segundo fluxo de dados do item de conteúdo audiovisual compreendendo uma pluralidade de fluxos de dados audiovisuais, sendo que a pluralidade de fluxos de dados audiovisuais compreende componentes audiovisuais; e que a recuperação compreende recuperar os dados de áudio alternativos de um fluxo de dados audiovisuais do segundo fluxo de dados do item de conteúdo audiovisual.[076] According to an optional feature of the invention, the method further comprises receiving a second data stream of the audiovisual content item comprising a plurality of audiovisual data streams, the plurality of audiovisual data streams comprising audiovisual components; and that the recovery comprises recovering the alternative audio data of an audiovisual data stream from the second data stream of the audiovisual content item.

[077] Isto pode proporcionar funcionalidade e/ou operação vantajosa em muitas modalidades.[077] This can provide advantageous functionality and/or operation in many embodiments.

[078] De acordo com uma característica opcional da invenção, a etapa de gerar o sinal de áudio compreende: decodificar os dados de áudio obrigatórios em um primeiro decodificador de áudio para gerar um primeiro sinal de áudio decodificado; decodificar os dados de áudio alternativos em um segundo decodificador de áudio para gerar um segundo sinal de áudio decodificado; e gerar o sinal de áudio em resposta à combinação ao menos do primeiro sinal de áudio decodificado e do segundo sinal de áudio decodificado.[078] According to an optional feature of the invention, the step of generating the audio signal comprises: decoding the mandatory audio data in a first audio decoder to generate a first decoded audio signal; decoding the alternative audio data in a second audio decoder to generate a second decoded audio signal; and generating the audio signal in response to the combination of at least the first decoded audio signal and the second decoded audio signal.

[079] Isso pode proporcionar operação aprimorada e/ou facilitada em muitas modalidades.[079] This can provide improved and/or facilitated operation in many modalities.

[080] O fluxo de dados do item de conteúdo audiovisual compreende uma tabela de mapa de item de conteúdo, sendo que a tabela de mapa de item de conteúdo para um item de conteúdo compreende uma lista de identificadores de pacote de fluxo de dados audiovisuais para pacotes de dados para fluxos de dados audiovisuais ligados ao item de conteúdo, sendo que a tabela de mapa de item de conteúdo compreende um identificador de pacote de fluxo de dados comuns para o item de conteúdo para um conjunto de ao menos dois dentre a pluralidade de fluxos de dados audiovisuais individuais; e pelo método compreender adicionalmente a etapa de extrair dados de áudio para o item de conteúdo em resposta ao identificador de pacote de fluxo de dados comuns.[080] The audiovisual content item data stream comprises a content item map table, wherein the content item map table for a content item comprises a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the content item, wherein the content item map table comprises a common data stream packet identifier for the content item for a set of at least two of the plurality of individual audiovisual data streams; and by the method further comprising the step of extracting audio data for the content item in response to the common data stream packet identifier.

[081] Isso pode proporcionar operação aprimorada e/ou facilitada em muitas modalidades. Especificamente, pode possibilitar que seja gerado um fluxo (stream) de dados de item de conteúdo que pode ser processado com complexidade reduzida por equipamento diferente, como multiplexadores, extratores de dados etc.[081] This can provide improved and/or facilitated operation in many modalities. Specifically, it can enable a stream of content item data to be generated that can be processed with reduced complexity by different equipment, such as multiplexers, data extractors, etc.

[082] De acordo com uma característica opcional da invenção, a tabela de mapa de itens de conteúdo compreende uma pluralidade de identificadores de pacote secundários, sendo que cada identificador de pacote secundário identifica um fluxo de dados audiovisuais do conjunto de ao menos dois dentre a pluralidade de fluxos (streams) de dados audiovisuais individuais; e pela etapa de extrair dados de áudio para o item de conteúdo compreender extrair dados de áudio para diferentes componentes de áudio em resposta aos identificadores de pacote secundários.[082] According to an optional feature of the invention, the content item map table comprises a plurality of secondary packet identifiers, each secondary packet identifier identifying an audiovisual data stream from the set of at least two of the plurality of individual audiovisual data streams; and by the step of extracting audio data for the content item comprising extracting audio data for different audio components in response to the secondary packet identifiers.

[083] Isso pode proporcionar maior flexibilidade e funcionalidade. Por exemplo, pode possibilitar acesso e seleção eficiente de fluxos (streams) de dados audiovisuais individuais. Os identificadores de pacote primário e secundário podem, em algumas modalidades, ser incluídos em uma estrutura de dados estruturada ou aninhada ou podem, em outras modalidades, por exemplo, ser fornecidos em uma estrutura plana, onde, por exemplo, os identificadores de pacote primário e secundário são fornecidos como entradas sequenciais em uma única lista.[083] This can provide greater flexibility and functionality. For example, it can enable efficient access and selection of individual audiovisual data streams. The primary and secondary package identifiers may, in some embodiments, be included in a structured or nested data structure or may, in other embodiments, for example, be provided in a flat structure, where, for example, the primary package identifiers and secondary are provided as sequential entries in a single list.

[084] Um aparelho para gerar um fluxo de dados do item de conteúdo audiovisual compreendendo uma pluralidade de fluxos (streams) de dados individuais, sendo que a pluralidade de fluxos (streams) de dados audiovisuais individuais compreende componentes audiovisuais para um item de conteúdo audiovisual; sendo que cada fluxo de dados audiovisuais compreende dados codificados representando ao menos um componente audiovisual e dados de sincronização; pode compreender: um gerador para gerar um primeiro fluxo de dados audiovisuais compreendendo primeiros dados de áudio para uma representação de áudio para o item de conteúdo audiovisual, sendo que os primeiros dados de áudio compreendem dados de áudio obrigatórios para a representação de áudio e dados de áudio substituíveis para a representação de áudio, sendo que os dados de áudio substituíveis são dados substituíveis por dados de áudio alternativos; e um combinador para incluir o primeiro fluxo de dados audiovisuais no fluxo de dados do item de conteúdo audiovisual.[084] An apparatus for generating an audiovisual content item data stream comprising a plurality of individual data streams, wherein the plurality of individual audiovisual data streams comprises audiovisual components for an audiovisual content item ; wherein each audiovisual data stream comprises encoded data representing at least one audiovisual component and synchronization data; may comprise: a generator for generating a first audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, the first audio data comprising audio data required for the audio representation and audio data substitutable audio for the audio representation, wherein substitutable audio data is data substitutable with alternative audio data; and a combiner for including the first audiovisual data stream in the audiovisual content item data stream.

[085] De acordo com uma característica opcional da invenção, o descritor de processamento de dados de áudio é indicativo do segundo dado de áudio substituir ou não os dados substituíveis.[085] According to an optional feature of the invention, the audio data processing descriptor is indicative of whether or not the second audio data replaces the replaceable data.

[086] Isso pode proporcionar uma implementação particularmente vantajosa e eficiente em muitas modalidades, ao mesmo tempo em que possibilita um alto grau de flexibilidade e controle no processamento de dados de áudio de um fluxo de dados do item de conteúdo audiovisual.[086] This can provide a particularly advantageous and efficient implementation in many embodiments, while also enabling a high degree of flexibility and control in processing audio data from an audiovisual content item data stream.

[087] A abordagem pode proporcionar, em particular, uma interface eficiente entre um receptor e um decodificador de áudio. Em muitas modalidades e cenários, pode possibilitar que decodificadores de áudio genéricos sejam usados ao mesmo tempo em que proporcionam flexibilidade em renderização de áudio e sem exigir que sejam implementadas funções de controle complexas e/ou proprietárias entre o receptor e o decodificador de áudio.[087] The approach can provide, in particular, an efficient interface between a receiver and an audio decoder. In many embodiments and scenarios, it can enable generic audio decoders to be used while providing flexibility in audio rendering and without requiring complex and/or proprietary control functions to be implemented between the receiver and the audio decoder.

[088] De acordo com uma característica opcional da invenção, o descritor de processamento de dados de áudio é indicativo do segundo dado de áudio substituir ou não os dados substituíveis.[088] According to an optional feature of the invention, the audio data processing descriptor is indicative of whether or not the second audio data replaces the replaceable data.

[089] Isso pode proporcionar uma implementação particularmente vantajosa e eficiente em muitas modalidades, ao mesmo tempo em que possibilita um alto grau de flexibilidade e controle no processamento de dados de áudio de um fluxo de dados do item de conteúdo audiovisual.[089] This can provide a particularly advantageous and efficient implementation in many embodiments, while enabling a high degree of flexibility and control in processing audio data from an audiovisual content item data stream.

[090] De acordo com uma característica opcional da invenção, o descritor de processamento de dados de áudio é indicativo do segundo dado de áudio ser dado de áudio alternativo designado ou dado de áudio adicional, e o decodificador de áudio é disposto de modo a recuperar o segundo dado de áudio como dado de áudio alternativo se o primeiro descritor de processamento de dado de áudio indicar que o segundo dado de áudio é designado como dado de áudio alternativo e para recuperar o segundo dado de áudio como dado de áudio adicional se o primeiro descritor de processamento de dado indicar que o segundo dado de áudio é designado como dado de áudio adicional; e substituir o dado de áudio substituível pelo segundo dado de áudio se o segundo dado de áudio for designado como dado de áudio substituível, e a saída é disposta para gerar o sinal de áudio por meio da combinação dos dados de áudio obrigatórios, do segundo dado de áudio e do dado de áudio substituível, se o primeiro descritor de processamento de dado de áudio indicar que o segundo dado de áudio é designado como dado de áudio adicional.[090] According to an optional feature of the invention, the audio data processing descriptor is indicative of whether the second audio data is designated alternative audio data or additional audio data, and the audio decoder is arranged so as to recover the second audio data as alternate audio data if the first audio data processing descriptor indicates that the second audio data is designated as alternate audio data and to retrieve the second audio data as additional audio data if the first data processing descriptor indicates that the second audio data is designated as additional audio data; and replacing the substitutable audio data with the second audio data if the second audio data is designated as substitutable audio data, and the output is arranged to generate the audio signal by combining the required audio data, the second data audio data and replaceable audio data, if the first audio data processing descriptor indicates that the second audio data is designated as additional audio data.

[091] Isso pode proporcionar uma abordagem particularmente vantajosa e eficiente para controlar a adaptação da renderização de áudio.[091] This can provide a particularly advantageous and efficient approach to controlling audio rendering adaptation.

[092] De acordo com uma característica opcional da invenção, o receptor é disposto de modo a gerar o primeiro descritor de processamento de dados de áudio a partir de um segundo descritor de processamento de dados de áudio recebido no fluxo de dados do item de conteúdo audiovisual.[092] According to an optional feature of the invention, the receiver is arranged to generate the first audio data processing descriptor from a second audio data processing descriptor received in the data stream of the content item audio-visual.

[093] Isso pode possibilitar que tanto o provedor do fluxo de dados do item de conteúdo audiovisual quanto o renderizador ou usuário local controlem o áudio gerado. O segundo descritor de processamento de dados de áudio pode descrever saída de áudio adequada que pode ser usada, por exemplo, pelo usuário para determinar uma renderização adequada.[093] This may enable both the data stream provider of the audiovisual content item and the local renderer or user to control the generated audio. The second audio data processing descriptor may describe suitable audio output that can be used, for example, by the user to determine suitable rendering.

[094] A abordagem pode também facilitar a implementação. Por exemplo, o receptor não precisa ter qualquer conhecimento ou consideração detalhada de como o processamento de áudio específico é executado, mas, ao invés disso, pode simplesmente basear o primeiro descritor de processamento de dados de áudio no segundo descritor de processamento de dados de áudio.[094] The approach can also facilitate implementation. For example, the receiver need not have any detailed knowledge or consideration of how specific audio processing is performed, but instead may simply base the first audio data processing descriptor on the second audio data processing descriptor. .

[095] De acordo com uma característica opcional da invenção, o receptor é disposto de modo a copiar o segundo descritor de processamento de dados de áudio para o segundo fluxo de dados audiovisuais.[095] According to an optional feature of the invention, the receiver is arranged to copy the second audio data processing descriptor to the second audiovisual data stream.

[096] A abordagem pode também facilitar a implementação. Por exemplo, o receptor não precisa ter qualquer conhecimento ou consideração detalhada de como o processamento de áudio específico é executado, mas, ao invés disso, pode simplesmente copiar o segundo descritor de processamento de dados de áudio.[096] The approach can also facilitate implementation. For example, the receiver does not need to have any detailed knowledge or consideration of how specific audio processing is performed, but instead can simply copy the second audio data processing descriptor.

[097] De acordo com uma característica opcional da invenção, o segundo descritor de processamento de dados de áudio está compreendido na tabela de mapa de itens de conteúdo.[097] According to an optional feature of the invention, the second audio data processing descriptor is comprised in the content item map table.

[098] Isso pode proporcionar uma representação particularmente vantajosa.[098] This can provide a particularly advantageous representation.

[099] De acordo com uma característica opcional da invenção, o fluxo de dados do item de conteúdo audiovisual compreende uma pluralidade de possíveis descritores de processamento de dados de áudio para o segundo dado de áudio; e pelo receptor ser disposto de modo a selecionar o primeiro descritor de processamento de dados de áudio a partir da pluralidade de possíveis descritores de processamento de dados de áudio.[099] According to an optional feature of the invention, the data stream of the audiovisual content item comprises a plurality of possible audio data processing descriptors for the second audio data; and by the receiver being arranged to select the first audio data processing descriptor from the plurality of possible audio data processing descriptors.

[0100] Isso pode possibilitar que tanto o provedor do fluxo de dados do item de conteúdo audiovisual quanto o renderizador ou usuário local controlem o áudio gerado. O segundo descritor de processamento de dados de áudio pode, por exemplo, descrever combinações permitidas ou recomendadas dos componentes de áudio fornecidos, proporcionando, dessa maneira, apresentações de áudio alternativas para o item de conteúdo. Um usuário pode simplesmente selecionar uma apresentação de áudio alternativa sugerida e o receptor pode, em resposta, fazer com que a apresentação de áudio selecionada seja fornecida simplesmente por meio de cópia do segundo descritor de processamento de dado de áudio correspondente e inclusão no fluxo de dados fornecido ao decodificador de áudio.[0100] This may enable both the data stream provider of the audiovisual content item and the local renderer or user to control the generated audio. The second audio data processing descriptor may, for example, describe permitted or recommended combinations of the provided audio components, thereby providing alternative audio presentations for the content item. A user may simply select a suggested alternative audio presentation and the receiver may, in response, cause the selected audio presentation to be provided simply by copying the corresponding second audio data processing descriptor and including it in the data stream. supplied to the audio decoder.

[0101] Esses e outros aspectos, recursos e vantagens da invenção ficarão evidentes e serão elucidados com referência à(s) modalidade(s) descrita(s) doravante.[0101] These and other aspects, features and advantages of the invention will become evident and will be elucidated with reference to the embodiment(s) described hereinafter.

BRIEF DESCRIPTION OF THE DRAWINGS

[0102] As modalidades da invenção serão descritas, somente a título de exemplo, com referência aos desenhos, nos quais:[0102] Embodiments of the invention will be described, by way of example only, with reference to the drawings, in which:

[0103] a Figura 1 é uma ilustração de um fluxo de transporte, de acordo com a técnica anterior;[0103] Figure 1 is an illustration of a transport flow, according to the prior art;

[0104] a Figura 2 é uma ilustração de um fluxo de transporte, de acordo com algumas modalidades da invenção;[0104] Figure 2 is an illustration of a transport flow, according to some embodiments of the invention;

[0105] a Figura 3 é uma ilustração de um aparelho para gerar um fluxo de transporte;[0105] Figure 3 is an illustration of an apparatus for generating a transport flow;

[0106] a Figura 4 é uma ilustração de um aparelho para gerar um fluxo de transporte;[0106] Figure 4 is an illustration of an apparatus for generating a transport flow;

[0107] a Figura 5 é uma ilustração de um fluxo de transporte, de acordo com algumas modalidades da invenção;[0107] Figure 5 is an illustration of a transport flow, according to some embodiments of the invention;

[0108] a Figura 6 é uma ilustração de um fluxo de transporte, de acordo com algumas modalidades da invenção;[0108] Figure 6 is an illustration of a transport flow, according to some embodiments of the invention;

[0109] a Figura 7 ilustra a sintaxe de um descritor de áudio suplementar de um Fluxo (stream) de Transporte MPEG-2;[0109] Figure 7 illustrates the syntax of a supplementary audio descriptor of an MPEG-2 Transport Stream;

[0110] a Figura 8 ilustra a sintaxe dos itens de dados mix_type e editorial_classification de um Fluxo (stream) de Transporte MPEG-2;[0110] Figure 8 illustrates the syntax of the mix_type and editorial_classification data items of an MPEG-2 Transport stream;

[0111] a Figura 9 ilustra uma sintaxe modificada de um item de dados mix_type, de acordo com algumas modalidades da invenção;[0111] Figure 9 illustrates a modified syntax of a mix_type data item, in accordance with some embodiments of the invention;

[0112] a Figura 10 ilustra uma sintaxe modificada de um item de dados editorial_classification, de acordo com algumas modalidades da invenção;[0112] Figure 10 illustrates a modified syntax of an editorial_classification data item, in accordance with some embodiments of the invention;

[0113] a Figura 11 ilustra uma sintaxe de um item de dado de componente descritor AAC, de acordo com algumas modalidades da invenção;[0113] Figure 11 illustrates a syntax of an AAC descriptor component data item, in accordance with some embodiments of the invention;

[0114] a Figura 12 ilustra uma identificação de um objeto em um cabeçalho de carga útil de áudio;[0114] Figure 12 illustrates an identification of an object in an audio payload header;

[0115] a Figura 13 ilustra um exemplo de uma sintaxe de um descritor de objeto para possibilitar que um objeto delegue seu conteúdo a um objeto SAOC;[0115] Figure 13 illustrates an example of an object descriptor syntax to enable an object to delegate its content to a SAOC object;

[0116] a Figura 14 ilustra um exemplo de um aparelho de recepção que compreende um receptor acoplado a um decodificador de áudio, sendo que o receptor recebe o fluxo de dados do item de conteúdo audiovisual;[0116] Figure 14 illustrates an example of a reception apparatus comprising a receiver coupled to an audio decoder, the receiver receiving the data stream of the audiovisual content item;

[0117] a Figura 15 ilustra um exemplo de uma operação que usa processamento de dados de áudio para um fluxo de transporte MPEG (modificado);[0117] Figure 15 illustrates an example of an operation that uses audio data processing for an MPEG (modified) transport stream;

[0118] a Figura 16 ilustra um outro exemplo de uma operação que usa processamento de áudio para um fluxo de transporte MPEG (modificado);[0118] Figure 16 illustrates another example of an operation that uses audio processing for a (modified) MPEG transport stream;

DETAILED DESCRIPTION OF SOME EMBODIMENTS OF THE INVENTION

[0119] A descrição a seguir foca em modalidades da invenção aplicáveis ao aprimoramento de fluxos de transporte para conteúdo audiovisual, como por exemplo, um Fluxo (stream) de Transporte MPEG-2. Entretanto, deve-se compreender que a invenção não se limita a essa aplicação, mas que a mesma pode ser aplicada a muitos outros fluxos de dados de item de conteúdo audiovisual.[0119] The following description focuses on embodiments of the invention applicable to enhancing transport streams for audiovisual content, such as an MPEG-2 Transport Stream. However, it should be understood that the invention is not limited to this application, but that it can be applied to many other audiovisual content item data streams.

[0120] Como uma referência específica, um exemplo de um Fluxo (stream) de Transporte (TS) MPEG DVB (Digital Video Broadcast), conforme definido em ISO/IEC 13818-1 estendido com conteúdo DVB padrão, como em EN 300468, é ilustrado na Figura 1. Deve-se considerar que, embora a descrição foque em modalidades que podem, por exemplo, melhorar tal fluxo de dados do item de conteúdo audiovisual, a abordagem pode ser aplicada a muitas outras tecnologias de transporte, incluindo, por exemplo, fluxos de transporte baseados em TCP/IP no contexto de ISO/IEC 23009-1 DASH (Dynamic Adaptive Streaming over HTTP).[0120] As a specific reference, an example of an MPEG DVB (Digital Video Broadcast) Transport (TS) stream as defined in ISO/IEC 13818-1 extended with standard DVB content, as in EN 300468, is illustrated in Figure 1. It should be considered that although the description focuses on embodiments that can, for example, improve such audiovisual content item data flow, the approach can be applied to many other transport technologies, including, e.g. , TCP/IP-based transport streams in the context of ISO/IEC 23009-1 DASH (Dynamic Adaptive Streaming over HTTP).

[0121] No exemplo, um fluxo de transporte é constituído de uma pluralidade de pacotes de dados. Os dados do fluxo de transporte são divididos em uma pluralidade de fluxos elementares que correspondem a um dado de componente audiovisual, controle ou informação (metadado). Cada um dos fluxos elementares é associado a uma dada identidade, e cada pacote compreende um cabeçalho que inclui um Packet IDentifier (PID) que identifica o fluxo elementar para o qual o pacote compreende dados.[0121] In the example, a transport stream is made up of a plurality of data packets. The transport stream data is divided into a plurality of elementary streams that correspond to an audiovisual component data, control or information (metadata). Each of the elementary streams is associated with a given identity, and each packet comprises a header that includes a Packet IDentifier (PID) that identifies the elementary stream for which the packet comprises data.

[0122] No exemplo específico, o fluxo de transporte é um fluxo de pacotes multiplexado no tempo com cada pacote contendo 188 bytes. Cada pacote é rotulado por um PID. Um pacote pode conter metadados ou dados audiovisuais comprimidos. Pacotes com um dado PID representam dados sequenciais que precisam ser unidos para criar um único componente audiovisual. Por exemplo, para transportar um componente audiovisual no fluxo de transporte, os dados para o componente audiovisual são divididos pelas cargas úteis de um grupo de pacotes de dados. Os pacotes de dados daquele grupo e apenas daquele grupo, usarão então o mesmo PID único.[0122] In the specific example, the transport stream is a time-multiplexed stream of packets with each packet containing 188 bytes. Each packet is labeled by a PID. A package may contain metadata or compressed audiovisual data. Packets with a given PID represent sequential data that needs to be joined together to create a single audiovisual component. For example, to transport an audiovisual component in the transport stream, the data for the audiovisual component is divided by the payloads of a group of data packets. Data packets from that group, and only from that group, will then use the same unique PID.

[0123] O fluxo de transporte compreende adicionalmente uma Tabela de Associação de Programa (PAT - Program Association Table) que fornece informações dos programas que estão incluídos no fluxo de transporte específico. Cada programa é caracterizado por uma Tabela de Mapa de Programa (PMT - Program Map Table) que compreende informações sobre os programas individuais. Especificamente, o PMT identifica os fluxos elementares compreendidos no fluxo de transporte para o programa individual e, em particular, lista os PIDs para os pacotes de dados que pertencem aos diferentes fluxos elementares para o programa individual.[0123] The transport stream additionally comprises a Program Association Table (PAT) that provides information about the programs that are included in the specific transport stream. Each program is characterized by a Program Map Table (PMT) that comprises information about the individual programs. Specifically, the PMT identifies the elementary streams comprised in the transport stream for the individual program and, in particular, lists the PIDs for the data packets that belong to the different elementary streams for the individual program.

[0124] A Figura 1 ilustra um exemplo de como fluxos elementares de áudio para um programa podem ser fornecidos no fluxo de transporte. No exemplo, três componentes de áudio são fornecidos para o programa. Os componentes de áudio podem ser renderizados junto com um componente de vídeo do fluxo de transporte (não mostrado na Figura 1). Cada um dos componentes de áudio corresponde a uma representação completa da plataforma de som de áudio do item de conteúdo, isto é, cada fluxo elementar fornece os dados completos de plataforma de som de áudio necessários para renderizar (o termo plataforma de som de áudio refere- se ao áudio de todo o item de conteúdo renderizado e não é limitado, por exemplo, a uma cena de áudio específica).[0124] Figure 1 illustrates an example of how elementary audio streams for a program can be provided in the transport stream. In the example, three audio components are provided to the program. Audio components can be rendered alongside a video component of the transport stream (not shown in Figure 1). Each of the audio components corresponds to a complete representation of the content item's audio sound platform, that is, each elementary stream provides the complete audio sound platform data needed to render (the term audio sound platform refers to - is to the audio of the entire rendered content item and is not limited to, for example, a specific audio scene).

[0125] Cada um dos fluxos elementares fornece um único componente de áudio integrado que precisa ser renderizado completamente. Dessa forma, se um fluxo elementar for selecionado para renderização, o renderizador codificará todos os dados de áudio do fluxo elementar para gerar o componente de áudio único do fluxo elementar. Esse componente de áudio é, então, renderizado (possivelmente em alguns casos, após ser mixado com áudio de um outro fluxo).[0125] Each of the elementary streams provides a single integrated audio component that needs to be fully rendered. This way, if an elementary stream is selected for rendering, the renderer encodes all audio data from the elementary stream to generate the single audio component of the elementary stream. This audio component is then rendered (possibly in some cases after being mixed with audio from another stream).

[0126] Cada um dos componentes de áudio é fornecido em um fluxo elementar separado identificado por um PID separado. Os dados de áudio para cada representação de áudio são fornecidos em uma série de pacotes de dados (referidos como PR1p1, PR1p2 PR2p1, PR2p2 PR3p1, PR3p2 etc., sendo que cada pacote tem sua própria identificação p1, p2.. e cada grupo de pacotes recebe a identificação da apresentação de áudio à qual ele pertence “PR”x). Dessa forma, cada um dos componentes de áudio é representado no fluxo de transporte por pacotes de dados que compreendem os dados de áudio codificados para o componente de áudio correspondente à representação de áudio completa. Cada representação de áudio é fornecida como um componente de áudio simples em um fluxo elementar individual e, sendo assim, cada representação de áudio é associada a um PID separado. No exemplo da Figura 1, as representações de áudio são associadas respectivamente a PID 1, PID 2 e PID 3.[0126] Each of the audio components is provided in a separate elementary stream identified by a separate PID. The audio data for each audio representation is provided in a series of data packets (referred to as PR1p1, PR1p2 PR2p1, PR2p2 PR3p1, PR3p2 etc., with each packet having its own identification p1, p2.. and each group of packets receives the identification of the audio presentation to which it belongs “PR”x). In this way, each of the audio components is represented in the transport stream by data packets comprising the audio data encoded for the audio component corresponding to the complete audio representation. Each audio representation is provided as a single audio component in an individual elementary stream, and as such, each audio representation is associated with a separate PID. In the example in Figure 1, the audio representations are associated respectively with PID 1, PID 2 and PID 3.

[0127] Conforme ilustrado na Figura 1, os pacotes de dados são multiplexados no tempo no fluxo de transporte. Um receptor pode receber os pacotes de dados, extrair os dados de áudio de cada pacote de dados associado a um PID específico, decodificar os dados de áudio e, dessa forma, recriar o componente/representação de áudio individual correspondente àquele fluxo elementar.[0127] As illustrated in Figure 1, data packets are time multiplexed in the transport stream. A receiver can receive the data packets, extract the audio data from each data packet associated with a specific PID, decode the audio data, and thereby recreate the individual audio component/representation corresponding to that elementary stream.

[0128] Para possibilitar que o receptor sincronize os dados de áudio oriundos de diferentes pacotes de dados e sincronize o componente de áudio resultante, por exemplo, com o fluxo de vídeo associado, cada pacote de dados compreende dados de temporização ou sincronização do segmento de áudio representado pelos dados de áudio do pacote de dados.[0128] To enable the receiver to synchronize audio data originating from different data packets and synchronize the resulting audio component, for example, with the associated video stream, each data packet comprises timing or synchronization data from the audio segment. audio represented by the audio data of the data packet.

[0129] Uma vantagem de fornecer uma pluralidade de fluxos elementares de áudio reside em ser possível fornecer um áudio mais flexível. Por exemplo, a Figura 1 ilustra um exemplo no qual são fornecidos três fluxos elementares de áudio. Cada um dos fluxos elementares fornece uma representação completa da cena de áudio incluindo, por exemplo, dados de fundo, música, diálogo etc. A representação completa é fornecida por um único componente de áudio. Entretanto, os três fluxos elementares fornecem diferentes representações, por exemplo, os três fluxos elementares podem corresponder à mesma sequência de vídeo, mas com áudio em três idiomas diferentes. Por exemplo, PID 1 pode representar a cena de áudio original com diálogo no idioma original, por exemplo, inglês, enquanto que PID 2 e PID 3 podem representar a cena de áudio, mas com o diálogo dublado em, por exemplo, francês e alemão, respectivamente. PMT pode fornecer dados que indiquem o idioma associado a cada fluxo elementar individual. Consequentemente, um usuário pode selecionar um idioma preferencial e o receptor pode, por conseguinte, selecionar o fluxo elementar correspondente. Dessa forma, o receptor extrai os dados de áudio de todos os pacotes com o PID correspondente e então, gera o sinal de saída de áudio a partir desses dados de áudio. Por exemplo, um usuário pode indicar uma preferência pelo diálogo em Francês e, por conseguinte, o renderizador pode extrair dados de áudio de pacotes de fluxo elementar com PID2 e então gerar a saída de áudio deste dado de áudio.[0129] An advantage of providing a plurality of elementary audio streams is that it is possible to provide more flexible audio. For example, Figure 1 illustrates an example in which three elementary audio streams are provided. Each of the elementary streams provides a complete representation of the audio scene including, for example, background data, music, dialogue, etc. The complete representation is provided by a single audio component. However, the three elementary streams provide different representations, for example, the three elementary streams may correspond to the same video sequence, but with audio in three different languages. For example, PID 1 may represent the original audio scene with dialogue in the original language, for example, English, while PID 2 and PID 3 may represent the audio scene, but with the dialogue dubbed in, for example, French and German , respectively. PMT can provide data indicating the language associated with each individual elementary stream. Consequently, a user can select a preferred language and the receiver can therefore select the corresponding elementary stream. In this way, the receiver extracts the audio data from all packets with the corresponding PID and then generates the audio output signal from this audio data. For example, a user may indicate a preference for dialogue in French, and therefore the renderer may extract audio data from elementary stream packets with PID2 and then generate audio output from this audio data.

[0130] Consequentemente, podem ser fornecidos múltiplos fluxos alternativos, sendo que cada fluxo elementar fornece um único componente de áudio que fornece uma representação completa do áudio para o item de conteúdo (isto é, com o áudio para o programa). Então, um receptor pode selecionar entre fluxos individuais. Dessa forma, em fluxos de transporte convencionais para broadcasts de áudio, cada idioma alternativo é fornecido como uma representação de áudio completa e independente dada por um único componente de áudio em um único fluxo elementar. O receptor pode apenas selecionar entre os diferentes fluxos disponíveis e, uma vez que um fluxo seja selecionado, todo o áudio daquele fluxo é renderizado.[0130] Consequently, multiple alternative streams may be provided, with each elementary stream providing a single audio component that provides a complete representation of the audio for the content item (i.e., with the audio for the program). Then, a receiver can select between individual streams. Thus, in conventional transport streams for audio broadcasts, each alternative language is provided as a complete and independent audio representation given by a single audio component in a single elementary stream. The receiver can just select between the different available streams and once a stream is selected, all the audio from that stream is rendered.

[0131] Entretanto, essa abordagem resulta em um baixo grau de flexibilidade, já que apenas um único componente de áudio correspondente à plataforma de áudio completa que está disponível para ser renderizada no receptor. Adicionalmente, resulta em uma alta taxa de dados dos fluxos de dados, já que são fornecidas representações de áudio completas.[0131] However, this approach results in a low degree of flexibility, as only a single audio component corresponding to the complete audio platform is available to be rendered at the receiver. Additionally, it results in a high data rate of data streams as complete audio representations are provided.

[0132] Os Fluxos (stream) de Transporte MPEG-2 possibilitam que sejam definidos componentes de áudio suplementares de modo a fornecer áudio de Descrição de Áudio adicional (áudio adicional que fornece comentários descritivos para usuários portadores de deficiência visual). Tais componentes de áudio suplementares não podem ser renderizados por si só, mas podem ser adicionados a um componente de áudio de representação completa de um outro fluxo elementar.[0132] MPEG-2 Transport Streams enable supplementary audio components to be defined to provide additional Audio Description audio (additional audio that provides descriptive commentary for visually impaired users). Such supplementary audio components cannot be rendered by themselves, but can be added to a full representation audio component of another elementary stream.

[0133] Dessa forma, fluxos elementares de áudio de Fluxo (stream) de Transporte MPEG-2 tradicional podem ser um dentre dois tipos. O primeiro tipo é o tipo mais comum, onde um único componente de áudio fornece uma representação completa de áudio para o item de conteúdo. Esse áudio pode ser renderizado diretamente e é chamado áudio “broadcast mixado”. O segundo tipo fornece apenas um único componente com áudio suplementar que precisa ser adicionado (mixado com) um componente de áudio do primeiro tipo. Dessa forma, o segundo tipo de dado elementar fornece dados adicionais que podem ser adicionados a uma representação de áudio completa. Isso é chamado de áudio “receptor mixado”.[0133] In this way, traditional MPEG-2 Transport stream elementary audio streams can be one of two types. The first type is the most common type, where a single audio component provides a complete audio representation for the content item. This audio can be rendered directly and is called “mixed broadcast” audio. The second type provides only a single component with supplemental audio that needs to be added to (mixed with) an audio component of the first type. In this way, the second elementary data type provides additional data that can be added to a complete audio representation. This is called “receiver mixed” audio.

[0134] Para ser capaz de decodificar um fluxo de transporte recebido, o fluxo de transporte inclui informações que definem os dados contidos no fluxo de transporte. Em mais detalhes, as informações sobre os programas compreendidos no fluxo são indicadas em PAT. Para cada programa, o número e os tipos de componentes/trilhas de áudio é tornado conhecido do receptor (por exemplo, um Decodificador de Fluxo de Transporte DVB) através da sinalização em PMT. A informação PMT é baseada em PID e compreende especificamente um enlace de estrutura de dados que contém toda a sinalização requerida por PID. Para cada PID, pode haver especificamente um descritor de idioma e um descritor específico codec. O descritor de idioma pode ser um descritor ISO 639 Language ou um descritor Supplementary Audio. Uma descrição de áudio suplementar fornece uma diferenciação nítida entre os sinais de áudio broadcast e de receptor mixados. A descrição de áudio específica codec fornece informações sobre o conteúdo do fluxo elementar empacotado do PID dado. Essa informação é principalmente sobre se o componente é um componente multicanal ou estéreo.[0134] To be able to decode a received transport stream, the transport stream includes information that defines the data contained in the transport stream. In more detail, information about the programs included in the stream is indicated in PAT. For each program, the number and types of audio components/tracks are made known to the receiver (e.g., a DVB Stream Decoder) through PMT signaling. PMT information is based on PID and specifically comprises a data structure link that contains all signaling required by PID. For each PID, there can be specifically a language descriptor and a codec specific descriptor. The language descriptor can be an ISO 639 Language descriptor or a Supplementary Audio descriptor. A supplemental audio description provides a clear differentiation between the mixed broadcast and receiver audio signals. The codec-specific audio description provides information about the contents of the packetized elementary stream of the given PID. This information is mainly about whether the component is a multichannel or stereo component.

[0135] Dessa forma, na abordagem atual, cada fluxo elementar fornece uma representação de áudio separada para o item de conteúdo, exceto pelos fluxos elementares indicados serem mixados pelo receptor. Esses não fornecem uma apresentação de áudio, mas, ao invés disso, fornecem um sinal de áudio que precisa ser adicionado a um sinal de áudio broadcast mixado.[0135] Thus, in the current approach, each elementary stream provides a separate audio representation for the content item, except that the indicated elementary streams are mixed by the receiver. These do not provide an audio presentation, but instead provide an audio signal that needs to be added to a mixed broadcast audio signal.

[0136] A seguir, será descrita uma abordagem que fornece um fluxo de transporte mais flexível e eficiente. A descrição irá focar em um exemplo onde é fornecida uma pluralidade de idiomas dentro do fluxo de transporte, mas deve-se considerar que a abordagem pode ser usada com outros tipos de áudio também.[0136] Next, an approach that provides a more flexible and efficient transport flow will be described. The description will focus on an example where a plurality of languages are provided within the transport stream, but it should be considered that the approach can be used with other types of audio as well.

[0137] A Figura 2 ilustra um exemplo de um fluxo de transporte modificado. Similar à abordagem da Figura 1, o fluxo de transporte da Figura 2 compreende uma pluralidade de fluxos elementares de áudio. Entretanto, ao contrário da técnica anterior, os fluxos elementares não estão limitados a representações de áudio completas ou a dados de áudio suplementares e não estão limitados a componentes de áudio simples. Ao invés disso, um fluxo elementar pode compreender diferentes tipos de dados de áudio e, especificamente, pode compreender tanto um dado que seja obrigatório para a representação de áudio quanto dados de áudio substituíveis.[0137] Figure 2 illustrates an example of a modified transport flow. Similar to the approach of Figure 1, the transport stream of Figure 2 comprises a plurality of elementary audio streams. However, unlike the prior art, elementary streams are not limited to complete audio representations or supplementary audio data and are not limited to simple audio components. Instead, an elementary stream may comprise different types of audio data and, specifically, may comprise both data that is mandatory for the audio representation and replaceable audio data.

[0138] Especificamente, o fluxo de transporte pode incluir dados que definem/designam/descrevem uma ou mais representações de áudio. Um primeiro fluxo elementar pode ser associado a uma representação de áudio para o item de conteúdo audiovisual representado pelo fluxo de transporte. Esse primeiro fluxo elementar compreende dados de áudio obrigatórios para a representação de áudio, assim como dados de áudio substituíveis para a representação de áudio. Os dados de áudio obrigatórios correspondem a um componente de áudio obrigatório que precisa ser renderizado quando a representação de áudio do fluxo elementar é renderizada. Por outro lado, os dados substituíveis podem ser substituídos por áudio alternativo para o item de conteúdo audiovisual. Assim, o primeiro fluxo elementar compreende tanto um componente de áudio obrigatório quanto um componente de áudio substituível para representação de áudio, sendo que o componente de áudio substituível pode ser substituído por um outro componente de áudio.[0138] Specifically, the transport stream may include data that defines/designates/describes one or more audio representations. A first elementary stream may be associated with an audio representation for the audiovisual content item represented by the transport stream. This first elementary stream comprises audio data mandatory for the audio representation, as well as substitutable audio data for the audio representation. Mandatory audio data corresponds to a mandatory audio component that needs to be rendered when the audio representation of the elementary stream is rendered. Conversely, replaceable data can be replaced with alternative audio for the audiovisual content item. Thus, the first elementary stream comprises both a mandatory audio component and a replaceable audio component for audio representation, with the replaceable audio component being replaceable by another audio component.

[0139] O primeiro fluxo elementar/fluxo de dados audiovisuais pode, consequentemente, compreender uma pluralidade de de componentes de áudio ou objetos, sendo que um componente/objeto de áudio é representado pelos dados de áudio obrigatórios. Esse componente de áudio é obrigatório e precisa sempre ser renderizado quando a representação de áudio específica (associada ao primeiro fluxo de dados audiovisuais) é selecionada, e, dessa forma, quando o primeiro fluxo elementar é selecionado para renderização.[0139] The first elementary audiovisual data stream may therefore comprise a plurality of audio components or objects, with an audio component/object being represented by the required audio data. This audio component is mandatory and must always be rendered when the specific audio representation (associated with the first audiovisual data stream) is selected, and thus when the first elementary stream is selected for rendering.

[0140] Um outro componente de áudio é representado por dados de áudio substituíveis. Esse componente de áudio substituível, consequentemente, não é obrigatório para a representação, mas pode ser substituído por um componente de áudio alternativo. Entretanto, o componente de áudio substituível não pode simplesmente ser apagado ou descartado enquanto fornece apresentação de áudio, mas, ao invés disso, pode ser substituído por um componente de áudio alternativo. O componente de áudio substituível pode corresponder a uma fonte de áudio necessária para a representação de áudio, mas com diferentes versões da fonte de áudio sendo incluídas no fluxo de transporte.[0140] Another audio component is represented by replaceable audio data. This replaceable audio component is consequently not mandatory for representation, but may be replaced by an alternative audio component. However, the replaceable audio component cannot simply be erased or discarded while providing audio presentation, but can instead be replaced with an alternative audio component. The replaceable audio component may correspond to an audio source required for the audio representation, but with different versions of the audio source being included in the transport stream.

[0141] Em muitas modalidades, o fluxo de transporte pode fornecer uma representação padrão do item de conteúdo audiovisual quando o componente de áudio obrigatório, representado pelos dados de áudio obrigatórios, e o componente de áudio substituível, representado pelos dados de áudio substituíveis, juntos, fornecem uma representação de áudio padrão para o item de conteúdo (possivelmente junto com outros componentes de áudio ou dados). Dessa forma, os dados de áudio substituíveis correspondem, geralmente, a um componente de áudio padrão. Quando da renderização da representação de áudio, o receptor, consequentemente, como padrão, selecionará os dados de áudio obrigatórios e os dados de áudio substituíveis. Consequentemente, o receptor pode decodificar o componente de áudio obrigatório e o componente de áudio substituível, mixar os componentes e renderizar o áudio resultante. Isso resultará na renderização pelo receptor da versão padrão da representação de áudio do item de conteúdo.[0141] In many embodiments, the transport stream may provide a standard representation of the audiovisual content item when the mandatory audio component, represented by the mandatory audio data, and the replaceable audio component, represented by the replaceable audio data, together , provide a standard audio representation for the content item (possibly along with other audio or data components). In this way, the replaceable audio data generally corresponds to a standard audio component. When rendering the audio representation, the receiver will therefore, by default, select mandatory audio data and replaceable audio data. Consequently, the receiver can decode the mandatory audio component and the replaceable audio component, mix the components, and render the resulting audio. This will result in the receiver rendering the default version of the audio representation of the content item.

[0142] Entretanto, o fluxo de transporte pode compreender, ao mesmo tempo, dados para áudio alternativo. Entretanto, esse áudio alternativo não precisa ser fornecido como representações de áudio alternativo completas em fluxos elementares separados fornecendo uma representação de áudio completa. Ao invés disso, é fornecido dado de áudio alternativo que pode simplesmente definir um componente de áudio alternativo que pode substituir o componente de áudio substituível do primeiro fluxo elementar. Dessa forma, o fluxo de transporte pode compreender dados de áudio alternativos que podem substituir parte dos dados de áudio substituíveis do primeiro fluxo elementar.[0142] However, the transport stream may comprise, at the same time, data for alternative audio. However, this alternate audio need not be provided as complete alternate audio representations in separate elementary streams providing a complete audio representation. Instead, alternative audio data is provided that may simply define an alternative audio component that can replace the replaceable audio component of the first elementary stream. In this way, the transport stream may comprise alternative audio data that may replace part of the substitutable audio data of the first elementary stream.

[0143] Dessa forma, o primeiro fluxo elementar compreende dois tipos de dados, a saber, dados de áudio obrigatórios para (ao menos) um componente de áudio obrigatório e dados de áudio substituíveis para (ao menos um) componente de áudio substituível.[0143] Thus, the first elementary stream comprises two types of data, namely, mandatory audio data for (at least) one mandatory audio component and replaceable audio data for (at least one) replaceable audio component.

[0144] Especificamente, o primeiro fluxo elementar pode compreender pacotes de dados que compreendem dados de áudio obrigatórios e pacotes de dados que compreendem os dados de áudio substituíveis. Cada pacote de dados pode compreender especificamente um dentre dados de áudio obrigatórios ou dados de áudio substituíveis, isto é, em muitas modalidades, um pacote de dados compreenderá apenas dados de áudio para um componente de áudio.[0144] Specifically, the first elementary stream may comprise data packets comprising obligatory audio data and data packets comprising replaceable audio data. Each data packet may specifically comprise one of mandatory audio data or replaceable audio data, that is, in many embodiments, a data packet will comprise only audio data for an audio component.

[0145] O componente de áudio obrigatório e o componente de áudio substituível são, dessa forma, componentes paralelos no tempo, isto é, para uma dada renderização/segmento de tempo de item de conteúdo, o primeiro fluxo elementar pode compreender tanto dados de áudio obrigatórios para um componente de áudio obrigatório, quanto dados de áudio substituíveis para um componente de áudio substituível. Entretanto, os dados de áudio obrigatórios e os dados de áudio substituíveis para o mesmo segmento de tempo são fornecidos, geralmente, em diferentes pacotes de dados que são sequenciais no tempo no primeiro fluxo elementar e no fluxo de transporte.[0145] The mandatory audio component and the replaceable audio component are thus time-parallel components, i.e., for a given content item rendering/time segment, the first elementary stream may comprise both audio data mandatory audio data for a mandatory audio component, and substitutable audio data for a substitutable audio component. However, mandatory audio data and substitutable audio data for the same time segment are generally provided in different data packets that are sequential in time in the first elementary stream and the transport stream.

[0146] De modo similar, os dados de áudio alternativos podem ser fornecidos em pacotes de dados que são sequenciais no tempo no fluxo de transporte aos pacotes de dados dos dados de áudio obrigatórios, e os dados de áudio substituíveis do primeiro fluxo elementar fornecem, ainda, dados de áudio para o mesmo segmento de tempo (renderização).[0146] Similarly, the alternative audio data may be provided in data packets that are sequential in time in the transport stream to the data packets of the mandatory audio data, and the substitutable audio data of the first elementary stream provides, also, audio data for the same time segment (rendering).

[0147] Dessa forma, a temporização de pacotes de dados e os dados no fluxo de transporte podem ser independentes (e, claramente não idênticos) da temporização do áudio correspondente nos componentes de áudio. Especificamente, para ao menos um segmento de tempo, o fluxo elementar compreende dados de áudio separados para um componente de áudio obrigatório e um componente de áudio substituível, isto é, compreende tanto dados de áudio obrigatórios, quanto dados de áudio substituíveis para o segmento de tempo.[0147] In this way, the timing of data packets and the data in the transport stream can be independent (and clearly not identical) from the timing of the corresponding audio in the audio components. Specifically, for at least one time segment, the elementary stream comprises separate audio data for a mandatory audio component and a replaceable audio component, that is, it comprises both mandatory audio data and replaceable audio data for the time segment. time.

[0148] A Figura 2 ilustra um exemplo em que se atribui PID 1 a um primeiro fluxo elementar. O primeiro fluxo elementar não apenas compreende um componente de áudio único, mas, ao invés disso, compreende dados de áudio tanto para um componente de áudio obrigatório, quanto para um componente de áudio substituível.[0148] Figure 2 illustrates an example in which PID 1 is assigned to a first elementary flow. The first elementary stream not only comprises a single audio component, but instead comprises audio data for both a mandatory audio component and a replaceable audio component.

[0149] Especificamente, o componente de áudio obrigatório pode corresponder a áudio de fundo geral (incluindo, por exemplo, música) para o item de conteúdo. Os pacotes de dados que compreendem dados de áudio obrigatórios são referidos na Figura 2 por BG1p1, BG1p2, BG1p3, BG1p4.[0149] Specifically, the required audio component may correspond to general background audio (including, for example, music) for the content item. Data packets comprising mandatory audio data are referred to in Figure 2 as BG1p1, BG1p2, BG1p3, BG1p4.

[0150] O componente de áudio substituível pode corresponder ao diálogo em um idioma padrão, por exemplo, inglês. Os pacotes de dados que compreendem dados de áudio substituíveis são referidos por AO A na Figura 2.[0150] The replaceable audio component may correspond to dialogue in a standard language, e.g., English. Data packets comprising replaceable audio data are referred to as AO A in Figure 2.

[0151] Conforme ilustrado, os dados de áudio obrigatórios e os dados de áudio substituíveis são fornecidos em pacotes de dados individuais que são multiplexados no tempo para o fluxo de transporte. No exemplo, os dados de áudio obrigatórios e os dados de áudio substituíveis são fornecidos em pacotes de dados separados, isto é, um pacote de dados do primeiro fluxo elementar compreende dados de áudio obrigatórios ou dados de áudio substituíveis. Entretanto, deve-se considerar que em algumas modalidades, um pacote de dados pode compreender tanto dados de áudio obrigatórios quanto dados de áudio substituíveis.[0151] As illustrated, the mandatory audio data and the replaceable audio data are provided in individual data packets that are time multiplexed to the transport stream. In the example, the mandatory audio data and the substitutable audio data are provided in separate data packets, that is, a data packet of the first elementary stream comprises mandatory audio data or substitutable audio data. However, it should be considered that in some embodiments, a data packet may comprise both mandatory audio data and replaceable audio data.

[0152] Um receptor que execute a renderização da representação de áudio padrão com o idioma padrão, por conseguinte, só precisa acessar o primeiro fluxo elementar, isto é, só precisa decodificar e processar os pacotes de dados com PID1. Em seguida, o mesmo pode decodificar individualmente os dados de áudio obrigatórios para gerar o componente de áudio obrigatório e os dados de áudio substituíveis para gerar o componente de áudio substituível. O sinal de áudio para o item de conteúdo pode, então, ser gerado pela mixagem do componente de áudio obrigatório e o componente de áudio substituível.[0152] A receiver that performs rendering of the standard audio representation with the standard language therefore only needs to access the first elementary stream, that is, it only needs to decode and process the data packets with PID1. Then, it may individually decode the mandatory audio data to generate the mandatory audio component and the substitutable audio data to generate the substitutable audio component. The audio signal for the content item can then be generated by mixing the required audio component and the replaceable audio component.

[0153] Entretanto, além do primeiro fluxo elementar, o fluxo de transporte compreende outros fluxos elementares que compreendem dados de áudio alternativos para os dados de áudio substituíveis, isto é, compreende dados que definem ao menos um componente de áudio alternativo que pode substituir o componente de áudio substituível.[0153] However, in addition to the first elementary stream, the transport stream comprises other elementary streams that comprise alternative audio data for the replaceable audio data, that is, it comprises data that defines at least one alternative audio component that can replace the replaceable audio component.

[0154] No exemplo da Figura 2, o fluxo de transporte compreende um segundo fluxo elementar de áudio identificado por PID 2 e um terceiro fluxo elementar de áudio identificado pelo PID 3. Consequentemente, os pacotes de dados correspondentes ao terceiro e terceiro fluxo elementar são multiplexados no tempo no fluxo de dados com os pacotes de dados para o primeiro fluxo elementar. O segundo fluxo elementar compreende pacotes de dados (chamados AO B) comprimeiros dados de áudio alternativos, e o terceiro fluxo elementar compreende pacotes de dados (chamados AO C) com segundos dados de áudio alternativos. Os primeiros dados de áudio alternativos podem ser decodificados para gerar um primeiro componente de áudio alternativo e os segundos dados de áudio alternativos podem ser decodificados para gerar um segundo componente de áudio alternativo.[0154] In the example of Figure 2, the transport stream comprises a second elementary audio stream identified by PID 2 and a third elementary audio stream identified by PID 3. Consequently, the data packets corresponding to the third and third elementary streams are time multiplexed in the data stream with the data packets for the first elementary stream. The second elementary stream comprises data packets (called AO B) with alternative first audio data, and the third elementary stream comprises data packets (called AO C) with alternative second audio data. The first alternative audio data may be decoded to generate a first alternative audio component and the second alternative audio data may be decoded to generate a second alternative audio component.

[0155] Ao invés de gerar um sinal de áudio para o item de conteúdo usando o componente de áudio substituível, um renderizador pode usar um dos componentes de áudio alternativos, isto é, a geração de áudio para o item de conteúdo pode ser baseada em um dos conjuntos de dados de áudio alternativos ao invés de ser baseado nos dados de áudio substituíveis.[0155] Instead of generating an audio signal for the content item using the replaceable audio component, a renderer may use one of the alternative audio components, that is, audio generation for the content item may be based on one of the alternative audio data sets rather than being based on the replaceable audio data.

[0156] Por exemplo, os dados de áudio substituíveis podem fornecer diálogo no idioma inglês, os primeiros dados de áudio alternativos podem fornecer diálogo em alemão e os segundos dados de áudio alternativos podem fornecer diálogo em francês. Então, um receptor, por padrão, decodificará o primeiro fluxo elementar, gerará o componente de áudio de fundo e o componente de áudio em inglês e os mixará para gerar o áudio para o item de conteúdo. Entretanto, por exemplo, em resposta a dados inseridos pelo usuário, o receptor pode substituir os dados de áudio substituíveis pelos primeiros dados de áudio alternativos, isto é, pode prosseguir para decodificar os dados de áudio obrigatórios para gerar o componente de áudio obrigatório e os primeiros dados de áudio alternativos para gerar o primeiro componente de áudio alternativo. Então, o áudio de saída pode ser gerado por meio da combinação do componente de áudio obrigatório e primeiro componente de áudio alternativo. Dessa forma, ao invés do item de conteúdo ter o diálogo em inglês, é fornecido o diálogo em alemão.[0156] For example, the substitutable audio data may provide English language dialogue, the first alternative audio data may provide German dialogue, and the second alternative audio data may provide French dialogue. So a receiver, by default, will decode the first elementary stream, generate the background audio component and the English audio component, and mix them to generate the audio for the content item. However, for example, in response to user-entered data, the receiver may replace the substitutable audio data with the first alternative audio data, that is, it may proceed to decode the required audio data to generate the required audio component and the first alternative audio data to generate the first alternative audio component. Then, the output audio can be generated by combining the mandatory audio component and first alternative audio component. This way, instead of the content item having dialogue in English, dialogue in German is provided.

[0157] A abordagem possibilita uma comunicação muito eficiente e a codificação de áudio em um fluxo de transporte. Podem ser conseguidas taxas de dados reduzidas e/ou maior flexibilidade ser fornecida. Além do mais, obtém-se processamento fácil, em termos tanto de geração quanto de processamento do fluxo de transporte.[0157] The approach enables very efficient communication and audio coding in a transport stream. Reduced data rates can be achieved and/or greater flexibility can be provided. Furthermore, easy processing is achieved, in terms of both generation and processing of the transport stream.

[0158] Notadamente, a abordagem específica pode fornecer um alto grau de compatibilidade com fluxos de transporte existentes, como o Fluxo (stream) de Transporte MPEG-2. Especificamente, é fornecida uma abordagem em que a estrutura e a organização de dados existentes podem ser mantidas e, especificamente, a mesma abordagem de fluxos elementares pode ser usada para fornecer maior flexibilidade. De fato, a abordagem minimizará (ou ao menos reduzirá) a quantidade de esforço de padronização necessária para adotar a abordagem inovadora. Além do mais, pode aumentar a retrocompatibilidade e reduzir ou mesmo minimizar as mudanças necessárias para suportar a funcionalidade adicional.[0158] Notably, the specific approach can provide a high degree of compatibility with existing transport streams, such as the MPEG-2 Transport stream. Specifically, an approach is provided in which existing data structure and organization can be maintained, and specifically the same elementary streams approach can be used to provide greater flexibility. In fact, the approach will minimize (or at least reduce) the amount of standardization effort required to adopt the innovative approach. What's more, it can increase backwards compatibility and reduce or even minimize the changes required to support additional functionality.

[0159] Especificamente, a abordagem pode usar a mesma abordagem do fluxo de transporte que compreende um PAT definindo um ou mais itens de conteúdo e fornecer, especificamente, um PID para um PMT para cada item de conteúdo. O PMT para cada item de conteúdo pode definir um PID para cada fluxo elementar associado ao item de conteúdo (dessa forma, o item de conteúdo pode ser constituído dos fluxos elementares para os quais um PID é incluído em PMT). Então, o receptor pode recuperar os dados audiovisuais para o item de conteúdo por meio da seleção dos pacotes de dados com um PID indicado em PMT. Entretanto, como o item de conteúdo pode ter trilhas de áudio alternativas, o receptor pode, por exemplo, selecionar ignorar ou extrair dados de um dado PID, dependendo desse PID compreender dados de áudio necessários ou não. Por exemplo (e com referência à Figura 2), se uma trilha de diálogo em alemão for fornecida como dado alternativo em pacotes de dados com PID 2, o receptor pode ignorar esses pacotes de dados se o diálogo em inglês de PID 1 for desejado. Dessa forma, se for desejada a cena de áudio padrão, o receptor, nesse exemplo, só precisa considerar pacotes de dados PID1 para fornecer o áudio desejado. Entretanto, ao mesmo tempo, se for preferida a trilha de áudio com diálogo em alemão alternativa, o receptor pode simplesmente extrair esses dados de áudio dos pacotes de dados de PID 2 e substituir os dados de áudio substituíveis dos pacotes de dados PID 1 por esses dados de áudio.[0159] Specifically, the approach may use the same transport flow approach comprising a PAT defining one or more content items and specifically providing a PID to a PMT for each content item. The PMT for each content item can define a PID for each elementary stream associated with the content item (in this way, the content item can be made up of the elementary streams for which a PID is included in the PMT). Then, the receiver can retrieve the audiovisual data for the content item by selecting data packets with a PID indicated in PMT. However, because the content item may have alternative audio tracks, the receiver may, for example, select to ignore or extract data from a given PID, depending on whether that PID understands necessary audio data or not. For example (and with reference to Figure 2), if a German dialogue track is provided as alternative data in data packets with PID 2, the receiver may ignore these data packets if English dialogue of PID 1 is desired. This way, if the standard audio scene is desired, the receiver in this example only needs to consider PID1 data packets to provide the desired audio. However, at the same time, if the alternative German dialogue audio track is preferred, the receiver can simply extract this audio data from the PID 2 data packets and replace the substitutable audio data from the PID 1 data packets with this audio data.

[0160] A abordagem segue para um alto grau de eficiência operacional. De fato, o sistema pode simplesmente renderizar um fluxo elementar único para operação nominal e, dessa forma, a abordagem não apenas fornece diferentes opções, como também pode tratar uma opção como uma opção preferencial. Por exemplo, o diálogo original é incluído no mesmo fluxo elementar que o áudio de fundo, e assim, isso sempre será fornecido a menos que um usuário solicite, especificamente, uma alternativa.[0160] The approach follows a high degree of operational efficiency. In fact, the system can simply render a single elementary stream for nominal operation, and in this way the approach not only provides different options, but can also treat an option as a preferred option. For example, the original dialogue is included in the same elementary stream as the background audio, so it will always be provided unless a user specifically requests an alternative.

[0161] A Figura 3 ilustra um exemplo de um aparelho para gerar um fluxo de dados do item de conteúdo audiovisual, e especificamente um fluxo de transporte como o fluxo de transporte baseado em MPEG da Figura 2. O fluxo de dados do item de conteúdo audiovisual será chamado de fluxo de transporte. O item de conteúdo é constituído de uma série de componentes audiovisuais, como um ou mais componentes de áudio e geralmente um ou mais componentes de vídeo. Um item de conteúdo pode também incluir componentes que suportam interatividade. Cada componente de áudio pode ser um sinal de áudio e, em muitos casos podem ser um objeto de áudio. Cada componente de vídeo pode ser um sinal de vídeo correspondente a uma única imagem em movimento, ou pode ser, por exemplo, de uma imagem em movimento em múltiplas vistas. Um item de conteúdo pode também incluir componentes que suportam interatividade. Por exemplo, um componente de interatividade pode estar disponível para auxiliar o usuário em sua seleção de um objeto de áudio e/ou componente de vídeo.[0161] Figure 3 illustrates an example of an apparatus for generating an audiovisual content item data stream, and specifically a transport stream such as the MPEG-based transport stream of Figure 2. The content item data stream audiovisual will be called transport flow. The content item is made up of a series of audiovisual components, such as one or more audio components and usually one or more video components. A content item can also include components that support interactivity. Each audio component can be an audio signal and in many cases can be an audio object. Each video component may be a video signal corresponding to a single moving image, or may be, for example, a moving image in multiple views. A content item can also include components that support interactivity. For example, an interactivity component may be available to assist the user in their selection of an audio object and/or video component.

[0162] O aparelho gera um fluxo de transporte que compreende uma pluralidade de fluxos de dados audiovisuais individuais. Os componentes audiovisuais do item de conteúdo, consequentemente, são distribuídos por uma pluralidade de fluxos de dados audiovisuais individuais. Cada um dos fluxos de dados audiovisuais individuais, consequentemente, corresponde a um fluxo elementar, conforme anteriormente descrito, e será chamado como fluxo elementar. Cada fluxo elementar pode ser associado a um único identificador de pacote (dentro do fluxo de transporte), como a um PID, especificamente.[0162] The apparatus generates a transport stream comprising a plurality of individual audiovisual data streams. The audiovisual components of the content item are consequently distributed across a plurality of individual audiovisual data streams. Each of the individual audiovisual data streams therefore corresponds to an elementary stream, as previously described, and will be referred to as an elementary stream. Each elementary flow can be associated with a unique packet identifier (within the transport flow), such as a PID specifically.

[0163] A pluralidade de fluxos elementares (fluxos de dados audiovisuais) compreende, consequentemente, os componentes audiovisuais do item de conteúdo. Na abordagem da Figura 1, cada componente audiovisual está compreendido em um único fluxo elementar. Entretanto, por outro lado, o aparelho da Figura 2 está disposto de modo a gerar o fluxo de transporte, de modo que ao menos um primeiro dentre os fluxos elementares compreende uma pluralidade de componentes audiovisuais.[0163] The plurality of elementary streams (audiovisual data streams) consequently comprises the audiovisual components of the content item. In the approach shown in Figure 1, each audiovisual component is comprised of a single elementary flow. However, on the other hand, the apparatus of Figure 2 is arranged to generate the transport stream, so that at least one of the elementary streams comprises a plurality of audiovisual components.

[0164] Os componentes audiovisuais estão compreendidos nos fluxos elementares pelos fluxos elementares que compreendem dados codificados para os componentes audiovisuais. Dessa forma, cada fluxo elementar compreende dados codificados que representam ao menos um componente audiovisual. Em algumas modalidades, podem ser fornecidos alguns fluxos elementares que compreendam metadados como dados de controle, dados interativos etc.[0164] The audiovisual components are comprised in elementary flows by elementary flows comprising encoded data for the audiovisual components. In this way, each elementary stream comprises coded data that represents at least one audiovisual component. In some embodiments, some elementary streams comprising metadata such as control data, interactive data, etc. may be provided.

[0165] Conforme anteriormente descrito, os fluxos elementares são constituídos de uma pluralidade de pacotes de dados multiplexados no tempo e, consequentemente, os dados codificados para os componentes audiovisuais estão incluídos nos pacotes de dados do fluxo de transporte. Dessa forma, a temporização do pacote de dados individual no fluxo de transporte não corresponde diretamente à temporização do segmento do componente audiovisual no pacote de dados quando este é renderizado. De modo a assegurar temporização correta da renderização, cada fluxo elementar compreende informações de sincronização que possibilitam que haja sincronização com componentes audiovisuais em outros fluxos elementares. Especificamente, cada pacote de dados pode incluir dados de sincronização que definem a temporização do segmento de conteúdo representado pelo pacote de dados.[0165] As previously described, the elementary streams are made up of a plurality of time-multiplexed data packets and, consequently, the data encoded for the audiovisual components are included in the data packets of the transport stream. Therefore, the timing of the individual data packet in the transport stream does not directly correspond to the timing of the audiovisual component segment in the data packet when it is rendered. To ensure correct rendering timing, each elementary stream comprises synchronization information that allows it to synchronize with audiovisual components in other elementary streams. Specifically, each data packet may include synchronization data that defines the timing of the content segment represented by the data packet.

[0166] A descrição e ilustração da Figura 3 irá focar na parte do fluxo de transporte relacionada a componentes de áudio. Deve-se considerar que, além disso, o fluxo de transporte pode ser gerado de modo a incluir metadados, dados de controle, itens de conteúdo de vídeo (e possivelmente outros itens de áudio) etc. Por exemplo, a abordagem bem conhecida de várias implementações de Fluxo (stream) de Transporte MPEG-2 convencional, pode ser usada para tais dados.[0166] The description and illustration of Figure 3 will focus on the part of the transport flow related to audio components. It should be considered that, in addition, the transport stream may be generated to include metadata, control data, video content items (and possibly other audio items), etc. For example, the well-known approach of several conventional MPEG-2 Transport stream implementations can be used for such data.

[0167] O aparelho da Figura 3 compreende uma fonte de áudio 301 que fornece dados de áudio codificados para uma pluralidade de componentes de áudio. Em algumas modalidades, a fonte de áudio 301 pode receber uma pluralidade de componentes de áudio e pode proceder à codificação dos mesmos individualmente. A codificação pode usar o mesmo algoritmo de codificação ou pode, em muitas modalidades, usar diferentes algoritmos de codificação e padrões para diferentes componentes de áudio. Além disso, parâmetros de codificação, como, por exemplo, a taxa de dados resultante, podem ser iguais ou diferentes para diferentes componentes de áudio.[0167] The apparatus of Figure 3 comprises an audio source 301 that provides encoded audio data to a plurality of audio components. In some embodiments, the audio source 301 may receive a plurality of audio components and may encode them individually. The encoding may use the same encoding algorithm or may, in many embodiments, use different encoding algorithms and standards for different audio components. Furthermore, encoding parameters, such as the resulting data rate, may be the same or different for different audio components.

[0168] Em outras modalidades, a fonte de áudio 301 pode fornecer diretamente os dados de áudio codificados. Por exemplo, a fonte de áudio 301 pode ser um armazenamento local em que são armazenados vários componentes de áudio codificados.[0168] In other embodiments, the audio source 301 may directly provide the encoded audio data. For example, audio source 301 may be local storage in which various encoded audio components are stored.

[0169] A fonte de áudio 301 fornece especificamente dados de áudio codificados para componentes de áudio que representam o item de conteúdo. Ela fornece geralmente todo o áudio a ser reproduzido ao reproduzir um componente de vídeo incluído no fluxo de transporte. Por exemplo, para um filme, um ou mais fluxos elementares podem fornecer o vídeo para o filme (por exemplo, fluxos elementares diferentes podem fornecer diferentes resoluções do vídeo. A fonte de áudio 301 pode fornecer o áudio associado dividido em vários componentes de áudio.[0169] Audio source 301 specifically provides encoded audio data for audio components representing the content item. It typically provides all audio to be played when playing a video component included in the transport stream. For example, for a movie, one or more elementary streams may provide the video for the movie (e.g., different elementary streams may provide different resolutions of the video. Audio source 301 may provide the associated audio divided into multiple audio components.

[0170] Na abordagem da Figura 3, é gerado um único fluxo elementar que compreende uma representação completa de uma plataforma de som a ser renderizado em conjunto com a renderização do item de conteúdo. Por exemplo, é gerado um fluxo elementar que compreende todo o áudio necessário para renderizar o áudio, por exemplo, de um filme ou programa de televisão.[0170] In the approach of Figure 3, a single elementary stream is generated that comprises a complete representation of a sound platform to be rendered in conjunction with the rendering of the content item. For example, an elementary stream is generated that comprises all the audio necessary to render the audio of, for example, a movie or television program.

[0171] O fluxo de transporte pode ser gerado especificamente de modo a compreender explicitamente dados que definem uma ou mais representações de áudio. A definição de uma representação de áudio pode ser fornecida, por exemplo, por uma identificação direta ou indireta de dados de áudio correspondentes a dados de áudio obrigatórios e dados de áudio substituíveis para a representação de áudio. Geralmente, a definição da representação de áudio pode também incluir uma identificação de dados de áudio alternativos que podem substituir os dados de áudio substituíveis.[0171] The transport stream may be specifically generated so as to explicitly comprise data defining one or more audio representations. The definition of an audio representation may be provided, for example, by a direct or indirect identification of audio data corresponding to mandatory audio data and substitutable audio data for the audio representation. Generally, the definition of the audio representation may also include an identification of alternative audio data that can replace the substitutable audio data.

[0172] Na abordagem, o primeiro fluxo elementar não compreende um componente de áudio único, mas, ao invés disso, compreende tanto um componente de áudio obrigatório, quanto um componente de áudio substituível. Dessa forma, o fluxo elementar é gerado de modo a incluir tanto dados de áudio obrigatórios para o componente de áudio obrigatório, quanto dados de áudio substituíveis para o componente de áudio substituível, conforme descrito anteriormente. O componente de áudio obrigatório pode corresponder especificamente a um áudio de fundo e o componente de áudio substituível pode corresponder ao diálogo original no idioma original (por exemplo, inglês).[0172] In the approach, the first elementary stream does not comprise a single audio component, but instead comprises both a mandatory audio component and a replaceable audio component. In this way, the elementary stream is generated to include both mandatory audio data for the mandatory audio component and substitutable audio data for the substitutable audio component, as previously described. The required audio component can specifically correspond to background audio, and the overridable audio component can correspond to the original dialogue in the original language (for example, English).

[0173] No exemplo da Figura 3, a fonte de áudio 301 fornece dados de áudio obrigatórios para o componente de áudio obrigatório a um primeiro empacotador 303. O primeiro empacotador 303 prossegue para empacotar os dados de áudio obrigatórios. Este empacotamento inclui dividir os dados de áudio obrigatórios em blocos de tamanho adequado. Inclui também adicionar dados de sincronização aos pacotes de dados. Além disso, o primeiro empacotador 303 adiciona um cabeçalho com informações relevantes que possibilitam a decodificação correta do pacote de dados. O cabeçalho é gerado especificamente para que inclua um PID, e o PID alocado ao primeiro fluxo elementar é, consequentemente, incluído no pacote de dados.[0173] In the example of Figure 3, audio source 301 provides mandatory audio data for the mandatory audio component to a first packager 303. The first packager 303 proceeds to package the mandatory audio data. This packaging includes dividing the required audio data into appropriately sized blocks. It also includes adding sync data to data packages. Furthermore, the first packetizer 303 adds a header with relevant information that enables the correct decoding of the data packet. The header is generated specifically to include a PID, and the PID allocated to the first elementary stream is consequently included in the data packet.

[0174] De modo similar, a fonte de áudio 301 fornece dados de áudio substituíveis para o componente de áudio substituível a um segundo empacotador 305. O segundo empacotador 305 prossegue para empacotar os dados de áudio substituíveis. Este empacotamento inclui, de modo similar, dividir os dados de áudio substituíveis em blocos de tamanho adequado, somar dados de sincronização e um cabeçalho de pacote. Quanto ao primeiro empacotador 303, o segundo empacotador 305 gera o cabeçalho de modo a incluir um PID correspondente ao PID alocado para o primeiro fluxo elementar. Dessa forma, os pacotes de dados para o componente de áudio obrigatório e componente de áudio substituível têm o mesmo PID e, consequentemente, são parte do mesmo fluxo elementar.[0174] Similarly, audio source 301 provides substitutable audio data for the substitutable audio component to a second packager 305. The second packager 305 proceeds to package the substitutable audio data. This packaging similarly includes dividing the replaceable audio data into appropriately sized blocks, summing synchronization data, and a packet header. As for the first wrapper 303, the second wrapper 305 generates the header to include a PID corresponding to the PID allocated to the first elementary stream. This way, the data packets for the mandatory audio component and replaceable audio component have the same PID and are consequently part of the same elementary stream.

[0175] A fonte de áudio 301 fornece, adicionalmente, dados de áudio alternativos a um terceiro empacotador 307. O terceiro empacotador 307 prossegue para empacotar os dados de áudio substituíveis. Este empacotamento inclui, de modo similar, dividir os dados de áudio substituíveis em blocos de tamanho adequado, somar dados de sincronização e um cabeçalho de pacote. Quanto ao primeiro empacotador 303, o terceiro empacotador 307 gera o cabeçalho para incluir um PID. Os dados de áudio alternativos são, conforme anteriormente descrito, uma alternativa aos dados de áudio substituíveis. Dessa forma, os dados de áudio alternativos são dados que codificam um componente de áudio alternativo que pode ser usado ao invés do componente de áudio substituível. Por exemplo, o componente de áudio alternativo pode corresponder a um idioma dublado (por exemplo, alemão) e esse pode substituir o idioma original (por exemplo, inglês) quando da renderização do item de conteúdo compreendido no fluxo de transporte.[0175] The audio source 301 further provides alternative audio data to a third packer 307. The third packer 307 proceeds to package the replaceable audio data. This packaging similarly includes dividing the replaceable audio data into appropriately sized blocks, summing synchronization data, and a packet header. As for the first wrapper 303, the third wrapper 307 generates the header to include a PID. Alternative audio data is, as previously described, an alternative to replaceable audio data. In this way, alternative audio data is data that encodes an alternative audio component that can be used instead of the replaceable audio component. For example, the alternate audio component may correspond to a dubbed language (e.g., German) and this may replace the original language (e.g., English) when rendering the content item comprised in the transport stream.

[0176] No exemplo específico, os dados de áudio alternativos estão incluídos em um fluxo elementar diferente do primeiro fluxo elementar e, consequentemente, os dados de áudio alternativos são gerados para ter um PID diferente dos pacotes de dados para os dados de áudio obrigatórios e dados de áudio substituíveis. Entretanto, conforme será descrito posteriormente, os dados de áudio alternativos podem, em algumas modalidades, ser incluídos no próprio primeiro fluxo elementar, e, dessa forma, em algumas modalidades, os pacotes de dados podem ser gerados para que tenham o mesmo PID que os dados de áudio obrigatórios e os dados de áudio alternativos.[0176] In the specific example, the alternate audio data is included in a different elementary stream than the first elementary stream and consequently the alternate audio data is generated to have a different PID than the data packets for the mandatory audio data and replaceable audio data. However, as will be described later, alternative audio data may, in some embodiments, be included in the first elementary stream itself, and thus, in some embodiments, data packets may be generated so that they have the same PID as the mandatory audio data and alternative audio data.

[0177] O primeiro, segundo e terceiro empacotadores 303, 305, 307 são acoplados a um gerador de fluxo 309, que prossegue para gerar o fluxo de transporte por multiplexação no tempo dos pacotes de dados a partir dos empacotadores 303, 305, 307. Deve-se considerar que, geralmente, vários outros componentes de áudio podem também ser codificados. Estes componentes de áudio (incluindo, possivelmente, tanto componentes de áudio obrigatórios para outras representações de áudio ou, componentes de áudio alternativos) podem ser empacotados de um modo similar. O gerador de fluxo 309 pode ser disposto de modo a incluir adicionalmente tais pacotes de dados no fluxo de transporte por multiplexação no tempo. De modo similar, os pacotes de dados podem ser gerados para componentes de vídeo, possivelmente componentes audiovisuais mixados, metadados ou dados de controle e os pacotes de dados resultantes podem ser incluídos no fluxo de transporte por multiplexação no tempo.[0177] The first, second and third packers 303, 305, 307 are coupled to a stream generator 309, which proceeds to generate the transport stream by time multiplexing the data packets from the packers 303, 305, 307. It should be considered that, generally, several other audio components can also be encoded. These audio components (including, possibly, either mandatory audio components for other audio representations or alternative audio components) may be packaged in a similar manner. The stream generator 309 may be arranged to additionally include such data packets in the time multiplexed transport stream. Similarly, data packets can be generated for video components, possibly mixed audiovisual components, metadata or control data, and the resulting data packets can be included in the transport stream by time multiplexing.

[0178] O aparelho compreende adicionalmente um gerador de dados de controle 311 que é disposto de modo a gerar dados de controle para o fluxo de transporte. O gerador de dados de controle 311 gera especificamente dados de controle que descrevem quais dados estão incluídos no fluxo de transporte. Especificamente, o gerador de dados de controle 311 pode gerar PATs e PMTs. Os pacotes de dados resultantes são alimentados no gerador de fluxo 309 que prossegue de modo a incluir os dados no fluxo de transporte. O gerador de dados de controle 311 pode incluir, especificamente, dados que definem ou descrevem os dados associados a uma representação de áudio específica para o item de conteúdo.[0178] The apparatus further comprises a control data generator 311 which is arranged to generate control data for the transport flow. The control data generator 311 specifically generates control data that describes what data is included in the transport stream. Specifically, control data generator 311 can generate PATs and PMTs. The resulting data packets are fed into stream generator 309 which proceeds to include the data in the transport stream. The control data generator 311 may specifically include data that defines or describes data associated with a specific audio representation for the content item.

[0179] Dessa forma, o aparelho da Figura 3 pode gerar um fluxo de transporte como o descrito com referência à Figura 2, isto é, um fluxo de transporte pode ser gerado no qual ao menos um primeiro fluxo elementar compreende dados para uma pluralidade de de componentes de áudio, sendo que ao menos um componente de áudio é obrigatório para a representação de áudio do item de conteúdo, enquanto o outro componente de áudio pode ser substituído por outro componente de áudio. Dessa forma, as vantagens descritas anteriormente podem ser obtidas pelo aparelho da Figura 3.[0179] In this way, the apparatus of Figure 3 can generate a transport stream as described with reference to Figure 2, that is, a transport stream can be generated in which at least one first elementary stream comprises data for a plurality of of audio components, with at least one audio component being mandatory for the audio representation of the content item, while the other audio component may be replaced by another audio component. In this way, the advantages described previously can be obtained by the device in Figure 3.

[0180] A Figura 4 ilustra um exemplo de um aparelho para gerar um sinal de áudio para um item de conteúdo audiovisual. Especificamente, o aparelho recebe o fluxo de transporte do aparelho da Figura 3 (especificamente um fluxo de transporte é mostrado na Figura 2) e gera um sinal de saída de áudio para o item de conteúdo. O sinal de saída pode, geralmente, ser usado para renderizar o áudio e o aparelho da Figura 4 será, consequentemente, referido como um renderizador.[0180] Figure 4 illustrates an example of an apparatus for generating an audio signal for an audiovisual content item. Specifically, the apparatus receives the transport stream from the apparatus of Figure 3 (specifically a transport stream is shown in Figure 2) and generates an audio output signal for the content item. The output signal can generally be used to render audio and the apparatus of Figure 4 will consequently be referred to as a renderer.

[0181] O renderizador compreende um receptor de fluxo de transporte 401 que recebe o fluxo de transporte.[0181] The renderer comprises a transport stream receiver 401 that receives the transport stream.

[0182] O renderizador compreende adicionalmente um primeiro extrator de dados 403 que é disposto de modo a extrair os dados de áudio obrigatórios do fluxo de transporte recebido. Especificamente, o primeiro extrator de dados 403 é disposto de modo a detectar pacotes de dados com o PID correspondente ao primeiro fluxo de transporte elementar. Em seguida, o extrator pode, a partir destes pacotes de dados, extrair os dados do subconjunto de pacotes de dados aos quais os dados correspondem ao componente de áudio obrigatório.[0182] The renderer further comprises a first data extractor 403 which is arranged to extract the required audio data from the received transport stream. Specifically, the first data extractor 403 is arranged to detect data packets with the PID corresponding to the first elementary transport stream. The extractor can then, from these data packets, extract the data from the subset of data packets to which the data corresponds to the required audio component.

[0183] O renderizador compreende também um segundo extrator de dados 405 que é disposto de modo a extrair os dados de áudio obrigatórios do fluxo de transporte recebido. Especificamente, o segundo extrator de dados 405 é disposto de modo a detectar pacotes de dados com o PID correspondente ao primeiro fluxo elementar. Em seguida, o extrator pode, a partir destes pacotes de dados, extrair os dados do subconjunto de pacotes de dados aos quais os dados correspondem ao componente de áudio substituível.[0183] The renderer also comprises a second data extractor 405 which is arranged to extract the required audio data from the received transport stream. Specifically, the second data extractor 405 is arranged to detect data packets with the PID corresponding to the first elementary stream. The extractor can then, from these data packets, extract data from the subset of data packets to which the data corresponds to the replaceable audio component.

[0184] Podem ser fornecidas informações sobre o pacote de dados individual compreender dados de áudio substituíveis ou dados de áudio obrigatórios, em algumas modalidades, pelo controle ou metadados do fluxo de transporte não compreendidos no primeiro fluxo elementar. Por exemplo, pode ser fornecida uma PMT que, para o primeiro fluxo elementar, define uma ordem de pacotes de dados no fluxo elementar. Por exemplo, a PMT pode definir uma sequência repetida de dois pacotes de dados com dados de áudio obrigatórios seguidos por um pacote de dados de dados de áudio substituíveis. Em outras modalidades, a informação pode ser fornecida, alternativa ou adicionalmente, nos pacotes de dados individuais. Por exemplo, um marcador no cabeçalho de cada pacote de dados pode indicar se o pacote de dados compreende dados de áudio obrigatórios ou dados de áudio substituíveis. Em modalidades simples, pode ser fornecido um único marcador de bits. Em outras modalidades, pode ser fornecida uma identidade do componente de áudio individual do fluxo elementar.[0184] Information may be provided about the individual data packet comprising substitutable audio data or mandatory audio data, in some embodiments, by control or transport stream metadata not comprised in the first elementary stream. For example, a PMT may be provided that, for the first elementary stream, defines an order of data packets in the elementary stream. For example, the PMT may define a repeated sequence of two data packets with mandatory audio data followed by a data packet of replaceable audio data. In other embodiments, the information may be provided, alternatively or additionally, in individual data packets. For example, a marker in the header of each data packet may indicate whether the data packet comprises mandatory audio data or replaceable audio data. In simple embodiments, a single bit marker may be provided. In other embodiments, an identity of the individual audio component of the elementary stream may be provided.

[0185] O renderizador compreende também um terceiro extrator de dados 407 que é disposto de modo a extrair os dados de áudio alternativos do fluxo de transporte recebido. Especificamente, nos exemplos onde são fornecidos dados de áudio alternativos em um fluxo elementar diferente, o terceiro extrator de dados 407 pode ser disposto de modo a detectar pacotes de dados com um PID correspondente a esse fluxo elementar diferente. O terceiro extrator pode, então, a partir destes pacotes de dados, extrair os dados de áudio alternativos.[0185] The renderer also comprises a third data extractor 407 that is arranged to extract alternative audio data from the received transport stream. Specifically, in examples where alternative audio data is provided in a different elementary stream, the third data extractor 407 may be arranged to detect data packets with a PID corresponding to that different elementary stream. The third extractor can then, from these data packets, extract the alternative audio data.

[0186] O primeiro extrator de dados 403 é acoplado a uma primeira unidade de decodificação 409 à qual os dados de áudio obrigatórios são fornecidos. A primeira unidade de decodificação 409 prossegue então para decodificar os dados de áudio obrigatórios para gerar o componente de áudio obrigatório.[0186] The first data extractor 403 is coupled to a first decoding unit 409 to which the required audio data is provided. The first decoding unit 409 then proceeds to decode the required audio data to generate the required audio component.

[0187] De modo similar, o segundo extrator de dados 405 é acoplado a uma segunda unidade de decodificação 411 à qual os dados de áudio substituíveis são fornecidos. A segunda unidade de decodificação 411 prossegue então para decodificar os dados de áudio substituíveis para gerar o componente de áudio substituível.[0187] Similarly, the second data extractor 405 is coupled to a second decoding unit 411 to which replaceable audio data is provided. The second decoding unit 411 then proceeds to decode the substitutable audio data to generate the substitutable audio component.

[0188] Correspondentemente, o terceiro extrator de dados 407 é acoplado a uma terceira unidade de decodificação 413 à qual os dados de áudio alternativos são fornecidos. A terceira unidade de decodificação 413 prossegue então para decodificar os dados de áudio alternativos para gerar o componente de áudio alternativo.[0188] Correspondingly, the third data extractor 407 is coupled to a third decoding unit 413 to which alternative audio data is provided. The third decoding unit 413 then proceeds to decode the alternative audio data to generate the alternative audio component.

[0189] Em algumas modalidades, a primeira, segunda e terceira unidades de decodificação 409, 411, 413 podem utilizar o mesmo algoritmo de decodificação, isto é, o mesmo algoritmo ou padrão de codificação pode ter sido usado para gerar os dados de áudio codificados. Entretanto, mesmo em tais modalidades, as diferentes unidades de decodificação (e, assim, codificadores na extremidade fonte) podem ter diferentes parâmetros de codificação/decodificação. Especificamente, a taxa de dados dos dados de áudio pode ser diferente para os dados de áudio obrigatórios, dados de áudio substituíveis e/ou dados de áudio alternativos, e, consequentemente, as unidades de decodificação pode decodificar dados de áudio com diferentes taxas de dados.[0189] In some embodiments, the first, second and third decoding units 409, 411, 413 may utilize the same decoding algorithm, that is, the same algorithm or coding pattern may have been used to generate the encoded audio data . However, even in such embodiments, different decoding units (and thus encoders at the source end) may have different encoding/decoding parameters. Specifically, the data rate of the audio data may be different for mandatory audio data, replaceable audio data and/or alternative audio data, and consequently the decoding units may decode audio data with different data rates. .

[0190] Em algumas modalidades, ao menos duas dentre a primeira, segunda e terceira unidades de decodificação 409, 411, 413 podem utilizar diferentes algoritmos de decodificação, isto é, diferentes algoritmos ou padrões de codificação podem ter sido usados para gerar os dados de áudio codificados.[0190] In some embodiments, at least two of the first, second and third decoding units 409, 411, 413 may use different decoding algorithms, that is, different algorithms or coding patterns may have been used to generate the decoding data. encoded audio.

[0191] Dessa forma, a abordagem pode possibilitar otimização ou adaptação individual às características e preferências de cada componente de áudio individual. A decisão de codificar ajustes/algoritmos pode ser executada dinamicamente, por exemplo, com base nas características dos componentes de áudio.[0191] In this way, the approach can enable individual optimization or adaptation to the characteristics and preferences of each individual audio component. The decision to encode adjustments/algorithms can be performed dynamically, for example, based on the characteristics of the audio components.

[0192] A primeira, segunda e terceira unidades de decodificação 409, 411, 413 são acopladas a um combinador 415 que é disposto de modo a gerar um sinal de saída pela combinação do componente de áudio obrigatório com um dentre o componente de áudio substituível e o componente de áudio alternativo. A combinação pode ser, em muitos cenários, uma simples (possivelmente ponderada e/ou com frequência seletiva) soma ou mixagem.[0192] The first, second and third decoding units 409, 411, 413 are coupled to a combiner 415 which is arranged to generate an output signal by combining the required audio component with one of the replaceable audio component and the alternate audio component. The combination can be, in many scenarios, a simple (possibly weighted and/or frequency-selective) sum or mix.

[0193] Especificamente, ao operar no modo padrão, o sinal de saída é gerado pela combinação do componente de áudio obrigatório e o componente de áudio substituível. Dessa maneira, é gerado o sinal de saída para corresponder à representação de áudio padrão para o item de conteúdo. No exemplo específico, é gerada uma trilha de áudio com diálogo no idioma inglês para o componente de vídeo.[0193] Specifically, when operating in standard mode, the output signal is generated by combining the mandatory audio component and the replaceable audio component. This way, the output signal is generated to match the standard audio representation for the content item. In the specific example, an audio track with dialogue in English is generated for the video component.

[0194] Entretanto, por exemplo, em resposta a dados inseridos implicitamente pelo usuário, o aparelho da Figura 4 pode, ao invés disso, gerar o sinal de saída pela combinação do componente de áudio obrigatório e do componente de áudio alternativo. Dessa forma, nesse cenário, o aparelho prossegue para substituir o componente de áudio substituível pelo componente de áudio alternativo. Isso pode resultar, por exemplo, na geração de uma trilha de áudio com diálogo dublado no idioma alemão para o componente de vídeo.[0194] However, for example, in response to data implicitly entered by the user, the apparatus of Figure 4 may instead generate the output signal by combining the mandatory audio component and the alternative audio component. Therefore, in this scenario, the device proceeds to replace the replaceable audio component with the alternative audio component. This could result, for example, in the generation of an audio track with German-dubbed dialogue for the video component.

[0195] Desta forma, o sinal de áudio de saída pode, por exemplo, ser renderizado ou reproduzido mediante o acionamento de um alto-falante om base no sinal de áudio de saída. Tal acionamento pode ser através de um circuito de acionamento adequado incluindo, por exemplo, um amplificador de potência, filtro etc., como é bem conhecido na técnica. Deve-se considerar também que a abordagem pode ser usada para sinais de multicanal - por exemplo, ao estarem todos os dados, componentes e processamento diretamente no domínio de multicanal (por exemplo, os dados de áudio podem representar sinais de multicanal codificados que são decodificados para gerar componentes de áudio de multicanal que podem então ser selecionados e combinados por um combinador de multicanal). Como outro exemplo, a abordagem descrita pode ser executada individualmente para cada canal individual de um sinal de multicanal.[0195] In this way, the output audio signal can, for example, be rendered or reproduced by driving a speaker based on the output audio signal. Such drive may be via a suitable drive circuit including, for example, a power amplifier, filter etc., as is well known in the art. It should also be considered that the approach can be used for multichannel signals - for example, by having all data, components and processing directly in the multichannel domain (for example, audio data can represent encoded multichannel signals that are decoded to generate multichannel audio components that can then be selected and combined by a multichannel combiner). As another example, the described approach can be performed individually for each individual channel of a multichannel signal.

[0196] Como ainda outro exemplo, os componentes de áudio de canal simples e de multicanal podem ser mixados, por exemplo, o componente de áudio obrigatório pode ser um sinal de multicanal e os componentes de áudio substituíveis e alternativos podem ser sinais de canal simples.[0196] As yet another example, single-channel and multi-channel audio components may be mixed, for example, the mandatory audio component may be a multi-channel signal and the substitutable and alternative audio components may be single-channel signals. .

[0197] No exemplo anterior, os dados de áudio substituíveis são substituídos pelos dados de áudio alternativos quando o combinador 415 faz a seleção para combinar o componente de áudio alternativo e o componente de áudio obrigatório. Deve-se considerar que em algumas de tais modalidades, o aparelho da Figura 4 pode não extrair ou decodificar os dados que não estão sendo usados. Especificamente, se for selecionada a operação padrão, o aparelho não extrairá os dados de áudio alternativos e decodificará o componente de áudio alternativo. De modo similar, se forem usados os dados de áudio alternativos para gerar o sinal de saída, o aparelho pode não extrair os dados de áudio substituíveis ou decodificar o componente de áudio substituível.[0197] In the previous example, the substitutable audio data is replaced by the alternative audio data when combiner 415 makes the selection to combine the alternative audio component and the mandatory audio component. It should be considered that in some such embodiments, the apparatus of Figure 4 may not extract or decode data that is not being used. Specifically, if standard operation is selected, the device will not extract the alternate audio data and decode the alternate audio component. Similarly, if alternative audio data is used to generate the output signal, the apparatus may not extract the substitutable audio data or decode the substitutable audio component.

[0198] No exemplo, a substituição (ou não substituição) dos dados de áudio substituíveis pelos dados de áudio alternativos é realizada por meio da seleção do componente de áudio combinado ao componente de áudio obrigatório. Entretanto, deve-se considerar que a seleção e substituição podem ser executadas diretamente no domínio dos dados de áudio codificados. Por exemplo, o mesmo decodificador pode ser usado para todos os componentes de áudio que estão sendo decodificados e o aparelho pode ser disposto de modo a substituir diretamente os dados de áudio substituíveis pelos dados de áudio alternativos em um fluxo de dados que esteja sendo alimentado na unidade de decodificação.[0198] In the example, replacing (or not replacing) the replaceable audio data with the alternative audio data is accomplished by selecting the audio component combined with the required audio component. However, it should be considered that selection and replacement can be performed directly in the domain of encoded audio data. For example, the same decoder may be used for all audio components being decoded and the apparatus may be arranged to directly replace substitutable audio data with alternative audio data in a data stream being fed into the decoding unit.

[0199] Em algumas modalidades, a combinação do áudio obrigatório e do áudio substituível (padrão) ou do áudio alternativo, pode ser realizada no domínio comprimido e/ou codificado. Em tal modalidade, pode ser fornecido um combinador 415 com os dados de áudio comprimidos/codificados relevantes dos extratores de dados 403, 405, 407 e o mesmo pode prosseguir para selecionar e combinar os dados de áudio desejados. Então, os dados de áudio combinados podem ser alimentados a uma unidade de decodificação simples que decodifica os dados de áudio combinados.[0199] In some embodiments, the combination of mandatory audio and substitutable (standard) audio or alternative audio can be performed in the compressed and/or encoded domain. In such an embodiment, a combiner 415 may be provided with the relevant compressed/encoded audio data from the data extractors 403, 405, 407 and the same may proceed to select and combine the desired audio data. Then, the combined audio data can be fed to a simple decoding unit that decodes the combined audio data.

[0200] Os dados de áudio alternativos podem ser fornecidos em diferentes partes do fluxo de transporte em diferentes modalidades, ou podem até, em alguns casos, ser fornecidos externamente ao fluxo de transporte.[0200] Alternative audio data may be provided in different parts of the transport stream in different embodiments, or may even, in some cases, be provided external to the transport stream.

[0201] Dessa forma, em algumas modalidades, o aparelho pode ser disposto de modo a receber um segundo fluxo de transporte da mesma fonte ou de uma fonte diferente. O aparelho pode ser disposto de modo a processar esse segundo fluxo de transporte e pode, a partir disso, extrair um componente de áudio alternativo que pode substituir o componente de áudio substituível do primeiro fluxo de transporte, conforme anteriormente descrito para um componente de áudio alternativo compreendido no mesmo fluxo de transporte. O segundo fluxo de transporte pode ser recebido, por exemplo, de uma outra fonte através de uma conexão de Internet.[0201] Thus, in some embodiments, the apparatus may be arranged to receive a second transport stream from the same or a different source. The apparatus may be arranged to process such a second transport stream and may therefrom extract an alternative audio component that may replace the substitutable audio component of the first transport stream, as previously described for an alternative audio component. included in the same transport flow. The second transport stream may be received, for example, from another source via an Internet connection.

[0202] Tal abordagem pode possibilitar, por exemplo, que o componente de áudio substituível seja recuperado de um provedor diferente, por exemplo, em uma conexão de Internet. A abordagem pode habilitar, por exemplo, uma terceira parte para fornecer dublagem de idiomas para filmes, por exemplo.[0202] Such an approach may enable, for example, the replaceable audio component to be retrieved from a different provider, for example, over an Internet connection. The approach could, for example, enable a third party to provide language dubbing for films, for example.

[0203] Um exemplo específico de um segundo fluxo de transporte pode, dessa forma, ser um fluxo de transporte recebido ou recuperado de uma fonte de dados diferente ou de um arquivo diferente do primeiro fluxo de transporte. Por exemplo, o primeiro fluxo de transporte pode ser recebido de uma fonte de dados primária por uma transmissão broadcast. Por exemplo, o primeiro fluxo de transporte pode ser de uma estação de televisão que realize broadcast do primeiro fluxo de transporte para um grande número de receptores e usuários. Dessa forma, essa comunicação pode ser, por exemplo, uma broadcast de rádio de um ponto para múltiplos pontos. Entretanto, o segundo fluxo de transporte compreendendo dados de áudio alternativos, pode ser transmitido diretamente para o usuário através de um meio de comunicação diferente, como por exemplo, através da Internet. O segundo fluxo de transporte pode ser transmitido como uma transmissão ponto a ponto diretamente para o receptor/usuário individual. De fato, o segundo fluxo de transporte pode até ser especificamente solicitado pelo usuário e fornecido através de um meio interativo, como a Internet. Tal abordagem pode possibilitar distribuição e comunicação eficientes, enquanto, ao mesmo tempo, possibilita um grau muito alto de customização pelo usuário potencial.[0203] A specific example of a second transport stream may thus be a transport stream received or retrieved from a different data source or from a different file than the first transport stream. For example, the first transport stream may be received from a primary data source by a broadcast transmission. For example, the first transport stream may be from a television station that broadcasts the first transport stream to a large number of receivers and users. Thus, this communication can be, for example, a radio broadcast from one point to multiple points. However, the second transport stream comprising alternative audio data may be transmitted directly to the user via a different communication medium, such as via the Internet. The second transport stream can be transmitted as a point-to-point transmission directly to the individual receiver/user. In fact, the second transport stream may even be specifically requested by the user and provided through an interactive medium such as the Internet. Such an approach can enable efficient distribution and communication, while at the same time enabling a very high degree of customization by the potential user.

[0204] Consequentemente, o segundo fluxo de transporte pode, possivelmente, ser recuperável a partir de ou através de uma fonte diferente do primeiro fluxo de transporte. No caso de arquivos, os fluxos de transporte podem ser de diferentes arquivos. Uma fonte diferente para o segundo fluxo de transporte pode também ser, por exemplo, um meio diferente (por exemplo, o primeiro fluxo de transporte pode ser recuperado de um disco Blu-ray e o segundo fluxo de transporte pode ser de uma transmissão de rádio). A fonte principal que fornece o primeiro fluxo de transporte pode ser uma broadcast, ou sinal multicast, enquanto a segunda fonte que fornece o segundo fluxo de transporte pode ser aquele direcionado a um indivíduo específico.[0204] Consequently, the second transport stream may possibly be recoverable from or through a different source than the first transport stream. In the case of files, the transport streams can be from different files. A different source for the second transport stream may also be, for example, a different medium (e.g., the first transport stream may be retrieved from a Blu-ray Disc and the second transport stream may be from a radio broadcast). ). The primary source providing the first transport stream may be a broadcast, or multicast signal, while the second source providing the second transport stream may be one directed to a specific individual.

[0205] Entretanto, em muitas modalidades, os dados de áudio alternativos serão parte do mesmo fluxo de transporte.[0205] However, in many embodiments, the alternative audio data will be part of the same transport stream.

[0206] Especificamente, o aparelho que gera o fluxo de transporte, em algumas modalidades inclui os dados de áudio alternativos em um fluxo elementar diferente no fluxo de transporte. Isso pode proporcionar uma abordagem particularmente eficiente e pode, em muitos cenários, facilitar a operação e sinalização, e pode proporcionar fluxo de transporte mais eficiente. Em tais modalidades, um receptor pode extrair os dados de áudio alternativos pela identificação de pacotes de dados com um PID correspondente ao fluxo elementar no qual os dados de áudio alternativos estão compreendidos.[0206] Specifically, the apparatus that generates the transport stream, in some embodiments includes the alternative audio data in a different elementary stream in the transport stream. This can provide a particularly efficient approach and can, in many scenarios, facilitate operation and signaling, and can provide more efficient transport flow. In such embodiments, a receiver may extract the alternative audio data by identifying data packets with a PID corresponding to the elementary stream in which the alternative audio data is comprised.

[0207] Um exemplo de tal cenário é mostrado na Figura 5. No exemplo, um fluxo elementar com um PID de 1, compreende dois componentes de áudio, a saber, um componente de áudio obrigatório correspondente a sons de fundo, e o componente de áudio substituível, correspondente a um idioma padrão. O componente de áudio obrigatório é representado por dados de áudio em pacotes de dados referidos como BG1p1, BG1p2 etc. e o componente de áudio substituível é fornecido por dados de áudio em pacotes de dados referidos como OA C. Além disso, um segundo fluxo elementar com um PID de 2 compreende um componente de áudio alternativo representado por dados de áudio em pacotes de dados referidos como OA A. Um terceiro fluxo elementar com um PID de 3 também fornece um componente de áudio alternativo representado por dados de áudio em pacotes de dados referidos como OA B. Deve-se observar que na Figura 5, os pacotes de dados para OA A e OA B são mostrados como sendo simultâneos aos pacotes de dados para OA C. Isso pode refletir cenários nos quais os pacotes de dados podem ser incluídos simultaneamente (por exemplo, com intercalação de canal nos pacotes de dados). Entretanto, também deve-se considerar que em muitas modalidades, os pacotes de dados podem ser multiplexados no tempo. Os dois componentes de áudio alternativos podem corresponder a diferentes idiomas que podem substituir o idioma do componente de áudio substituível. Especificamente, conforme ilustrado na Figura 5, os dados de áudio alternativos de fluxo elementar PID 2 podem substituir os dados de áudio substituíveis do fluxo elementar OA C.[0207] An example of such a scenario is shown in Figure 5. In the example, an elementary stream with a PID of 1, comprises two audio components, namely, a mandatory audio component corresponding to background sounds, and the obligatory audio component corresponding to background sounds. replaceable audio, corresponding to a default language. The mandatory audio component is represented by audio data in data packets referred to as BG1p1, BG1p2, etc. and the substitutable audio component is provided by audio data in data packets referred to as OA C. Furthermore, a second elementary stream with a PID of 2 comprises an alternative audio component represented by audio data in data packets referred to as OA A. A third elementary stream with a PID of 3 also provides an alternative audio component represented by audio data in data packets referred to as OA B. It should be noted that in Figure 5, the data packets for OA A and OA B are shown as being concurrent with the data packets for OA C. This may reflect scenarios in which data packets may be included simultaneously (for example, with channel interleaving in the data packets). However, it must also be considered that in many embodiments, data packets can be time multiplexed. The two alternate audio components can correspond to different languages that can override the language of the replaceable audio component. Specifically, as illustrated in Figure 5, PID 2 elementary stream substitutable audio data can replace the OA C elementary stream substitutable audio data.

[0208] Dessa forma, um renderizador pode extrair os dados de áudio de fundo (os dados de áudio obrigatórios) do fluxo elementar PID 1 e decodificá-los para gerar um componente de áudio obrigatório correspondente a áudio de fundo. Além disso, o mesmo pode extrair os dados de áudio alternativos do fluxo elementar PID 2 e decodificá-los para gerar um componente de áudio alternativo correspondente a um dos idiomas dublados. Os dois componentes são então combinados para gerar o sinal de saída que é renderizado/reproduzido.[0208] In this way, a renderer can extract the background audio data (the mandatory audio data) from the PID 1 elementary stream and decode it to generate a mandatory audio component corresponding to background audio. Furthermore, it can extract alternative audio data from the PID 2 elementary stream and decode it to generate an alternative audio component corresponding to one of the dubbed languages. The two components are then combined to generate the output signal that is rendered/played.

[0209] Conforme indicado na Figura 5, os pacotes de dados para os dados de áudio substituíveis e os dados de áudio alternativos, não correspondem necessariamente um ao outro. Por exemplo, os mesmos podem ser codificados de maneira diferente (por exemplo, diferentes parâmetros de codificação, taxa de dados ou algoritmos de codificação) e podem corresponder especificamente a diferentes intervalos de tempo ou segmentos. Entretanto, se for usada, por exemplo, uma decodificação separada seguida pela combinação dos componentes de áudio, tais diferenças podem ser tratadas por meio de adaptação das diferentes trajetórias de decodificação e combinação dos sinais decodificados.[0209] As indicated in Figure 5, the data packets for the substitutable audio data and the alternative audio data do not necessarily correspond to each other. For example, they may be encoded differently (e.g., different encoding parameters, data rate, or encoding algorithms) and may specifically correspond to different time slots or segments. However, if, for example, separate decoding followed by combining the audio components is used, such differences can be handled by adapting the different decoding paths and combining the decoded signals.

[0210] Em algumas modalidades, o segundo fluxo elementar pode não apenas compreender o componente de áudio alternativo, como pode compreender também, por exemplo, múltiplos componentes de áudio alternativos.[0210] In some embodiments, the second elementary stream may not only comprise the alternative audio component, but may also comprise, for example, multiple alternative audio components.

[0211] De fato, em algumas modalidades, o segundo fluxo elementar pode compreender adicionalmente dados de áudio obrigatórios para uma representação diferente para o item de conteúdo. Dessa forma, em algumas modalidades, o segundo fluxo elementar pode ser um fluxo elementar que forneça, por si só, uma representação de áudio diferente para o item de conteúdo. Consequentemente, um receptor pode ser capaz de gerar uma trilha sonora para o item de conteúdo usando apenas os dados de áudio do segundo fluxo elementar. Por exemplo, o segundo fluxo elementar pode compreender dados de áudio obrigatórios e dados de áudio substituíveis para uma representação de áudio alternativo para o item de conteúdo. Em tal exemplo, os dados de áudio alternativos para o primeiro fluxo elementar (e, assim, a primeira representação) pode ser, por exemplo, dados de áudio substituíveis do segundo fluxo elementar (isto é, para a segunda representação).[0211] Indeed, in some embodiments, the second elementary stream may additionally comprise audio data required for a different representation for the content item. Thus, in some embodiments, the second elementary stream may be an elementary stream that itself provides a different audio representation for the content item. Consequently, a receiver may be able to generate a soundtrack for the content item using only the audio data from the second elementary stream. For example, the second elementary stream may comprise mandatory audio data and substitutable audio data for an alternative audio representation for the content item. In such an example, the alternative audio data for the first elementary stream (and thus the first representation) may be, for example, substitutable audio data from the second elementary stream (i.e., for the second representation).

[0212] Em algumas modalidades, os dados de áudio alternativos podem ser fornecidos no próprio primeiro fluxo elementar, isto é, ele pode ser parte do mesmo fluxo elementar que inclui os dados de áudio obrigatórios e os dados de áudio substituíveis. Dessa forma, o aparelho da Figura 3 pode ser disposto de modo a incluir dados de áudio alternativos no primeiro fluxo elementar por multiplexação no tempo de pacotes de dados, inclusive dados de áudio alternativos no fluxo de transporte, sendo que o PID desses pacotes de dados é o mesmo para os pacotes de dados com os dados de áudio obrigatórios e dados de áudio substituíveis. O aparelho da Figura 4 pode, como um padrão, extrair os dados de áudio dos pacotes de dados que compreendem os dados de áudio obrigatórios e os dados de áudio substituíveis e prosseguir para gerar o sinal de áudio de saída a partir desses dados. Entretanto, por exemplo, em resposta a dados inseridos pelo usuário, o aparelho pode, em vez disso, extrair os dados de áudio alternativos dos pacotes de dados adequados e gerar o sinal de saída de áudio usando esses dados, ao invés dos dados de áudio substituíveis.[0212] In some embodiments, the alternative audio data may be provided in the first elementary stream itself, that is, it may be part of the same elementary stream that includes the mandatory audio data and the replaceable audio data. In this way, the apparatus of Figure 3 can be arranged to include alternative audio data in the first elementary stream by time multiplexing data packets, including alternative audio data in the transport stream, the PID of these data packets being It is the same for data packets with mandatory audio data and replaceable audio data. The apparatus of Figure 4 may, as a standard, extract the audio data from the data packets comprising the mandatory audio data and the replaceable audio data and proceed to generate the output audio signal from this data. However, for example, in response to data input by the user, the device may instead extract alternative audio data from the appropriate data packets and generate the audio output signal using this data, rather than the audio data. replaceable.

[0213] Um exemplo de tal abordagem é mostrado na Figura 6, onde o primeiro fluxo elementar compreende pacotes de dados com dados de áudio obrigatórios (BG1p1...), com dados de áudio substituíveis (OA A) e com dados de áudio alternativos (OA B, OA C). No exemplo, os dados de áudio obrigatórios são extraídos para gerar o componente de áudio obrigatório, e os dados de pacotes de dados OA B são extraídos e decodificados para gerar um componente de áudio alternativo ao invés dos dados de áudio substituíveis padrão. O áudio de saída é gerado por meio da combinação do componente de áudio obrigatório decodificado e componente de áudio alternativo decodificado.[0213] An example of such an approach is shown in Figure 6, where the first elementary stream comprises data packets with mandatory audio data (BG1p1...), with replaceable audio data (OA A) and with alternative audio data (OA B, OA C). In the example, the mandatory audio data is extracted to generate the mandatory audio component, and the OA B data packet data is extracted and decoded to generate an alternative audio component instead of the default substitutable audio data. The output audio is generated by combining the decoded mandatory audio component and decoded alternate audio component.

[0214] A descrição anterior focou em exemplos onde os dados de áudio alternativos correspondem a diferentes componentes de áudio, como diferentes idiomas. Entretanto, deve-se considerar que a abordagem descrita não está limitada a tal exemplo.[0214] The previous description focused on examples where alternative audio data corresponds to different audio components, such as different languages. However, it should be considered that the described approach is not limited to such an example.

[0215] De fato, em algumas modalidades, os dados de áudio substituíveis e os dados de áudio alternativos podem representar o mesmo conteúdo de áudio codificado com o uso de diferentes características de codificação. Especificamente, os dados de áudio substituíveis e os dados de áudio alternativos podem corresponder ao mesmo conteúdo de áudio e, especificamente, mesmo componente de áudio, porém codificados com diferentes taxas de bits.[0215] In fact, in some embodiments, the substitutable audio data and the alternative audio data may represent the same audio content encoded using different encoding characteristics. Specifically, the substitutable audio data and the alternative audio data may correspond to the same audio content and, specifically, the same audio component, but encoded at different bitrates.

[0216] Isso pode fornecer maior flexibilidade e pode possibilitar, por exemplo, que um receptor receba um fluxo de transporte e gere, eficientemente e com baixa complexidade, um fluxo de transporte correspondente ao mesmo conteúdo de áudio, mas com uma taxa de dados diferente. Dessa forma, a seleção entre os dados de áudio substituíveis e os dados de áudio alternativos, pode depender de características do próprio dado em si, como dependentes da taxa de dados específica e a taxa de dados desejada. A abordagem pode possibilitar maior flexibilidade e pode possibilitar, especificamente, uma adaptação flexível das características de um fluxo de transporte.[0216] This can provide greater flexibility and can enable, for example, a receiver to receive a transport stream and efficiently and with low complexity generate a transport stream corresponding to the same audio content but at a different data rate . Thus, the selection between substitutable audio data and alternative audio data may depend on characteristics of the data itself, such as dependent on the specific data rate and the desired data rate. The approach can enable greater flexibility and can specifically enable flexible adaptation of the characteristics of a transport flow.

[0217] Em algumas modalidades, os dados de áudio alternativos podem ser, por exemplo, um objeto de áudio, como um objeto de áudio SAOC, representando múltiplos sub-objetos.[0217] In some embodiments, the alternative audio data may be, for example, an audio object, such as a SAOC audio object, representing multiple sub-objects.

[0218] Em algumas modalidades, o aparelho da Figura 3 pode ser disposto de modo a incluir a renderização de dados de controle no fluxo de transporte. Os dados de controle de renderização podem especificar um parâmetro de renderização necessário, desejado ou sugerido para uma renderização do áudio do fluxo de transporte. Por exemplo, os dados de controle de renderização podem fornecer uma indicação de um nível absoluto ou relativo dos componentes de áudio.[0218] In some embodiments, the apparatus of Figure 3 may be arranged to include the rendering of control data in the transport stream. The rendering control data can specify a required, desired, or suggested rendering parameter for a rendering of the transport stream audio. For example, rendering control data may provide an indication of an absolute or relative level of audio components.

[0219] Os dados de controle de renderização podem fornecer, especificamente um parâmetro de renderização diferente para quando os dados de áudio substituíveis forem usados de quando os dados de áudio alternativos são usados.[0219] The rendering control data may specifically provide a different rendering parameter for when substitutable audio data is used than when alternative audio data is used.

[0220] Os dados de controle de renderização podem descrever, por exemplo, um ganho relativo ou nível de sinal para o sinal de saída quando o áudio padrão é renderizado, isto é, quando o sinal de saída é gerado com base nos dados de áudio obrigatórios e dados de áudio. Eles podem descrever adicionalmente, por exemplo, um ganho relativo ou nível de sinal diferente para o sinal de saída quando o áudio alternativo é renderizado, isto é, quando o sinal de saída é gerado com base nos dados de áudio obrigatórios e dados de áudio alternativos.[0220] The rendering control data may describe, for example, a relative gain or signal level for the output signal when standard audio is rendered, that is, when the output signal is generated based on the audio data mandatory and audio data. They may additionally describe, for example, a relative gain or different signal level for the output signal when alternative audio is rendered, that is, when the output signal is generated based on required audio data and alternative audio data. .

[0221] Tal abordagem pode ser usada, por exemplo, para fornecer diferenças entre a renderização, por exemplo, o áudio pode ser renderizado mais alto, quando o sinal de áudio padrão é renderizado, do que quando o sinal de áudio alternativo é renderizado. Entretanto, a abordagem pode também ser usada para homogeneizar o sinal de saída. Por exemplo, em situações nas quais o nível do componente de áudio substituível é mais alto do que o nível do componente de áudio alternativo, os dados de controle de renderização podem aumentar o ganho total do sinal de saída ao usar o componente de áudio alternativo, resultando na redução da diferença de nível.[0221] Such an approach can be used, for example, to provide differences between rendering, for example, audio can be rendered louder, when the standard audio signal is rendered, than when the alternative audio signal is rendered. However, the approach can also be used to homogenize the output signal. For example, in situations where the level of the replaceable audio component is higher than the level of the alternate audio component, the render control data can increase the total gain of the output signal when using the alternate audio component, resulting in the reduction of the level difference.

[0222] Em algumas modalidades, os dados de controle de renderização podem descrever diferentes renderizações para o componente de áudio substituível e o componente de áudio alternativo. Por exemplo, o ganho para o componente de áudio substituível pode ser diferente do ganho para o componente de áudio alternativo. Isso pode, por exemplo, possibilitar uma customização. Como um exemplo específico, as broadcasts de TV em idioma alemão podem tender a ter níveis relativos mais altos de som do comentarista em relação a ruídos da multidão para eventos esportivos do que as broadcasts de TV em idioma inglês. Consequentemente, ganhos diferentes podem ser ajustados para dois componentes de idiomas diferentes, de modo que o mesmo efeito possa ser fornecido por um único fluxo de transporte com idiomas alternativos.[0222] In some embodiments, the rendering control data may describe different renderings for the replaceable audio component and the alternate audio component. For example, the gain for the replaceable audio component may be different from the gain for the alternate audio component. This can, for example, enable customization. As a specific example, German-language TV broadcasts may tend to have higher relative levels of commentator sound relative to crowd noise for sporting events than English-language TV broadcasts. Consequently, different gains can be adjusted for two different language components so that the same effect can be provided by a single transport stream with alternative languages.

[0223] Em algumas modalidades, os dados de controle de renderização podem fornecer diferentes parâmetros de renderização para (possivelmente apenas) os dados de áudio obrigatórios/componente de áudio obrigatório, dependendo do sinal ser gerado com base nos dados de áudio substituíveis/componente de áudio substituível ou nos dados de áudio alternativos/componente de áudio alternativo.[0223] In some embodiments, the rendering control data may provide different rendering parameters for (possibly only) the required audio data/required audio component, depending on whether the signal is generated based on the replaceable audio data/required audio component. replaceable audio or alternative audio data/alternative audio component.

[0224] Para possibilitar que um receptor utilize completamente o fluxo de transporte fornecido, o transmissor pode incluir dados adicionais que podem sinalizar informação sobre os diferentes dados compreendidos no fluxo de transporte.[0224] To enable a receiver to fully utilize the provided transport stream, the transmitter may include additional data that may signal information about the different data comprised in the transport stream.

[0225] Especificamente, em algumas modalidades, o aparelho da Figura 3 pode ser disposto de modo a incluir uma indicação de que o primeiro fluxo elementar compreende dados de áudio substituíveis. Essa indicação pode ser fornecida, por exemplo, como parte de dados de configuração separados para o fluxo de transporte. Por exemplo, podem ser fornecidos pacotes de dados que compreendam pacotes de configuração que especificam os diferentes fluxos elementares do fluxo de transporte. Especificamente, podem ser fornecidos dados de configuração que incluam PMTs. Em tal caso, a parte da PMT que define o fluxo elementar individual pode ser melhorada para incluir também informações que definam quais componentes de áudio são representados no fluxo elementar, e especificamente, se o fluxo elementar individual compreende mais de um componente de áudio. Por exemplo, pode ser definido um marcador para indicar que um dado fluxo elementar compreende dados de áudio substituíveis.[0225] Specifically, in some embodiments, the apparatus of Figure 3 may be arranged to include an indication that the first elementary stream comprises replaceable audio data. This indication may be provided, for example, as part of separate configuration data for the transport stream. For example, data packets may be provided that comprise configuration packets that specify the different elementary flows of the transport stream. Specifically, configuration data that includes PMTs may be provided. In such a case, the part of the PMT that defines the individual elemental stream may be enhanced to also include information that defines which audio components are represented in the elemental stream, and specifically, whether the individual elemental stream comprises more than one audio component. For example, a marker may be defined to indicate that a given elementary stream comprises replaceable audio data.

[0226] Em algumas modalidades, pode ser gerado o fluxo de transporte para incluir dados de extração para os dados de áudio substituíveis no fluxo elementar. Tais dados de extração podem especificar, por exemplo, como os dados de áudio substituíveis podem ser identificados. Eles podem compreender, por exemplo, uma indicação de quais pacotes de dados incluem dados de áudio substituíveis e quais pacotes de dados incluem dados de áudio obrigatórios. A descrição pode ser fornecida, por exemplo, pela descrição dos componentes de áudio incluídos no fluxo elementar e associação de cada um a uma identidade. Cada pacote de dados pode incluir então uma identidade de componente de áudio no cabeçalho para indicar para qual componente de áudio o pacote de dados compreende dados de áudio. Os dados de extração podem fornecer a identidade de componente de áudio a cada componente de áudio, permitindo assim que o receptor extraia a informação relevante.[0226] In some embodiments, the transport stream may be generated to include extraction data for the substitutable audio data in the elementary stream. Such extraction data may specify, for example, how substitutable audio data may be identified. They may comprise, for example, an indication of which data packets include substitutable audio data and which data packets include mandatory audio data. The description can be provided, for example, by describing the audio components included in the elementary stream and associating each with an identity. Each data packet may then include an audio component identity in the header to indicate for which audio component the data packet comprises audio data. The extraction data can provide the audio component identity to each audio component, thereby allowing the receiver to extract the relevant information.

[0227] Especificamente, para um Fluxo (stream) de Transporte MPEG-2, o descritor de áudio suplementar pode ser estendido com a definição de um objeto. Um exemplo da sintaxe de um descritor de áudio suplementar é fornecido na Figura 7. A Figura 8 ilustra o uso convencional, respectivamente, de itens de dados mix_type e editorial_classification[0227] Specifically, for an MPEG-2 Transport stream, the supplemental audio descriptor can be extended by defining an object. An example of the syntax of a supplemental audio descriptor is provided in Figure 7. Figure 8 illustrates the conventional use of, respectively, mix_type and editorial_classification data items

[0228] Nesse exemplo, a estrutura de dadosmix_type data pode ser mudada a partir daquela da Figura 8 para aquela da Figura 9. O editorial_classification pode ser mudado para aquele da Figura 10. Além do mais, um componente descritor AAC, como aquele da Figura 11, pode ser usado.[0228] In this example, the mix_type data data structure can be changed from that of Figure 8 to that of Figure 9. The editorial_classification can be changed to that of Figure 10. Furthermore, an AAC descriptor component, such as that in Figure 11, can be used.

[0229] Esse exemplo mostra que o bit reservado, sob a estrutura de dados editorial_classification, pode ser usado para indicar se o áudio contém objetos que podem ser manipulados. No caso em que o mixed_type é igual a 1, o valor do bit de objeto 1 indica que a trilha de áudio é um objeto de fundo e precisa ser mixada com um objeto. Se o bit do objeto for 0, que é o caso atual, isso indica que a trilha de áudio está completa e pode ser complementada com um objeto ou um outro fluxo mix_type 0.[0229] This example shows that the reserved bit, under the editorial_classification data structure, can be used to indicate whether the audio contains objects that can be manipulated. In the case where the mixed_type is equal to 1, the object bit value 1 indicates that the audio track is a background object and needs to be mixed with an object. If the object bit is 0, which is the current case, this indicates that the audio track is complete and can be supplemented with an object or another mix_type 0 stream.

[0230] Com a estrutura de dados editorial_classification, o use-case de um objeto substituível pode ser sinalizado. A identificação daquele objeto substituível pode ser colocada no descritor AAC. O único sinal que precisa ser dado neste nível é a identificação de que existe um objeto substituível.[0230] With the editorial_classification data structure, the use-case of a replaceable object can be signaled. The identification of that replaceable object can be placed in the AAC descriptor. The only signal that needs to be given at this level is the identification that a replaceable object exists.

[0231] A extensão do descritor AAc pode incluir, especificamente, um enlace de objetos com um descritor por objeto descrevendo seus atributos, como especificamente: - O idioma de um objeto. - Substituibilidade: Isso pode sinalizar que o objeto é o objeto padrão no fluxo e pode ser substituído por um outro objeto (e opcionalmente, pode-se incluir um enlace com aquele objeto alternativo). - Se este é um objeto que um usuário possa selecionar para adicionar ou escolher deixar de fora. Por exemplo, ele pode ser uma trilha sonora especial para um portador de deficiência ou conter comentário especial. Isso dá a um operador a possibilidade de oferecer uma trilha de comentário a um custo de largura de banda muito limitado. - Uma indicação de texto que pode ser exibida com o objeto para tornar claro para um usuário que ele é um objeto interativo. Por exemplo, pode ser possível para um usuário selecionar este objeto, colocá-lo em uma outra posição ou torná-lo mais alto ou suave, por exemplo. - Fornecer um enlace a um objeto de vídeo que esteja acoplado ao objeto de áudio. Um objeto interativo pode ter também a capacidade de ser movido junto com sua contraparte de vídeo. Por exemplo, pode ser possível “fazer zoom” de um objeto. O zoom pode ser visualizado pelo objeto de vídeo e o ruído pelo objeto de áudio. Então, o usuário tem a ilusão de que o objeto, de fato, está mais perto, porque apenas o áudio daquele objeto fica mais alto.[0231] The AAc descriptor extension may specifically include a link of objects with a descriptor per object describing its attributes, such as specifically: - The language of an object. - Replaceability: This can signal that the object is the default object in the flow and can be replaced by another object (and optionally, a link can be included with that alternative object). - Whether this is an object that a user can select to add or choose to leave out. For example, it could be a special soundtrack for a person with a disability or contain a special commentary. This gives an operator the ability to offer a commentary track at a very limited bandwidth cost. - A text indication that can be displayed with the object to make it clear to a user that it is an interactive object. For example, it may be possible for a user to select this object, place it in a different position or make it louder or softer, for example. - Provide a link to a video object that is coupled to the audio object. An interactive object may also have the ability to be moved along with its video counterpart. For example, it may be possible to “zoom in” on an object. Zoom can be viewed by the video object and noise by the audio object. So, the user has the illusion that the object is, in fact, closer, because only the audio from that object becomes louder.

[0232] Além do mais, um objeto no cabeçalho de carga útil (UsacConfig) pode ser estendido com um identificador único através do descritor de metadados. Esse identificador pode ser incluído no descritor na PMT para possibilitar a identificação do objeto. Esse identificador pode ser também uma descrição XML em um arquivo que descreve o conteúdo de áudio.[0232] Furthermore, an object in the payload header (UsacConfig) can be extended with a unique identifier through the metadata descriptor. This identifier can be included in the descriptor in the PMT to enable object identification. This identifier can also be an XML description in a file that describes the audio content.

[0233] A Figura 12 ilustra como um objeto pode ser identificado em UsacConfig.[0233] Figure 12 illustrates how an object can be identified in UsacConfig.

[0234] A Figura 13 ilustra um exemplo de uma sintaxe de um descritor de objeto para possibilitar que um objeto delegue seu conteúdo a um objeto SAOC.[0234] Figure 13 illustrates an example of an object descriptor syntax to enable an object to delegate its content to a SAOC object.

[0235] Em muitas modalidades, o fluxo de dados do item de conteúdo audiovisual pode ter, consequentemente, dados, inclusive dados audiovisuais, dados de controle, metadados etc., estruturados em um arranjo hierárquico.[0235] In many embodiments, the data stream of the audiovisual content item may consequently have data, including audiovisual data, control data, metadata, etc., structured in a hierarchical arrangement.

[0236] Especificamente, o fluxo de dados do item de conteúdo audiovisual (especificamente um fluxo de transporte) pode compreender um descritor de item de conteúdo de fluxo de dados que define os itens de conteúdo que estão incluídos no fluxo de dados do item de conteúdo audiovisual. O descritor de item de conteúdo de fluxo de dados pode ser atribuído, especificamente, a um identificador de pacote predeterminado, que pode ser especificamente padronizado, e, dessa forma, será conhecido na extremidade de transmissão e na extremidade de recepção. Dessa forma, um receptor pode detectar os pacotes de dados com o identificador de pacote predeterminado e pode, a partir desses pacotes de dados, determinar quais itens de conteúdo estão incluídos no fluxo de dados do item de conteúdo audiovisual. Por exemplo, para um fluxo de transporte MPEG, o fluxo de transporte pode incluir uma PAT que esteja incluída em pacotes de dados com um PID predeterminado de 0.[0236] Specifically, the audiovisual content item data stream (specifically a transport stream) may comprise a data stream content item descriptor that defines the content items that are included in the content item data stream audio-visual. The data stream content item descriptor may be specifically assigned to a predetermined packet identifier, which may be specifically standardized, and thus will be known at the transmitting end and the receiving end. In this way, a receiver can detect the data packets with the predetermined packet identifier and can, from these data packets, determine which content items are included in the data stream of the audiovisual content item. For example, for an MPEG transport stream, the transport stream may include a PAT that is included in data packets with a predetermined PID of 0.

[0237] O descritor de item de conteúdo de fluxo de dados pode fornecer, especificamente para cada item de conteúdo, um apontador para uma tabela de mapa de itens para o item de conteúdo. A tabela de mapa de item de conteúdo para um item de conteúdo pode compreender uma lista de identificadores de pacote de fluxo de dados audiovisuais para pacotes de dados para fluxos (streams) de dados ligados ao item de conteúdo. Dessa forma, a tabela de mapa de item de conteúdo compreende um identificador de pacote para cada fluxo de dados audiovisuais que fornece dados audiovisuais para o item de conteúdo, incluindo, por exemplo, dados de vídeo, dados de áudio obrigatórios, dados de áudio substituíveis, dados de áudio alternativos e dados de áudio adicionais. Além disso, a tabela de mapa de item de conteúdo pode compreender apontadores e, especificamente, identificadores de pacote para fluxos de dados que fornecem, por exemplo, metadados, dados de controle etc. para o item de conteúdo. A tabela de mapa de item de conteúdo pode ser uma tabela de mapa de programa.[0237] The data flow content item descriptor may provide, specifically for each content item, a pointer to an item map table for the content item. The content item map table for a content item may comprise a list of audiovisual data stream packet identifiers for data packets for data streams linked to the content item. In this way, the content item map table comprises a packet identifier for each audiovisual data stream that provides audiovisual data for the content item, including, for example, video data, required audio data, replaceable audio data , alternate audio data, and additional audio data. Additionally, the content item map table may comprise pointers and, specifically, package identifiers to data streams that provide, for example, metadata, control data, etc. for the content item. The content item map table can be a program map table.

[0238] Especificamente, para um fluxo de dados do tipo MPEG, a PAT pode incluir, para cada item de conteúdo, um identificador de pacote para uma PMT. A PMT para um programa/item de conteúdo pode incluir então um PID para cada fluxo de dados elementar que fornece dados audiovisuais para o programa.[0238] Specifically, for an MPEG-type data stream, the PAT may include, for each content item, a packet identifier for a PMT. The PMT for a program/content item may then include a PID for each elementary data stream that provides audiovisual data to the program.

[0239] Consequentemente, os fluxos (streams) de dados audiovisuais são fornecidos em pacotes de dados com identificadores de pacote correspondentes àqueles indicados na tabela de mapa de item de conteúdo. Por exemplo, conforme anteriormente descrito, os dados de áudio obrigatórios e substituíveis podem ser fornecidos em um fluxo de dados audiovisuais ao dotar os dados de áudio nos pacotes de um identificador de pacote, os primeiros dados alternativos podendo ser fornecidos em outro fluxo de dados audiovisuais por meio da provisão dos dados de áudio em pacotes com um outro identificador de pacote, os segundos dados alternativos podem ser fornecidos em outro fluxo de dados audiovisuais pela provisão dos dados de áudio em pacotes com um terceiro identificador de pacote etc. A Tabela de mapa de item de conteúdo é gerada de modo a incluir os identificadores de pacote dos respectivos fluxos de dados audiovisuais.[0239] Accordingly, audiovisual data streams are provided in data packets with packet identifiers corresponding to those indicated in the content item map table. For example, as previously described, mandatory and substitutable audio data may be provided in one audiovisual data stream by endowing the audio data in the packets with a packet identifier, the first alternative data may be provided in another audiovisual data stream. by providing the audio data in packets with another packet identifier, the second alternative data may be provided in another audiovisual data stream by providing the audio data in packets with a third packet identifier, etc. The Content Item Map Table is generated to include the bundle identifiers of the respective audiovisual data streams.

[0240] A abordagem fornece um alto grau de flexibilidade e possibilita que uma fonte gere fluxos (streams) de dados de item de conteúdo audiovisual adequados ao cenário particular e que forneçam os itens de conteúdo desejado de uma forma desejável. A abordagem pode ainda facilitar substancialmente a extração de dados por um receptor. Especificamente, um receptor essencialmente só precisa monitorar os identificadores de pacote para selecionar os dados necessários e pode simplesmente ignorar todos os pacotes de dados que não contenham dados necessários.[0240] The approach provides a high degree of flexibility and enables a source to generate audiovisual content item data streams that are suitable for the particular scenario and that provide the desired content items in a desirable form. The approach can also substantially facilitate data extraction by a receiver. Specifically, a receiver essentially only needs to monitor the packet identifiers to select the required data and can simply ignore all data packets that do not contain required data.

[0241] Por exemplo, um receptor pode inicialmente monitorar os pacotes recebidos para o identificador de pacote do descritor de item de conteúdo do fluxo de dados, isto é, especificamente, pode monitorar o PID predeterminado de PAT (PID 0 no caso de MPEG).[0241] For example, a receiver may initially monitor received packets for the packet identifier of the content item descriptor of the data stream, that is, specifically, it may monitor the predetermined PID of PAT (PID 0 in the case of MPEG). .

[0242] Quando isso é detectado, o receptor extrai os dados e seleciona o item de conteúdo desejado. O identificador de pacote para a tabela de mapa de item de conteúdo, especificamente o PID para PMT para MPEG, é extraído então para esse item de conteúdo.[0242] When this is detected, the receiver extracts the data and selects the desired content item. The packet identifier for the content item map table, specifically the PID for PMT for MPEG, is then extracted for that content item.

[0243] Em seguida, o receptor faz uma varredura por pacotes de dados com esse identificador de pacote. Os dados para esses pacotes de dados são extraídos, fornecendo assim os identificadores de pacote para os fluxos de dados audiovisuais que compreendem dados para o item de conteúdo. Então, o receptor pode prosseguir para realizar a varredura dos pacotes de dados que contêm esses identificadores, ignorando todos os outros pacotes de dados. A abordagem em particular possibilita multiplexação e de-multiplexação prática e de baixa complexidade de dados audiovisuais.[0243] The receiver then scans for data packets with that packet identifier. The data for these data packets is extracted, thereby providing the packet identifiers for the audiovisual data streams that comprise data for the content item. Then, the receiver can proceed to scan the data packets that contain these identifiers, ignoring all other data packets. The approach in particular enables practical and low-complexity multiplexing and de-multiplexing of audiovisual data.

[0244] Dessa forma, a abordagem fornece uma abordagem de baixa complexidade e de poucos recursos para extrair dados relevantes de fluxos (streams) de dados de item de conteúdo audiovisual.[0244] In this way, the approach provides a low-complexity, low-resource approach to extracting relevant data from audiovisual content item data streams.

[0245] Entretanto, em algumas modalidades, o fluxo de dados do item de conteúdo audiovisual pode ser gerado para possibilitar que vários fluxos de dados audiovisuais sejam tratados como um único fluxo de dados audiovisuais. Especificamente, ao invés de usar identificadores de pacote padrão, a abordagem pode usar uma abordagem de identificação combinada ou concatenada. Especificamente, um fluxo de dados audiovisuais pode ser associado tanto a um identificador primário quanto a um identificador secundário, sendo que o identificador primário pode ser um identificador em comum para ao menos dois dos fluxos de dados audiovisuais.[0245] However, in some embodiments, the audiovisual content item data stream may be generated to enable multiple audiovisual data streams to be treated as a single audiovisual data stream. Specifically, instead of using standard package identifiers, the approach may use a combined or concatenated identification approach. Specifically, an audiovisual data stream may be associated with both a primary identifier and a secondary identifier, with the primary identifier being an identifier common to at least two of the audiovisual data streams.

[0246] O identificador primário pode ser, especificamente, um identificador de pacote de fluxo de dados comuns, isto é, ele pode ser um identificador de pacote que identifica um fluxo de dados (combinado). Como o identificador primário é comum para uma pluralidade de fluxos (streams) de dados audiovisuais, o identificador primário pode ser considerado a definir um fluxo de dados audiovisuais comum ou combinado que é uma combinação de todos os fluxos (streams) de dados audiovisuais que compartilham o identificador primário.[0246] The primary identifier may specifically be a common data stream packet identifier, that is, it may be a packet identifier that identifies a (combined) data stream. Because the primary identifier is common to a plurality of audiovisual data streams, the primary identifier can be considered to define a common or combined audiovisual data stream that is a combination of all audiovisual data streams that share the primary identifier.

[0247] Em muitas modalidades, o identificador primário está incluído na tabela de mapa de item de conteúdo. Dessa forma, a tabela de mapa de item de conteúdo é gerada de modo a incluir o identificador primário e, assim, a tabela de mapa de item de conteúdo fornece um apontador para um fluxo de dados único que é um fluxo de dados combinado de uma pluralidade de fluxos de dados audiovisuais individuais.[0247] In many embodiments, the primary identifier is included in the content item map table. In this way, the content item map table is generated to include the primary identifier, and thus the content item map table provides a pointer to a single data stream that is a combined data stream from a plurality of individual audiovisual data streams.

[0248] De fato, em muitas modalidades, o aparelho da Figura 3 pode ser disposto de modo a gerar a tabela de mapa de itens de conteúdo para incluir apenas um único identificador primário para todos os fluxos (streams) de dados audiovisuais compreendendo áudio, ou, certamente, para todos os fluxos (streams) de dados audiovisuais, para o item de conteúdo representado pela tabela de mapa de item de conteúdo.[0248] Indeed, in many embodiments, the apparatus of Figure 3 may be arranged to generate the content item map table to include only a single primary identifier for all audiovisual data streams comprising audio, or, indeed, for all audiovisual data streams, for the content item represented by the content item map table.

[0249] Na verdade, em algumas modalidades, a tabela de mapa de item de conteúdo pode ser gerada de modo a incluir apenas um identificador de pacote de fluxo de dados audiovisuais para o item de conteúdo na tabela de mapa de item de conteúdo, ou de modo a incluir apenas um identificador de pacote de fluxo de dados audiovisuais para dados de áudio para o item de conteúdo na tabela de mapa de item de conteúdo. Dessa forma, para um dado item de conteúdo, o identificador de pacote comum representa todo o conteúdo de áudio ou audiovisual para o item de conteúdo e, de fato, o item de conteúdo pode ser processado com base no identificador primário, como se compreendesse apenas um único fluxo de dados audiovisuais (ou um único fluxo de dados audiovisuais para áudio).[0249] In fact, in some embodiments, the content item map table may be generated so as to include only an audiovisual data stream packet identifier for the content item in the content item map table, or to include only an audiovisual data stream packet identifier for audio data for the content item in the content item map table. In this way, for a given content item, the common bundle identifier represents all audio or audiovisual content for the content item, and in fact the content item can be processed based on the primary identifier as if it comprised only a single audiovisual data stream (or a single audiovisual data stream for audio).

[0250] Como um exemplo específico, para um fluxo de transporte do tipo MPEG, a PMT para um item de conteúdo pode ser gerada de modo a incluir apenas um PID para todos os fluxos elementares de áudio, ou, para todos os fluxos elementares de áudio ou vídeo, para o item de conteúdo. Dessa forma, o item de conteúdo será ligado apenas a um único PID para todo áudio ou para todo áudio e vídeo.[0250] As a specific example, for an MPEG-type transport stream, the PMT for a content item may be generated to include only one PID for all elementary audio streams, or, for all elementary audio streams, audio or video, for the content item. This way, the content item will only be bound to a single PID for all audio or for all audio and video.

[0251] Consequentemente, em algumas modalidades, o fluxo de dados audiovisual pode parecer, para dispositivos de processamento como receptores, multiplexadores, de- multiplexadores etc., ter menos fluxos de dados audiovisuais do que é realmente o caso. Especificamente, o fluxo de dados audiovisuais pode parecer ter apenas um único fluxo elementar de áudio ou audiovisual para um item de conteúdo. Por exemplo, para o exemplo tipo MPEG, o fluxo de transporte pode aparecer para os circuitos de processamento como incluindo apenas um único fluxo elementar para todos os componentes de áudio (ou audiovisuais) para um item de conteúdo.[0251] Consequently, in some embodiments, the audiovisual data stream may appear, to processing devices such as receivers, multiplexers, de-multiplexers, etc., to have fewer audiovisual data streams than is actually the case. Specifically, the audiovisual data stream may appear to have only a single elementary audio or audiovisual stream for a content item. For example, for the MPEG-like example, the transport stream may appear to the processing circuitry as including only a single elementary stream for all audio (or audiovisual) components for a content item.

[0252] Entretanto, o fluxo de dados do item de conteúdo audiovisual pode compreender adicionalmente um identificador secundário para cada fluxo de dados audiovisuais individuais que tenha sido combinado no fluxo de dados audiovisuais comuns. O identificador secundário é único dentro do fluxo de dados audiovisuais comuns, isto é, dois fluxos (streams) de dados audiovisuais de um fluxo de dados audiovisuais comuns não terão o identificador secundário. Assim, o identificador secundário possibilita que o fluxo de dados audiovisuais individual seja identificado.[0252] However, the audiovisual content item data stream may additionally comprise a secondary identifier for each individual audiovisual data stream that has been combined into the common audiovisual data stream. The secondary identifier is unique within the common audiovisual data stream, that is, two audiovisual data streams of a common audiovisual data stream will not have the secondary identifier. Thus, the secondary identifier enables the individual audiovisual data stream to be identified.

[0253] O identificador secundário pode ser, em muitas modalidades, um identificador de pacote. Dessa forma, em muitas modalidades, os pacotes individuais podem ser representados por um identificador de pacote primário comum e por um identificador de pacote secundário. Cada pacote pode incluir um campo no qual o identificador de pacote primário comum esteja compreendido e um segundo campo no qual o identificador secundário individual esteja compreendido.[0253] The secondary identifier may be, in many embodiments, a packet identifier. Thus, in many embodiments, individual packets may be represented by a common primary packet identifier and a common secondary packet identifier. Each packet may include a field in which the common primary packet identifier is comprised and a second field in which the individual secondary identifier is comprised.

[0254] Dessa maneira, os pacotes podem ser processados pelo circuito, como de-multiplexadores, roteadores etc., como se os pacotes representassem um único fluxo de dados audiovisuais. Especificamente, ao incluir o PID comum na PMT e o campo PID dos pacotes de dados para um fluxo de transporte do tipo MPEG, o fluxo de transporte pode ser processado como se compreendesse apenas um único fluxo elementar de áudio ou audiovisual. A funcionalidade pode simplesmente processar, por exemplo, todos os pacotes de dados de áudio para o item de conteúdo da mesma maneira, e como se houvesse apenas um único fluxo elementar. Entretanto, ao mesmo tempo, funcionalidade equipada de modo adequado é capaz de acessar os fluxos de dados audiovisuais individuais e processá-los como fluxos de dados audiovisuais separados. Especificamente, tal funcionalidade pode avaliar adicionalmente o campo que compreende o identificador secundário e pode, consequentemente, selecionar como processar o pacote de dados. Especificamente, ela pode decidir se ignora ou processa os pacotes de dados, dependendo do fluxo de dados audiovisuais ser necessário para proporcionar a renderização desejada do item de conteúdo.[0254] In this way, packets can be processed by circuitry, such as de-multiplexers, routers, etc., as if the packets represented a single stream of audiovisual data. Specifically, by including the common PID in the PMT and the PID field of the data packets for an MPEG-type transport stream, the transport stream can be processed as if it comprised only a single elementary audio or audiovisual stream. The functionality may simply process, for example, all audio data packets for the content item in the same way, and as if there were only a single elementary stream. However, at the same time, appropriately equipped functionality is capable of accessing individual audiovisual data streams and processing them as separate audiovisual data streams. Specifically, such functionality may additionally evaluate the field comprising the secondary identifier and may accordingly select how to process the data packet. Specifically, it can decide whether to ignore or process the data packets, depending on whether the audiovisual data stream is necessary to provide the desired rendering of the content item.

[0255] Dessa forma, ao processar o fluxo de dados do item de conteúdo audiovisual, um receptor pode detectar os pacotes de dados corretos para um dado item de conteúdo com base no identificador de pacote primário/comum. Com base nas informações na tabela de mapa de item de conteúdo recebido, é possível, particularmente, identificar todos os pacotes de dados que pertencem ao fluxo de dados audiovisuais comuns e, assim, aos fluxos de dados audiovisuais individuais que formam o fluxo de dados audiovisuais comuns. Dessa forma, a extração de dados de áudio é baseada no identificador primário.[0255] In this way, when processing the audiovisual content item data stream, a receiver can detect the correct data packets for a given content item based on the primary/common packet identifier. Based on the information in the received content item map table, it is possible, in particular, to identify all data packets that belong to the common audiovisual data stream and thus to the individual audiovisual data streams that form the audiovisual data stream common. This way, audio data extraction is based on the primary identifier.

[0256] Em modalidades que usam tal abordagem de identificador de pacote em duas partes, o fluxo de transporte pode compreender dados adicionais que fornecem informações dos fluxos de dados audiovisuais individuais, incluindo informações dos identificadores secundários correspondentes e, geralmente, de características dos fluxos de dados audiovisuais individuais associados aos fluxos de dados audiovisuais individuais.[0256] In embodiments that use such a two-part packet identifier approach, the transport stream may comprise additional data that provides information of individual audiovisual data streams, including information of corresponding secondary identifiers and, generally, of characteristics of the streams. individual audiovisual data associated with individual audiovisual data streams.

[0257] Por exemplo, podem ser fornecidos dados que, para um dado identificador primário, listam todos os identificadores secundários dos fluxos de dados audiovisuais que compartilham o mesmo identificador primário. Os dados podem indicar adicionalmente características do fluxo de dados audiovisuais individuais, como, por exemplo, se ele compreende dados de áudio obrigatórios, dados de áudio substituíveis, dados de áudio adicionais, dados de áudio alternativos etc.[0257] For example, data may be provided that, for a given primary identifier, lists all secondary identifiers of the audiovisual data streams that share the same primary identifier. The data may additionally indicate characteristics of the individual audiovisual data stream, such as whether it comprises mandatory audio data, replaceable audio data, additional audio data, alternative audio data, etc.

[0258] Em algumas modalidades, tal informação pode ser fornecida dentro dos pacotes de dados do fluxo de dados audiovisuais comuns. Por exemplo, a intervalos regulares, pode ser fornecido um pacote de dados que inclua todas as informações referentes ao identificador secundário. Um receptor pode, inicialmente, detectar e extrair dados de todos os pacotes de dados compreendendo o identificador primário. Quando um pacote de dados com informações referentes ao uso do identificador secundário é recebido, essa informação pode ser extraída e usada pelo receptor para identificar os fluxos de dados audiovisuais individuais. Então, o mesmo pode comutar para considerar também os identificadores secundários dos pacotes de dados que compreendem o identificador de pacote primário e, especificamente, para extrair dados apenas de pacotes de dados que tenham os identificadores secundários desejados.[0258] In some embodiments, such information may be provided within data packets of the common audiovisual data stream. For example, at regular intervals, a data package may be provided that includes all information regarding the secondary identifier. A receiver can initially detect and extract data from all data packets comprising the primary identifier. When a data packet with information regarding the use of the secondary identifier is received, this information can be extracted and used by the receiver to identify individual audiovisual data streams. Then, it may switch to also consider the secondary identifiers of the data packets that comprise the primary packet identifier and, specifically, to extract data only from data packets that have the desired secondary identifiers.

[0259] Em outras modalidades, os dados podem ser fornecidos fora do fluxo de dados audiovisuais comuns e, de fato, a informação pode ser fornecida na tabela de mapa de item de conteúdo.[0259] In other embodiments, the data may be provided outside of the ordinary audiovisual data stream, and in fact the information may be provided in the content item map table.

[0260] Especificamente, para cada identificador comum ou primário, a tabela de mapa de item de conteúdo pode ser gerada para incluir uma pluralidade de identificadores de pacote secundários, onde cada identificador de pacote secundário identifica um fluxo de dados audiovisuais individuais dos fluxos de dados individuais do fluxo de dados audiovisuais comuns.[0260] Specifically, for each common or primary identifier, the content item map table may be generated to include a plurality of secondary packet identifiers, where each secondary packet identifier identifies an individual audiovisual data stream of the data streams of the common audiovisual data stream.

[0261] Por exemplo, em seguida à listagem do identificador primário, vários campos opcionais podem ser incluídos na tabela de mapa de item de conteúdo, onde cada campo opcional fornece um identificador secundário para um fluxo de dados audiovisuais individuais com o identificador primário comum. Se o identificador primário representar um único fluxo de dados audiovisuais que não seja uma combinação de fluxos de dados audiovisuais, nenhum campo opcional pode ser incluído. Cada campo opcional pode, em adição ao identificador de pacote secundário para um fluxo de dados audiovisuais individuais, compreender também metadados para o fluxo de dados audiovisuais, como dados que definem especificamente características dos dados audiovisuais do fluxo de dados audiovisuais (como, por exemplo, se contiver dados de áudio alternativos, dados de áudio obrigatórios, dados de áudio substituíveis ou dados de áudio adicionais).[0261] For example, following the listing of the primary identifier, several optional fields may be included in the content item map table, where each optional field provides a secondary identifier for an individual audiovisual data stream with the common primary identifier. If the primary identifier represents a single audiovisual data stream that is not a combination of audiovisual data streams, no optional fields may be included. Each optional field may, in addition to the secondary packet identifier for an individual audiovisual data stream, also comprise metadata for the audiovisual data stream, such as data that specifically defines characteristics of the audiovisual data of the audiovisual data stream (such as, e.g., if it contains alternative audio data, mandatory audio data, replaceable audio data, or additional audio data).

[0262] Especificamente, a tabela de mapa de itens de conteúdo pode ser modificada ou gerada para cada identificador primário incluir um conjunto de campos, com cada campo representando um fluxo de dados audiovisuais individuais combinados. Cada campo pode compreender, por exemplo, dados que representam:[0262] Specifically, the content item map table may be modified or generated for each primary identifier to include a set of fields, with each field representing a stream of individual combined audiovisual data. Each field may comprise, for example, data representing:

[0263] - um identificador secundário para o fluxo de dados audiovisuais individuais, e[0263] - a secondary identifier for the individual audiovisual data stream, and

[0264] - descritores para aquele fluxo de dados audiovisuais individuais.[0264] - descriptors for that individual audiovisual data stream.

[0265] Por exemplo, para uma abordagem tipo MPEG, a PMT pode compreender um único PID para todo o áudio para um item de conteúdo. Em seguida ao PID na PMT, pode haver um conjunto de campos que, para cada fluxo de dados audiovisuais individuais, forneça o identificador secundário e metadados que caracterizam o conteúdo daquele fluxo de dados audiovisuais individuais.[0265] For example, for an MPEG-like approach, the PMT may comprise a single PID for all audio for a content item. Following the PID in the PMT, there may be a set of fields that, for each individual audiovisual data stream, provide the secondary identifier and metadata that characterize the content of that individual audiovisual data stream.

[0266] Em algumas modalidades, os identificadores primários/comuns e os identificadores de pacote secundários podem ser fornecidos em um arranjo hierárquico. Por exemplo, um identificador de pacote primário pode ser fornecido em uma tabela de mapa de itens de conteúdo em um primeiro nível que será examinado por um receptor que esteja procurando fluxos elementares. Os identificadores de pacote secundários podem ser fornecidos em campos opcionais que são ligados ao identificador de pacote primário, como, por exemplo, incluindo-se uma lista de identificadores de pacote secundário para cada identificador de pacote primário. Em tais modalidades, o receptor, consequentemente, primeiro realizará a varredura da lista padrão de identificadores de pacote primário. Quando o fluxo elementar combinado desejado for identificado, o receptor pode prosseguir através da lista de identificadores de pacote secundários que são armazenados no identificador de pacote primário identificado. Dessa forma, os identificadores de pacote secundários são identificados em dependência do identificador de pacote primário correspondente.[0266] In some embodiments, primary/common identifiers and secondary packet identifiers may be provided in a hierarchical arrangement. For example, a primary packet identifier may be provided in a content item map table at a first level that will be examined by a receiver looking for elementary streams. Secondary packet identifiers may be provided in optional fields that are linked to the primary packet identifier, such as by including a list of secondary packet identifiers for each primary packet identifier. In such embodiments, the receiver will therefore first scan the standard list of primary packet identifiers. When the desired combined elementary stream is identified, the receiver can proceed through the list of secondary packet identifiers that are stored in the identified primary packet identifier. In this way, secondary package identifiers are identified in dependence on the corresponding primary package identifier.

[0267] Dessa forma, em algumas modalidades, pode ser usada uma estrutura telescópica dos identificadores de pacote primário e secundário. Por exemplo, uma PMT pode incluir uma lista de PIDs em um conjunto de campos dedicados e a lista pode incluir, por exemplo, apenas um único PID primário para um fluxo elementar combinado. Entretanto, a PMT pode compreender, além disso, uma segunda lista de PIDs secundários para os fluxos elementares individuais do fluxo elementar combinado. Esses PIDs secundários são fornecidos em campos de dados dedicados para PIDs secundários e são ligados ao PID primário. Dessa forma, o receptor só acessará os PIDs secundários com base no PID primário, e, de fato, o receptor diferenciará os PIDs primários e PIDs secundários.[0267] Thus, in some embodiments, a telescoping structure of the primary and secondary packet identifiers may be used. For example, a PMT may include a list of PIDs in a set of dedicated fields, and the list may include, for example, only a single primary PID for a combined elementary stream. However, the PMT may further comprise a second list of secondary PIDs for the individual elementary streams of the combined elementary stream. These secondary PIDs are provided in dedicated data fields for secondary PIDs and are linked to the primary PID. This way, the receiver will only access secondary PIDs based on the primary PID, and in fact, the receiver will differentiate between primary PIDs and secondary PIDs.

[0268] Entretanto, em outras modalidades, pode ser usada uma estrutura plana de identificadores de pacote primário e secundário. De fato, uma tabela de mapa de itens de conteúdo pode compreender uma lista de identificadores que pode conter tanto identificadores primários quanto secundários. Na verdade, a tabela de mapa de itens de conteúdo pode incluir lista simples de todos os possíveis fluxos de dados audiovisuais, incluindo tanto fluxos de dados audiovisuais combinados quanto fluxo de dados audiovisuais individuais. Além do mais, um dado fluxo de dados audiovisuais individuais pode ser representado pelo identificador de pacote secundário para o fluxo de dados audiovisuais individuais e pode também ser representado pelo identificador de pacote primário (isto é, a seleção de um ou outro identificador de pacote resultará na seleção do fluxo de dados audiovisuais). De fato, para cada fluxo de dados audiovisuais individuais, a tabela de mapa de itens de conteúdo pode incluir uma entrada para o identificador de pacote primário de qualquer fluxo de dados audiovisuais combinados a que o fluxo de dados audiovisuais individuais pertencer, assim como o identificador de pacote secundário para o fluxo individual. Dessa forma, neste exemplo, uma lista pode compreender, por exemplo, uma entrada com um identificador de pacote para todos os fluxos de dados audiovisuais, incluindo tanto fluxos de dados audiovisuais combinados quanto individuais.[0268] However, in other embodiments, a flat structure of primary and secondary packet identifiers may be used. In fact, a content item map table can comprise a list of identifiers that can contain both primary and secondary identifiers. In fact, the content item map table can include a simple list of all possible audiovisual data streams, including both combined audiovisual data streams and individual audiovisual data streams. Furthermore, a given individual audiovisual data stream may be represented by the secondary packet identifier for the individual audiovisual data stream and may also be represented by the primary packet identifier (i.e., selection of either packet identifier will result in in selecting the audiovisual data stream). In fact, for each individual audiovisual data stream, the content item map table may include an entry for the primary packet identifier of any combined audiovisual data stream to which the individual audiovisual data stream belongs, as well as the identifier of secondary packet for the individual flow. Thus, in this example, a list may comprise, for example, an entry with a packet identifier for all audiovisual data streams, including both combined and individual audiovisual data streams.

[0269] Consequentemente, em algumas modalidades, os identificadores de pacote secundários podem ser encapsulados em dados ligados a um identificador de pacote primário, enquanto em outras modalidades, o identificador de pacote secundário pode ser fornecido em paralelo aos identificadores de pacote primários. Um identificador de pacote primário pode, consequentemente, ser qualquer identificador que forneça um identificador de pacote a um fluxo de dados audiovisuais combinado que compreenda uma pluralidade de fluxos de dados audiovisuais.Um identificador de pacote secundário pode ser qualquer identificador de pacote para um fluxo de dados audiovisuais individuais e não precisa estar encapsulado, embutido ou ser dependente de um identificador de pacote primário.[0269] Accordingly, in some embodiments, the secondary packet identifiers may be encapsulated in data linked to a primary packet identifier, while in other embodiments, the secondary packet identifier may be provided in parallel with the primary packet identifiers. A primary packet identifier may therefore be any identifier that provides a packet identifier for a combined audiovisual data stream comprising a plurality of audiovisual data streams. A secondary packet identifier may be any packet identifier for a stream of individual audiovisual data and need not be encapsulated, embedded or dependent on a primary packet identifier.

[0270] Por exemplo, ao invés de embutir informações dos identificadores de pacote secundários em dados para um identificador de pacote primário simples, a tabela de mapa de itens de conteúdo pode ser gerada de modo a incluir todos os possíveis identificadores de pacotes em um enlace/sequência. Em tais modalidades, o receptor pode simplesmente selecionar o identificador de pacote que corresponde ao dado específico que é necessário e pode escolher, por exemplo, selecionar um fluxo de dados audiovisuais combinado simples ou um fluxo de dados audiovisuais individuais simplesmente por meio da seleção do identificador de pacote adequado a partir da lista.[0270] For example, rather than embedding secondary packet identifier information in data for a simple primary packet identifier, the content item map table can be generated to include all possible packet identifiers on a link /sequence. In such embodiments, the receiver may simply select the packet identifier that corresponds to the specific data that is required and may choose, for example, to select a single combined audiovisual data stream or an individual audiovisual data stream simply by selecting the identifier. of suitable package from the list.

[0271] Em tais modalidades, o receptor 1401 pode ser disposto, especificamente, para selecionar o áudio desejado por meio da seleção dos identificadores de pacote necessários, ao invés de meramente transmitir todas as informações de áudio em um único fluxo combinado.[0271] In such embodiments, the receiver 1401 may be specifically arranged to select the desired audio by selecting the required packet identifiers, rather than merely transmitting all audio information in a single combined stream.

[0272] A abordagem pode combinar propriedades e características de ter um único fluxo de dados audiovisuais com aquelas de ter uma pluralidade de fluxos de dados audiovisuais em um fluxo de transporte.[0272] The approach may combine properties and characteristics of having a single audiovisual data stream with those of having a plurality of audiovisual data streams in a transport stream.

[0273] Isso pode fornecer uma vantagem significativa, já que um lote de equipamentos no campo não é capaz de lidar, de maneira confiável, com múltiplos fluxos de dados audiovisuais.[0273] This can provide a significant advantage, as a batch of equipment in the field is not capable of reliably handling multiple streams of audiovisual data.

[0274] A Figura 14 ilustra um exemplo de um aparelho de recepção que compreende um receptor 1401 acoplado a um decodificador de áudio 1403. No exemplo, o receptor 1401 recebe o fluxo de dados de item de conteúdo audiovisual e é capaz de processá-lo para extrair, por exemplo, vários fluxos de dados audiovisuais. Dessa forma, o receptor 1401 pode receber um fluxo de transporte e pode ser disposto de modo a processar isso para gerar, por exemplo, fluxos de dados elementares de áudio e vídeo individuais. O receptor 1401 pode corresponder especificamente diretamente ao receptor 1401 da Figura 4.[0274] Figure 14 illustrates an example of a receiving apparatus comprising a receiver 1401 coupled to an audio decoder 1403. In the example, the receiver 1401 receives the audiovisual content item data stream and is capable of processing it to extract, for example, multiple audiovisual data streams. In this way, receiver 1401 may receive a transport stream and may be arranged to process this to generate, for example, individual elementary audio and video data streams. Receiver 1401 may specifically correspond directly to receiver 1401 of Figure 4.

[0275] O decodificador de áudio 1403 é disposto de modo a receber um ou mais fluxos de dados, compreendendo dados de áudio, e para gerar um sinal de áudio de saída a partir desses dados de áudio. O decodificador de áudio 1403 pode compreender especificamente funcionalidade para receber os dados de áudio a partir dos fluxos (streams) de dados audiovisuais do fluxo de dados do item de conteúdo. Como tal, o decodificador de áudio 1403 pode compreender especificamente a funcionalidade de extrair dados de áudio obrigatórios de um fluxo elementar, para recuperar dados de áudio alternativos do mesmo ou de um outro fluxo elementar, para substituir dados de áudio substituíveis recebidos pelos dados alternativos, e para gerar o sinal de áudio a partir dos dados de áudio resultantes.[0275] The audio decoder 1403 is arranged to receive one or more data streams, comprising audio data, and to generate an output audio signal from that audio data. The audio decoder 1403 may specifically comprise functionality for receiving audio data from the audiovisual data streams of the content item data stream. As such, the audio decoder 1403 may specifically comprise the functionality of extracting obligatory audio data from an elementary stream, to recover alternative audio data from the same or another elementary stream, to replace received substitutable audio data with the alternative data, and to generate the audio signal from the resulting audio data.

[0276] Especificamente, o decodificador de áudio 1403 pode compreender os blocos restantes da Figura 4 e pode compreender, especificamente, os extratores de dados 403, 405, 407, as unidades de decodificação 409, 411, 413 e o substituidor/combinador 415.[0276] Specifically, the audio decoder 1403 may comprise the remaining blocks of Figure 4 and may specifically comprise the data extractors 403, 405, 407, the decoding units 409, 411, 413 and the replacer/combiner 415.

[0277] No exemplo da Figura 14, o decodificador de áudio 1403 pode ser dotado de diferentes fluxos de dados audiovisuais/fluxos de dados elementares, onde cada fluxo é um fluxo de áudio que compreende diferentes dados de áudio. Entretanto, em muitas modalidades, o receptor 1401 pode ser disposto de modo a gerar um fluxo de dados simples que compreende todos os dados de áudio, e alimentar esse fluxo de dados ao decodificador de áudio 1403. O receptor 1401 pode combinar, por exemplo, os fluxos elementares de áudio em um único fluxo de áudio combinado que compreende diferentes fluxos elementares. Em alguns cenários, o fluxo de áudio combinado único pode compreender ainda os fluxos de dados audiovisuais individuais, por exemplo, os fluxos de dados audiovisuais individuais podem ser encapsulados em um único fluxo de dados. Em outros cenários, o receptor 1401 pode extrair, por exemplo, os dados de áudio relevantes e combiná- los em um fluxo de dados de áudio sem incluir todos os aspectos dos fluxos de dados audiovisuais de entrada. Por exemplo, o receptor 1401 pode gerar um novo fluxo de dados que compreende diferentes dados de controle, sintaxe e/ou estrutura para o fluxo de dados. Em alguns casos, os dados de áudio podem ser combinados em um novo fluxo de dados audiovisuais, isto é, um novo fluxo elementar. Esta combinação de fluxo de dados audiovisuais/fluxo elementar pode compreender o fluxo elementar original do fluxo de transporte recebido ou pode incluir alguns ou todos os dados de áudio em um fluxo elementar independente. Por questão de brevidade, a descrição a seguir fará referência, principalmente, a fluxos de transporte e fluxos elementares, ao invés de a fluxos de dados de áudio de item de conteúdo audiovisual e fluxos de dados audiovisuais. Além do mais, a descrição fará referência a um cenário onde o receptor 1401 gera um único fluxo elementar para o decodificador de áudio 1403.[0277] In the example of Figure 14, the audio decoder 1403 may be provided with different audiovisual data streams/elementary data streams, where each stream is an audio stream comprising different audio data. However, in many embodiments, receiver 1401 may be arranged to generate a single data stream comprising all audio data, and feed that data stream to audio decoder 1403. Receiver 1401 may combine, e.g. the elementary audio streams into a single combined audio stream comprising different elementary streams. In some scenarios, the single combined audio stream may further comprise individual audiovisual data streams, for example, the individual audiovisual data streams may be encapsulated into a single data stream. In other scenarios, receiver 1401 may extract, for example, relevant audio data and combine it into an audio data stream without including all aspects of the input audiovisual data streams. For example, receiver 1401 may generate a new data stream that comprises different control data, syntax, and/or structure for the data stream. In some cases, audio data can be combined into a new audiovisual data stream, that is, a new elementary stream. This audiovisual data stream/elemental stream combination may comprise the original elementary stream of the received transport stream or may include some or all of the audio data in an independent elementary stream. For the sake of brevity, the following description will refer primarily to transport streams and elementary streams, rather than audiovisual content item audio data streams and audiovisual data streams. Furthermore, the description will refer to a scenario where the receiver 1401 generates a single elementary stream to the audio decoder 1403.

[0278] Dessa forma, o decodificador de áudio 1403 receberá um fluxo elementar de áudio e gerará o fluxo de áudio de saída.[0278] In this way, the audio decoder 1403 will receive an elementary audio stream and generate the output audio stream.

[0279] Em muitas implementações práticas, um receptor e decodificador são blocos funcionais relativamente independentes e separados, ao invés de funções intimamente integradas. De fato, em muitos cenários, as duas entidades podem ser designadas e desenvolvidas de modo independente e separado. Por exemplo, para muitos dispositivos de renderização de conteúdo, os decodificadores de áudio são decodificadores genéricos que são reutilizados para muitos dispositivos diferentes. Por exemplo, muitos fabricantes de dispositivos de renderização de conteúdo podem adquirir funções de decodificador de áudio ao invés de desenvolvê-las internamente.[0279] In many practical implementations, a receiver and decoder are relatively independent and separate functional blocks, rather than closely integrated functions. In fact, in many scenarios, the two entities can be designated and developed independently and separately. For example, for many content rendering devices, audio decoders are generic decoders that are reused for many different devices. For example, many content rendering device manufacturers may purchase audio decoder functions rather than developing them in-house.

[0280] Consequentemente, a interface entre o receptor 1401 e o decodificador de áudio 1403 tem importância crítica em muitos cenários e é desejável utilizar uma abordagem simples e padronizada, ou ao menos comum, ao invés de confiar, por exemplo, em interface e controle dedicados e particulares.[0280] Consequently, the interface between the receiver 1401 and the audio decoder 1403 is of critical importance in many scenarios and it is desirable to use a simple and standardized, or at least common, approach rather than relying on, for example, interfacing and control dedicated and private.

[0281] Tradicionalmente, considerou-se um decodificador de áudio na estrutura de um dispositivo relativamente simples que recebe um fluxo de bits que é decodificado de acordo com o padrão de decodificação implementado pelo decodificador de áudio e sem qualquer outra modificação ou interação pelo circuito externo. Tal abordagem pode ser usada, por exemplo, na modalidade da Figura 4, onde cada uma das unidades de decodificação 409 a 413 é alimentada com um fluxo elementar simples, a partir do qual a mesma gera um sinal de áudio que pode ser combinado, subsequentemente, pelo combinador 415, de acordo com as preferências de áudio específicas para a renderização específica, e especificamente o sinal de saída pode ser gerado com base nos dados de áudio substituíveis ou dados alternativos, conforme exigido, por exemplo, pelo usuário específico.[0281] Traditionally, an audio decoder has been considered to be in the structure of a relatively simple device that receives a stream of bits that is decoded according to the decoding pattern implemented by the audio decoder and without any other modification or interaction by the external circuitry . Such an approach can be used, for example, in the embodiment of Figure 4, where each of the decoding units 409 to 413 is fed with a simple elementary stream, from which it generates an audio signal that can be subsequently combined , by combiner 415, according to the specific audio preferences for the specific rendering, and specifically the output signal may be generated based on the substitutable audio data or alternative data, as required, for example, by the specific user.

[0282] Em algumas modalidades, o aparelho pode usar um decodificador de áudio mais complexo 1403 que pode receber, especificamente, um ou mais fluxos elementares de áudio e, a partir disso, gerar o áudio de saída pela manipulação, por exemplo, dos dados antes da decodificação do sinal de áudio. Por exemplo, o decodificador de áudio 1403 pode, em tais modalidades, selecionar os dados adequados a serem usados antes da execução da decodificação real. Dessa forma, os dados de áudio que não são usados podem não ser decodificados e, de fato, podem nem mesmo ser extraídos do(s) fluxo(s) de dados fornecido(s) ao decodificador de áudio 1403. Por exemplo, os dados de áudio substituíveis que são substituídos por dados alternativos, podem não ser decodificados ou nem mesmo extraídos. De modo similar, dados de áudio alternativos que não são usados ou dados de áudio alternativos que não são usados para substituir dados de áudio substituíveis, podem não ser decodificados ou extraídos.[0282] In some embodiments, the apparatus may use a more complex audio decoder 1403 that may specifically receive one or more elementary audio streams and, from there, generate the output audio by manipulating, for example, the data before decoding the audio signal. For example, the audio decoder 1403 may, in such embodiments, select the appropriate data to be used before performing the actual decoding. Thus, audio data that is not used may not be decoded and, in fact, may not even be extracted from the data stream(s) provided to audio decoder 1403. For example, the data replaceable audio files that are replaced with alternative data may not be decoded or even extracted. Similarly, alternative audio data that is not used, or alternative audio data that is not used to replace replaceable audio data, may not be decoded or extracted.

[0283] Dessa forma, em algumas modalidades, a substituição de dados de áudio substituíveis por dados de áudio alternativos pode não ser realizada pela adaptação de uma combinação de sinais de áudio decodificados, mas, ao invés disso, pode ser realizada por meio da seleção de dados de áudio alternativos para decodificar, em vez de selecionar os dados de áudio substituíveis. Nesse caso, o sinal de saída pode ser gerado, por exemplo, por decodificação apenas dos dados de áudio obrigatórios e dados de áudio alternativos, e soma dos sinais de áudio resultantes.[0283] Thus, in some embodiments, replacement of substitutable audio data with alternative audio data may not be accomplished by adapting a combination of decoded audio signals, but instead may be accomplished by selecting alternative audio data to decode, rather than selecting replaceable audio data. In this case, the output signal may be generated, for example, by decoding only the mandatory audio data and alternative audio data, and summing the resulting audio signals.

[0284] Tal abordagem pode, em muitos cenários, fornecer uma operação mais eficiente. Entretanto, ela requer que o decodificador seja capaz de se adaptar aos requisitos e preferências específicas do cenário individual. Além do mais, requer que o decodificador seja capaz de processar uma pluralidade de diferentes componentes de áudio e se adaptar a eles de uma maneira flexível. Especificamente, ao invés do decodificador de áudio meramente renderizar todos os dados de áudio recebidos, o mesmo precisa ser capaz de combinar, de modo flexível, diferentes objetos de áudio e, especificamente, substituir alguns objetos de áudio por outros objetos.[0284] Such an approach can, in many scenarios, provide more efficient operation. However, it requires the decoder to be able to adapt to the specific requirements and preferences of the individual scenario. Furthermore, it requires the decoder to be able to process a plurality of different audio components and adapt to them in a flexible manner. Specifically, instead of the audio decoder merely rendering all received audio data, it needs to be able to flexibly combine different audio objects and, specifically, replace some audio objects with other objects.

[0285] Entretanto, de modo a conseguir isso, é necessário que o receptor instrua o decodificador de áudio 1403 sobre como processar os dados de áudio fornecidos ao mesmo. Uma possibilidade é implementar uma interface exclusiva, na qual o receptor 1401 esteja disposto de modo a gerar vários sinais de controle que controlem o decodificador de áudio 1403 para executar as operações necessárias. Entretanto, tal abordagem tende a resultar em modalidades complexas e exigir que seja usado um decodificador dedicado e exclusivo.[0285] However, in order to achieve this, it is necessary for the receiver to instruct the audio decoder 1403 on how to process the audio data provided thereto. One possibility is to implement a unique interface in which the receiver 1401 is arranged to generate multiple control signals that control the audio decoder 1403 to perform the necessary operations. However, such an approach tends to result in complex modalities and requires the use of a dedicated and exclusive decoder.

[0286] No sistema da Figura 14, o decodificador de áudio 1403 é disposto de modo a ser controlado pelo receptor 1401 gerando um fluxo de dados audiovisuais que inclui os dados de áudio, e que inclui adicionalmente um descritor de processamento de dados de áudio que indique como dados de áudio diferentes devem ser processados pelo decodificador de áudio 1403. No exemplo, o receptor 1401 gera, especificamente, um único fluxo de dados audiovisuais que compreende todos os dados de áudio que podem ser usados, potencialmente, pelo decodificador de áudio 1403 e, possivelmente, todos os dados de áudio compreendidos no fluxo de transporte de entrada para o dado item de conteúdo. Além disso, o mesmo fluxo de dados audiovisuais compreende decodificar/processar dados de controle que possibilitem ao decodificador de áudio 1403 adaptar a decodificação/processamento e, especificamente, a combinação de objetos de áudio às preferências específicas para essa renderização. Dessa forma, no sistema da figura 14, o receptor 1401 adiciona um descritor de controle na forma de um descritor de processamento de dados de áudio ao fluxo elementar de áudio alimentado no fluxo de dados audiovisuais, e o decodificador de áudio 1403 interpreta esse descritor de processamento de dados de áudio para controlar sua tarefa de decodificação.[0286] In the system of Figure 14, the audio decoder 1403 is arranged to be controlled by the receiver 1401 generating an audiovisual data stream that includes audio data, and that additionally includes an audio data processing descriptor that indicate how different audio data should be processed by audio decoder 1403. In the example, receiver 1401 specifically generates a single audiovisual data stream comprising all audio data that can potentially be used by audio decoder 1403 and possibly all audio data comprised in the input transport stream for the given content item. Furthermore, the same audiovisual data stream comprises decoding/processing control data that enables the audio decoder 1403 to adapt the decoding/processing and, specifically, the combination of audio objects to specific preferences for such rendering. Thus, in the system of Figure 14, the receiver 1401 adds a control descriptor in the form of an audio data processing descriptor to the elementary audio stream fed into the audiovisual data stream, and the audio decoder 1403 interprets this audio descriptor. audio data processing to control your decoding task.

[0287] Em mais detalhes, no exemplo da Figura 14, o receptor 1401 recebe um fluxo de transporte que compreende uma pluralidade de fluxos elementares que inclui vários fluxos elementares de áudio para um dado item de conteúdo. O receptor 1401 extrai um ou mais dos fluxos elementares de áudio e gera um ou mais fluxos elementares de saída a partir dessa extração. Especificamente, com base no primeiro fluxo de dados audiovisuais, que pode ser, especificamente, um primeiro fluxo elementar compreendendo dados de áudio obrigatórios e dados de áudio substituíveis para um primeiro item de conteúdo, o receptor 1401 pode gerar um segundo fluxo de dados audiovisuais que pode ser, especificamente, um segundo fluxo elementar compreendendo os dados de áudio obrigatórios e os dados de áudio substituíveis do primeiro fluxo de dados audiovisuais. Além disso, o segundo fluxo de dados audiovisuais/fluxo elementar pode compreender dados de áudio de um outro fluxo elementar de entrada, como, por exemplo, de um fluxo elementar que compreende dados de áudio alternativos.[0287] In more detail, in the example of Figure 14, the receiver 1401 receives a transport stream comprising a plurality of elementary streams that includes multiple elementary audio streams for a given content item. Receiver 1401 extracts one or more of the elementary audio streams and generates one or more elementary output streams from that extraction. Specifically, based on the first audiovisual data stream, which may specifically be a first elementary stream comprising mandatory audio data and substitutable audio data for a first content item, the receiver 1401 may generate a second audiovisual data stream that It may specifically be a second elementary stream comprising the mandatory audio data and the replaceable audio data of the first audiovisual data stream. Furthermore, the second audiovisual data stream/elemental stream may comprise audio data from another input elementary stream, such as from an elementary stream comprising alternative audio data.

[0288] Além disso, o receptor 1401 gera um descritor de processamento de dados de áudio que é indicativo de como o decodificador de áudio 1403 deve gerar o sinal de áudio de saída a partir dos dados de áudio do segundo fluxo elementar. O descritor de processamento de dados de áudio está incluído no segundo fluxo elementar. Por exemplo, o segundo fluxo elementar pode ser gerado de modo a compreender um ou mais campos compreendendo dados que descrevem como os componentes de áudio individuais devem ser processados, e especificamente, como (se) eles devem ser decodificados e combinados com outros componentes de áudio.[0288] Additionally, the receiver 1401 generates an audio data processing descriptor that is indicative of how the audio decoder 1403 should generate the output audio signal from the audio data of the second elementary stream. The audio data processing descriptor is included in the second elementary stream. For example, the second elementary stream may be generated to comprise one or more fields comprising data describing how individual audio components are to be processed, and specifically, how (if) they are to be decoded and combined with other audio components. .

[0289] Então, o receptor 1401 alimenta o segundo fluxo elementar no decodificador de áudio 1403. O decodificador de áudio 1403 prossegue extraindo o descritor de processamento de dados de áudio a partir do segundo fluxo de dados audiovisuais e gerando um sinal de áudio em resposta ao descritor de processamento de dados de áudio.[0289] Then, the receiver 1401 feeds the second elementary stream into the audio decoder 1403. The audio decoder 1403 proceeds by extracting the audio data processing descriptor from the second audiovisual data stream and generating an audio signal in response. to the audio data processing descriptor.

[0290] O descritor de processamento de dados de áudio pode definir quais componentes de áudio devem ser combinados entre si para gerar o sinal de saída e, consequentemente, o decodificador de áudio 1403 pode recuperar, especificamente (apenas), os componentes de áudio indicados, decodificá-los e finalmente somá-los.[0290] The audio data processing descriptor may define which audio components should be combined with each other to generate the output signal, and accordingly, the audio decoder 1403 may specifically recover (only) the indicated audio components , decode them and finally add them up.

[0291] Em algumas modalidades, o receptor 1401 pode incluir uma pluralidade de descritores de processamento de dados de áudio, sendo que cada um dos descritores de processamento de dados de áudio processa descritores que fornecem indicações de processamento a um subconjunto dos componentes de áudio do segundo fluxo elementar. Em algumas modalidades, pode ser fornecido um descritor de processamento de dados de áudio para cada componente de áudio, sendo que o descritor de processamento de dados de áudio descreve especificamente se o componente de áudio correspondente é dado de áudio obrigatório, dado de áudio substituível ou dado de áudio alternativo. Os descritores de processamento de dados de áudio podem descrever, adicionalmente, se, na verdade, um componente de áudio alternativo deve substituir ou não um dado componente de áudio substituível.[0291] In some embodiments, the receiver 1401 may include a plurality of audio data processing descriptors, each of the audio data processing descriptors processing descriptors that provide processing indications to a subset of the audio components of the second elementary flow. In some embodiments, an audio data processing descriptor may be provided for each audio component, wherein the audio data processing descriptor specifically describes whether the corresponding audio component is mandatory audio data, replaceable audio data, or alternative audio data. Audio data processing descriptors may additionally describe whether or not an alternative audio component should actually replace a given replaceable audio component.

[0292] Como um exemplo específico, pode ser fornecido um descritor de processamento de dados de áudio para um dado componente de áudio para indicar se ele deve ser tratado como dado de áudio alternativo ou dado adicional. Dado de áudio alternativo é o dado que substituirá algum dado de áudio substituível, enquanto que dado adicional é o dado que é somado ao dado de áudio substituível.[0292] As a specific example, an audio data processing descriptor may be provided for a given audio component to indicate whether it should be treated as alternative audio data or additional data. Alternative audio data is the data that will replace some replaceable audio data, while additional data is the data that is added to the replaceable audio data.

[0293] Por exemplo, o fluxo de entrada no receptor 1401 pode compreender um fluxo elementar que compreende o primeiro dado de áudio para um dado primeiro componente de áudio. Em algumas situações de renderização, pode-se desejar que o primeiro componente de áudio substitua um segundo componente de áudio do fluxo de transporte de entrada. Dessa forma, nesse caso, o primeiro dado de áudio representa dado de áudio alternativo para um componente de áudio alternativo que é renderizado ao invés do segundo componente de áudio, que é um componente de áudio substituível. Entretanto, em outros cenários, pode ser desejável que o primeiro componente de áudio seja renderizado junto com o segundo componente de áudio, isto é, que ambos os componentes de áudio sejam renderizados em conjunto.[0293] For example, the input stream at receiver 1401 may comprise an elementary stream comprising first audio data for a given first audio component. In some rendering situations, you may want the first audio component to replace a second audio component of the input transport stream. Thus, in this case, the first audio data represents alternative audio data for an alternative audio component that is rendered instead of the second audio component, which is a replaceable audio component. However, in other scenarios, it may be desirable for the first audio component to be rendered together with the second audio component, that is, for both audio components to be rendered together.

[0294] No primeiro caso, um descritor de processamento de dados pode ser incluído no segundo fluxo elementar pelo receptor 1401 para indicar se o primeiro dado de áudio é, na verdade, dado de áudio alternativo que deve substituir o segundo dado de áudio. Entretanto, no último caso, pode ser incluído um descritor de processamento de dados de áudio pelo receptor 1401 para indicar que o primeiro dado de áudio é, ao invés disso, dado de áudio adicional que deve ser somado ao segundo dado de áudio, isto é, que ambos os componentes de áudio devem ser extraídos e renderizados. Dessa forma, nesse caso, é inserido um descritor de processamento de dados de áudio para o primeiro dado de áudio indicando se é designado como dado de áudio alternativo ou dado de áudio adicional.[0294] In the first case, a data processing descriptor may be included in the second elementary stream by receiver 1401 to indicate whether the first audio data is, in fact, alternative audio data that should replace the second audio data. However, in the latter case, an audio data processing descriptor may be included by receiver 1401 to indicate that the first audio data is instead additional audio data that is to be added to the second audio data, i.e. , that both audio components must be extracted and rendered. Therefore, in this case, an audio data processing descriptor is inserted for the first audio data indicating whether it is designated as alternative audio data or additional audio data.

[0295] O decodificador de áudio 1403 processará os dados de acordo com os descritores de processamento de dados de áudio recebidos. No exemplo específico, se o descritor de processamento de dados de áudio indicar que o primeiro dado de áudio é designado como dado de áudio alternativo, o decodificador de áudio 1403 prossegue para extrair o primeiro dado de áudio e tratá-lo como dado de áudio alternativo. Além do mais, o mesmo substitui o dado de áudio substituível, na forma do segundo dado de áudio, por esse primeiro dado de áudio extraído. A substituição pode ser conseguida, especificamente, decodificando-se apenas o primeiro dado de áudio, enquanto que o segundo dado de áudio não é extraído e nem decodificado. Sendo assim, o primeiro componente de áudio é gerado e incluído no sinal de áudio de saída.[0295] The audio decoder 1403 will process the data according to the received audio data processing descriptors. In the specific example, if the audio data processing descriptor indicates that the first audio data is designated as alternate audio data, the audio decoder 1403 proceeds to extract the first audio data and treat it as alternate audio data. . Furthermore, it replaces the substitutable audio data, in the form of the second audio data, with this extracted first audio data. Substitution can be achieved specifically by decoding only the first audio data, while the second audio data is neither extracted nor decoded. Therefore, the first audio component is generated and included in the output audio signal.

[0296] Entretanto, se o descritor de processamento de dados de áudio indicar que o primeiro dado de áudio é designado como dado de áudio adicional, o decodificador de áudio 1403 prossegue para extrair tanto o primeiro dado de áudio quanto o segundo dado de áudio. Além do mais, tanto o primeiro dado de áudio quanto o segundo dado de áudio são decodificados para gerar o primeiro componente de áudio e o segundo componente de áudio. Ambos são então combinados no sinal de saída.[0296] However, if the audio data processing descriptor indicates that the first audio data is designated as additional audio data, the audio decoder 1403 proceeds to extract both the first audio data and the second audio data. Furthermore, both the first audio data and the second audio data are decoded to generate the first audio component and the second audio component. Both are then combined into the output signal.

[0297] Em tais modalidades, o receptor 1401 pode, consequentemente, controlar a operação do decodificador de áudio 1403, e, especificamente, pode controlar qual dado de áudio contribui para o sinal de saída e qual é ignorado. A abordagem possibilita um controle de baixa complexidade e pode possibilitar que um decodificador de áudio 1403 exija apenas um fluxo de dado de entrada para gerar a saída de áudio desejada.[0297] In such embodiments, the receiver 1401 may therefore control the operation of the audio decoder 1403, and specifically may control which audio data contributes to the output signal and which is ignored. The approach enables low complexity control and may enable an audio decoder 1403 to require only one input data stream to generate the desired audio output.

[0298] A abordagem pode possibilitar adicionalmente, por exemplo, que todos os dados de áudio do fluxo de transporte (para um dado item de conteúdo) sejam incluídos no segundo fluxo de dados audiovisuais fornecido ao decodificador de áudio 1403, enquanto, ao mesmo tempo, possibilita que esses dados sejam usados de modo flexível, e enquanto ainda especificamente possibilita que seja gerado um sinal de saída que inclui apenas um subconjunto dos componentes de áudio. Os componentes de áudio podem ser selecionados de modo flexível pelo receptor 1401 através de dados incluídos no próprio segundo fluxo de dados audiovisuais.[0298] The approach may further enable, for example, all audio data from the transport stream (for a given content item) to be included in the second audiovisual data stream provided to the audio decoder 1403, while at the same time , enables this data to be used flexibly, and while still specifically enabling an output signal to be generated that includes only a subset of the audio components. Audio components may be flexibly selected by receiver 1401 via data included in the second audiovisual data stream itself.

[0299] O receptor 1401 pode gerar, por exemplo, um descritor de processamento de dados de áudio que é indicativo do dado de áudio ser ou não dado de áudio dentre o grupo de:dados de áudio obrigatórios; dados de áudio substituíveis;dados de áudio alternativos; e dados de áudio adicionais;[0299] Receiver 1401 may generate, for example, an audio data processing descriptor that is indicative of whether or not audio data is audio data among the group of: mandatory audio data; replaceable audio data; alternative audio data; and additional audio data;

[0300] Em algumas modalidades, um subconjunto ou superconjunto desse grupo pode ser usado.[0300] In some embodiments, a subset or superset of this group may be used.

[0301] O descritor de processamento de dados de áudio para um dado item de conteúdo pode ser gerado, por exemplo, em resposta a uma preferência de renderização para o dispositivo específico, ou, por exemplo, em resposta a dados inseridos pelo usuário.[0301] The audio data processing descriptor for a given content item may be generated, for example, in response to a rendering preference for the specific device, or, for example, in response to user-entered data.

[0302] Como um exemplo, um fluxo de transporte recebido pode compreender um componente de áudio de fundo obrigatório, um componente de áudio em idioma inglês, um componente de áudio de fundo alemão e um componente de fundo secundário. O usuário pode selecionar quais componentes de áudio são desejados e os descritores de processamento de dados de áudio podem ser gerados para refletir os componentes de áudio selecionados, de modo que esses sejam extraídos e decodificados pelo decodificador de áudio 1403.[0302] As an example, a received transport stream may comprise a mandatory background audio component, an English language audio component, a German background audio component, and a secondary background component. The user can select which audio components are desired and audio data processing descriptors can be generated to reflect the selected audio components so that they are extracted and decoded by the audio decoder 1403.

[0303] Em algumas modalidades, os descritores de processamento de dado de áudio podem ser gerados pelo receptor 1401 sem contar com qualquer descritor de processamento de dado de áudio predeterminado, e especificamente, sem contar com qualquer descritor de processamento de dados de áudio do fluxo de transporte recebido.[0303] In some embodiments, audio data processing descriptors may be generated by receiver 1401 without relying on any predetermined audio data processing descriptor, and specifically, without relying on any audio data processing descriptor of the stream of transportation received.

[0304] Entretanto, em outras modalidades, os descritores de processamento de dados de áudio do segundo fluxo elementar são gerados a partir de descritores de processamento de dados de áudio como parte do fluxo de dados do item de conteúdo audiovisual recebido, isto é, como parte do fluxo de transporte recebido.[0304] However, in other embodiments, audio data processing descriptors of the second elementary stream are generated from audio data processing descriptors as part of the data stream of the received audiovisual content item, i.e., as part of the received transport flow.

[0305] Especificamente, o receptor 1401 pode estar disposto de modo a gerar um primeiro descritor de processamento de dados de áudio a partir de um segundo descritor de processamento de dados de áudio recebido no fluxo de transporte. Dessa forma, para um dado fluxo elementar de áudio do fluxo de transporte de entrada, o fluxo de transporte pode incluir um ou mais descritores de processamento de dados de áudio que indiquem como os dados de áudio do fluxo elementar de áudio deve ser decodificado pelo decodificador de áudio 1403.[0305] Specifically, receiver 1401 may be arranged to generate a first audio data processing descriptor from a second audio data processing descriptor received in the transport stream. Thus, for a given audio elementary stream of the input transport stream, the transport stream may include one or more audio data processing descriptors that indicate how the audio data of the audio elementary stream should be decoded by the decoder. audio 1403.

[0306] Por exemplo, um dado fluxo elementar de áudio pode compreender dados de áudio alternativos que destinam-se a substituir dados de áudio substituíveis. Por exemplo, o fluxo elementar pode compreender diálogo em alemão que deve substituir o componente de áudio de diálogo padrão, como, por exemplo, um componente de áudio de diálogo em inglês. Consequentemente, o fluxo de transporte de entrada pode incluir um descritor de processamento de dados de áudio que defina que esses dados de áudio devem ser tratados como dados de áudio substituíveis e que eles devem substituir outros dados de áudio de diálogo. O fluxo de transporte pode incluir outros fluxos elementares de áudio de diálogo e, para cada um desses, o fluxo de transporte pode incluir também um descritor de processamento de dados de áudio.[0306] For example, a given elementary audio stream may comprise alternative audio data that is intended to replace replaceable audio data. For example, the elementary flow may comprise German dialogue that should replace the default dialogue audio component, such as an English dialogue audio component. Accordingly, the input transport stream may include an audio data processing descriptor that defines that such audio data is to be treated as replaceable audio data and that it is to replace other dialog audio data. The transport stream may include other elementary dialog audio streams, and for each of these, the transport stream may also include an audio data processing descriptor.

[0307] Dessa forma, nesse exemplo, o aparelho que gera o fluxo de transporte, como, por exemplo, o aparelho da Figura 3, pode, ainda, ser disposto de modo a gerar descritores de processamento de dados de áudio que indicam como os dados de áudio correspondentes devem ser, ou podem ser, processados. Por exemplo, pode ser incluído um descritor de processamento de dados de áudio para cada componente de áudio de diálogo que indique que essa trilha pode ser selecionada e que, caso isso corra, deve substituir todos os outros componentes de áudio de diálogo.[0307] Thus, in this example, the device that generates the transport stream, such as, for example, the device in Figure 3, can also be arranged to generate audio data processing descriptors that indicate how the corresponding audio data must be, or can be, processed. For example, an audio data processing descriptor may be included for each dialog audio component that indicates that that track can be selected and that, if successful, it should override all other dialog audio components.

[0308] Os descritores de processamento de dados de áudio são incluídos no fluxo de transporte, por exemplo, no mapa de programa para o item de conteúdo, ou possivelmente nos pacotes de dados individuais para o fluxo elementar individual.[0308] Audio data processing descriptors are included in the transport stream, for example, in the program map for the content item, or possibly in the individual data packets for the individual elementary stream.

[0309] Em particular, em muitas modalidades, o descritor de processamento de dados de áudio pode, no lado de geração do fluxo de transporte, ser incluído na tabela de mapa de programa para o item de conteúdo. Como um exemplo específico, para cada fluxo elementar de áudio, a tabela de mapa de programa pode incluir não apenas o identificador de pacote para o fluxo elementar como também um ou mais descritores de processamento de dados de áudio que indicam como os dados de áudio devem ser decodificados. Isso pode possibilitar que a fonte controle e descreva como o conteúdo pode e/ou deve ser decodificado e renderizado.[0309] In particular, in many embodiments, the audio data processing descriptor may, on the transport stream generation side, be included in the program map table for the content item. As a specific example, for each elementary audio stream, the program map table may include not only the packet identifier for the elementary stream but also one or more audio data processing descriptors that indicate how the audio data should be processed. be decoded. This can enable the source to control and describe how content can and/or should be decoded and rendered.

[0310] O receptor 1401 pode, ao receber tal fluxo de transporte, gerar o segundo fluxo elementar e alimentá-lo no decodificador de áudio 1403, sendo que o segundo fluxo elementar compreende descritores de processamento de dados de áudio que são gerados a partir daqueles do fluxo de transporte de entrada e que descrevem como os dados de áudio específicos devem ser decodificados e renderizados na situação específica.[0310] The receiver 1401 may, upon receiving such a transport stream, generate the second elementary stream and feed it to the audio decoder 1403, the second elementary stream comprising audio data processing descriptors that are generated from those of the input transport stream and that describe how specific audio data should be decoded and rendered in the specific situation.

[0311] Os descritores de processamento de dados de áudio do segundo fluxo elementar são gerados a partir dos descritores de processamento de dados de áudio recebidos. Esse processo pode, em algumas modalidades, ser um processo complexo que avalia os descritores de processamento de dados de áudio recebidos e, a partir disso, gera novos descritores de processamento de dados de áudio que refletem um processamento específico.[0311] The audio data processing descriptors of the second elementary stream are generated from the received audio data processing descriptors. This process may, in some embodiments, be a complex process that evaluates received audio data processing descriptors and then generates new audio data processing descriptors that reflect specific processing.

[0312] Entretanto, em muitas modalidades, o receptor 1401 pode ser disposto de modo a simplesmente copiar os descritores de processamento de dados de áudio do fluxo de transporte para o segundo fluxo elementar.[0312] However, in many embodiments, the receiver 1401 may be arranged to simply copy the audio data processing descriptors from the transport stream to the second elementary stream.

[0313] Especificamente, os descritores de processamento de dados de áudio do fluxo de entrada que descrevem um processamento ou, especificamente, quais os dados de áudio que são desejados para a renderização, podem ser copiados do fluxo de transporte de entrada para o segundo fluxo elementar.[0313] Specifically, audio data processing descriptors from the input stream that describe a processing or specifically what audio data is desired for rendering may be copied from the input transport stream to the second stream elementary.

[0314] Por exemplo, se o dado de áudio for um dado componente de áudio ou fluxo elementar de áudio que se deseja renderizar, o receptor 1401 pode simplesmente copiar o descritor de processamento de dados de áudio para esse componente de áudio ou fluxo elementar de áudio para o segundo fluxo elementar. Por exemplo, caso se deseje que a trilha de áudio do diálogo em alemão seja renderizada, o receptor 1401 pode copiar o descritor de processamento de dado de áudio para o fluxo elementar de diálogo em alemão (junto com os dados de áudio) para o segundo fluxo elementar. Consequentemente, o segundo fluxo elementar conterá um descritor de processamento de dados de áudio que faz com que o decodificador de áudio 1403 substitua os dados de áudio substituíveis do diálogo em inglês por aqueles do diálogo em alemão.[0314] For example, if the audio data is a given audio component or elementary audio stream that one wishes to render, the receiver 1401 may simply copy the audio data processing descriptor for that audio component or elementary audio stream. audio for the second elementary stream. For example, if the German dialogue audio track is desired to be rendered, the receiver 1401 may copy the audio data processing descriptor for the elementary German dialogue stream (along with the audio data) to the second elementary flow. Accordingly, the second elementary stream will contain an audio data processing descriptor that causes the audio decoder 1403 to replace the substitutable audio data of the English dialogue with that of the German dialogue.

[0315] Caso não seja necessário que o dado de áudio seja renderizado, por exemplo, se o usuário preferir o diálogo em inglês, o receptor 1401 pode não copiar o descritor de processamento de dados de áudio para o fluxo elementar de diálogo em alemão para o segundo fluxo elementar. Em tais modalidades, o decodificador de áudio 1403 pode ser disposto, por exemplo, para ignorar ou descartar dados de áudio para os quais nenhum descritor de processamento de dados de áudio está incluído no fluxo elementar inserido no decodificador de áudio 1403.[0315] If it is not necessary for the audio data to be rendered, for example, if the user prefers English dialogue, the receiver 1401 may not copy the audio data processing descriptor for the elementary German dialogue stream to the second elementary flow. In such embodiments, the audio decoder 1403 may be arranged, for example, to ignore or discard audio data for which no audio data processing descriptor is included in the elementary stream input to the audio decoder 1403.

[0316] Em algumas modalidades, a fonte pode ser disposta para gerar um fluxo de transporte que compreende uma pluralidade de possíveis descritores de processamento de dados de áudio para um dado fluxo elementar de áudio. A pluralidade de possíveis descritores de processamento de dados de áudio pode descrever, por exemplo, as diferentes possíveis maneiras dos dados de áudio do fluxo elementar podem serem usados. Por exemplo, se o componente de áudio puder ser renderizado tanto junto com, como ao invés de, um outro componente de áudio, o fluxo de transporte pode compreender um descritor de processamento de dado de áudio indicando que o dado é dado de áudio alternativo e um descritor de processamento de dado de áudio indicando que o dado é dado de áudio adicional. Dessa forma, cada um dos possíveis descritores de processamento de dado de áudio pode descrever um processamento permitido do dado de áudio correspondente.[0316] In some embodiments, the source may be arranged to generate a transport stream comprising a plurality of possible audio data processing descriptors for a given elementary audio stream. The plurality of possible audio data processing descriptors can describe, for example, the different possible ways the elementary stream audio data can be used. For example, if the audio component can be rendered either alongside or instead of another audio component, the transport stream may comprise an audio data processing descriptor indicating that the data is alternative audio data and an audio data processing descriptor indicating that the data is additional audio data. In this way, each of the possible audio data processing descriptors can describe a permitted processing of the corresponding audio data.

[0317] Em tais modalidades, o receptor 1401 pode extrair, por exemplo, a pluralidade de possíveis descritores de processamento de dados de áudio para os dados de áudio. Com base na renderização desejada (por exemplo, com base nas seleções de idioma de um usuário), o receptor 1401 pode prosseguir para selecionar um dos descritores de processamento de dados de áudio que corresponda à renderização desejada. Esse descritor de processamento de dado de áudio pode então ser copiado para o segundo fluxo elementar, enquanto os outros descritores de processamento de dados de áudio podem ser ignorados.[0317] In such embodiments, the receiver 1401 may extract, for example, the plurality of possible audio data processing descriptors for the audio data. Based on the desired rendering (e.g., based on a user's language selections), the receiver 1401 may proceed to select one of the audio data processing descriptors that corresponds to the desired rendering. This audio data processing descriptor can then be copied to the second elementary stream, while the other audio data processing descriptors can be ignored.

[0318] No exemplo descrito, o descritor de processamento de dado de áudio pode ser considerado a corresponder ao uso de um token, encontrado no fluxo de transporte de entrada, a ser injetado no fluxo de dados para o decodificador de áudio 1403, e usado como comando para tal. O descritor de processamento de dado de áudio pode compreender uma indicação do processamento necessário do dado de áudio pelo decodificador de áudio 1403.[0318] In the described example, the audio data processing descriptor can be considered to correspond to the use of a token, found in the input transport stream, to be injected into the data stream for the audio decoder 1403, and used as a command to do so. The audio data processing descriptor may comprise an indication of the required processing of the audio data by the audio decoder 1403.

[0319] Essa abordagem pode resultar em uma maneira mais genérica e aberta de se implementar uma interface em um decodificador de áudio 1403. Pode possibili tar também processamento de baixa complexidade.Como uma vantagem significativa específica, o receptor 1401 simplesmente precisa selecionar que a renderização é desejada e então copiar o descritor de processamento de dado de áudio correspondente do fluxo de transporte de entrada para o segundo fluxo elementar. Não é necessário se considerar, ou, na verdade, se ter qualquer conhecimento de, como o processamento real é executado pelo decodificador de áudio 1403. Ao invés disso, o decodificador de áudio 1403 interpreta e executa o processamento definido pelo descritor de processamento de dado de áudio.[0319] This approach can result in a more generic and open way of implementing an interface in an audio decoder 1403. It can also enable low-complexity processing. As a specific significant advantage, the receiver 1401 simply needs to select which rendering is desired and then copy the corresponding audio data processing descriptor from the input transport stream to the second elementary stream. It is not necessary to consider, or indeed have any knowledge of, how the actual processing is performed by the audio decoder 1403. Instead, the audio decoder 1403 interprets and performs the processing defined by the data processing descriptor audio.

[0320] Isso é muito vantajoso, já que a alternativa de criar uma interface com o decodificador de áudio 1403 exige que o receptor 1401 compreenda, não apenas a escolha mas também o conceito de “substituição”, a saber, que os objetos nesse fluxo precisam substituir objetos no fluxo principal. Um receptor 1401 que apenas passa adiante cópias de descritores de processamento de dados de áudio tem que entender apenas que uma seleção foi feita. Isso implica em que a ação descrita pelos descritores de processamento de dados de áudio pode ser arbitrariamente complexa, e muda constantemente e melhora ao longo do tempo, porque tudo o que o receptor 1401 tem que fazer é copiar os descritores de processamento de dados de áudio relevantes. O receptor 1401 não precisa entender quais comandos exclusivos serão necessários para executar a ação complexa acoplada à inclusão de um dado fluxo no fluxo total.[0320] This is very advantageous, as the alternative of interfacing with the audio decoder 1403 requires that the receiver 1401 understands not only the choice but also the concept of “substitution”, namely that the objects in this stream need to replace objects in the main flow. A receiver 1401 that only passes along copies of audio data processing descriptors has only to understand that a selection has been made. This implies that the action described by the audio data processing descriptors can be arbitrarily complex, and constantly changes and improves over time, because all the receiver 1401 has to do is copy the audio data processing descriptors relevant. The receiver 1401 does not need to understand what unique commands will be required to perform the complex action coupled with including a given stream in the total stream.

[0321] Exemplos específicos de uma operação que usa descritores de processamento de dados de áudio são fornecidos nas Figuras 15 e 16 para um fluxo de transporte MPEG (modificado). Nos exemplos, os descritores de processamento de dados de áudio são referidos como “3D AD” e “3D Descritor de Áudio”. Nos exemplos, o segundo fluxo de dados audiovisuais/fluxo elementar é gerado como um MPEG-H Audio Stream (MHAS).[0321] Specific examples of an operation using audio data processing descriptors are provided in Figures 15 and 16 for a (modified) MPEG transport stream. In the examples, the audio data processing descriptors are referred to as “3D AD” and “3D Audio Descriptor”. In the examples, the second audiovisual data stream/elementary stream is generated as an MPEG-H Audio Stream (MHAS).

[0322] A descrição anterior fornece uma série de exemplos de abordagens que tratam da distribuição eficiente de áudio em fluxos de dados de item de conteúdo audiovisual e, especificamente, da distribuição de conteúdo de áudio em tais fluxos de dados.[0322] The foregoing description provides a series of examples of approaches that address the efficient distribution of audio in audiovisual content item data streams, and specifically the distribution of audio content in such data streams.

[0323] Ao decidir sobre uma abordagem para distribuição de conteúdo de audiovisual, o projetista é confrontado com muitos desafios técnicos diferentes e, muitas vezes, conflitantes. Especificamente, deseja-se que a taxa de dados seja tão baixa quanto possível, ao mesmo tempo em que a qualidade seja mantida tão alta quanto possível. Um outro “acordo” está entre o desejo de fornecer uma representação de dados que seja muito simples de se processar e renderizar por um receptor, mas que ainda forneça um alto grau de flexibilidade para o receptor personalizar a renderização dos dados. Para sustentar tal flexibilidade, pode ser necessária uma estrutura e organização de fluxo de dados cada vez mais complexa, mas isso também tende a exigir processamento mais complexo no lado do receptor.[0323] When deciding on an approach to distributing audiovisual content, the designer is faced with many different and often conflicting technical challenges. Specifically, you want the data rate to be as low as possible while maintaining quality as high as possible. Another “compromise” is between the desire to provide a data representation that is very simple for a receiver to process and render, but that still provides a high degree of flexibility for the receiver to customize the rendering of the data. To sustain such flexibility, an increasingly complex data flow structure and organization may be required, but this also tends to require more complex processing on the receiver side.

[0324] Dessa forma, a questão de como dividir, estruturar e organizar dados em fluxos de dados audiovisuais é um problema técnico crítico e difícil que requer várias compensações técnicas.[0324] Thus, the question of how to divide, structure, and organize data in audiovisual data streams is a critical and difficult technical problem that requires several technical trade-offs.

[0325] As abordagens descritas anteriormente tratam desse problema e buscam fornecer uma compensação aprimorada entre diferentes características, requisitos e preferências para várias aplicações.[0325] The previously described approaches address this issue and seek to provide an improved trade-off between different characteristics, requirements, and preferences for various applications.

[0326] As abordagens utilizam uma abordagem mais flexível do que os fluxos de dados MPEG tradicionais, sendo que todo áudio para uma representação de áudio é fornecido, geralmente, em um único fluxo elementar. De fato, um fluxo de dados MPEG convencional é organizado como um fluxo de transporte que compreende uma pluralidade de fluxos elementares, onde cada fluxo de dados elementar compreende um componente de vídeo ou áudio. Os dados nos fluxos de transporte MPEG são estruturados em fluxos elementares e são definidos dois possíveis fluxos elementares de áudio. Um é um fluxo de dados elementar que fornece uma representação de áudio completa para um item de conteúdo, isto é, um componente de áudio correspondente à plataforma de som inteira é fornecido em um único fluxo elementar. A outra opção é para um fluxo elementar de áudio incluir dados de áudio para um componente de som adicional que pode ser combinado com/adicionado a um componente de áudio completo (representação total).[0326] The approaches utilize a more flexible approach than traditional MPEG data streams, with all audio for an audio representation generally being provided in a single elementary stream. In fact, a conventional MPEG data stream is organized as a transport stream comprising a plurality of elementary streams, where each elementary data stream comprises a video or audio component. Data in MPEG transport streams is structured into elementary streams and two possible elementary audio streams are defined. One is an elementary data stream that provides a complete audio representation for a content item, that is, an audio component corresponding to the entire sound platform is provided in a single elementary stream. The other option is for an elementary audio stream to include audio data for an additional sound component that can be combined with/added to a full audio component (full representation).

[0327] A abordagem de MPEG tem a vantagem significativa de ter baixa complexidade e o conteúdo poder ser renderizado com base em processamento de baixa complexidade. Na verdade, identificar e extrair os dados de áudio necessários para um dado item de conteúdo geralmente requer apenas que um fluxo de dados elementar seja identificado e extraído do fluxo de transporte, e geralmente exige apenas que um componente de áudio seja decodificado.[0327] The MPEG approach has the significant advantage of being low complexity and content can be rendered based on low complexity processing. In fact, identifying and extracting the audio data required for a given content item generally requires only that an elementary data stream be identified and extracted from the transport stream, and generally only requires that one audio component be decoded.

[0328] A MPEG fornece alguma flexibilidade ao possibilitar que o áudio seja complementado por componentes de áudio adicionais. Esses componentes de áudio adicionais são componentes de áudio adicionais que podem ser ignorados ou podem ser combinados com/adicionados a um componente de áudio completo. Entretanto, nenhuma outra opção é possível, isto é, os componentes de áudio são componentes de áudio adicionais que não podem substituir os dados de áudio para a representação completa.[0328] MPEG provides some flexibility by enabling audio to be supplemented by additional audio components. These additional audio components are additional audio components that can be ignored or can be combined with/added to a complete audio component. However, no other option is possible, that is, audio components are additional audio components that cannot replace the audio data for the complete representation.

[0329] Dessa forma, para um fluxo de transporte MPEG convencional, os dados de áudio ou são designados como dados de áudio completos, fornecidos individual e separadamente em um único fluxo de dados elementar, ou são designados como dados de áudio adicionais, também fornecidos em um fluxo elementar separado. Consequentemente, cada fluxo elementar fornece um tipo de dado de áudio que, ou pode ser renderizado diretamente, ou adicionado a um componente de áudio completo.[0329] Thus, for a conventional MPEG transport stream, the audio data is either designated as complete audio data, provided individually and separately in a single elementary data stream, or is designated as additional audio data, also provided in a separate elementary stream. Consequently, each elementary stream provides an audio data type that can either be rendered directly or added to a complete audio component.

[0330] A abordagem MPEG fornece um fluxo de dados com uma representação de dados compacta e baixa sobrecarga de dados que possibilita processamento com baixa complexidade por um receptor. Na verdade, o receptor só precisa considerar um PID (Packet IDentifier) de pacotes de dados para encontrar e extrair apenas os dados de áudio que são necessários, isto é, há uma correspondência direta entre o tipo de dados de áudio e a identificação do fluxo elementar. Entretanto, um inconveniente da abordagem reside em que a flexibilidade de renderização de áudio é baixa, e é essencialmente limitada à possibilidade de adicionar opcionalmente áudios adicionais a uma outra forma de representação de áudio completa.[0330] The MPEG approach provides a data stream with a compact data representation and low data overhead that enables low complexity processing by a receiver. In fact, the receiver only needs to consider a PID (Packet IDentifier) of data packets to find and extract only the audio data that is needed, that is, there is a direct correspondence between the audio data type and the stream ID elementary. However, a drawback of the approach lies in that the audio rendering flexibility is low, and is essentially limited to the possibility of optionally adding additional audios to another form of complete audio representation.

[0331] Nos últimos anos, propôs-se introduzir objetos de áudio. Ao invés de fornecer um componente de áudio que corresponda a toda a plataforma/cena de som, a abordagem é baseada em fornecer, ao invés disso, um grande número de objetos de áudio individuais que correspondam, cada um, a uma única fonte de som na cena de áudio. Consequentemente, o renderizador final pode criar uma dada cena de som ao decodificar individualmente cada objeto de áudio, posicionar o objeto na cena de som, gerar os sinais de áudio espaciais adequados, combinar os objetos de áudio e, finalmente, renderizar os sinais combinados.[0331] In recent years, it has been proposed to introduce audio objects. Rather than providing one audio component that corresponds to the entire sound platform/scene, the approach is based on instead providing a large number of individual audio objects that each correspond to a single sound source in the audio scene. Consequently, the final renderer can create a given sound scene by individually decoding each audio object, positioning the object in the sound scene, generating the appropriate spatial audio signals, combining the audio objects, and finally rendering the combined signals.

[0332] Tal abordagem fornece um alto grau de flexibilidade ao áudio renderizado e proporciona ao receptor um alto grau de liberdade. Entretanto, exige um processamento muito complexo no receptor. Na verdade, o processamento necessário para renderizar dados de áudio é complexo e, além disso, a complexidade e o processamento necessários para identificar e extrair os dados de áudio necessários e desejados, assim como determinar como os dados de áudio podem ser usados na renderização, são muito complexos. A abordagem também resulta em uma grande sobrecarga de dados a fim de fornecer as informações necessárias para identificar a distribuição de dado no fluxo de dados.[0332] Such an approach provides a high degree of flexibility to the rendered audio and provides the receiver with a high degree of freedom. However, it requires very complex processing at the receiver. In fact, the processing required to render audio data is complex, and furthermore, the complexity and processing required to identify and extract the necessary and desired audio data, as well as determining how the audio data can be used in rendering, are very complex. The approach also results in a large data overhead in order to provide the information needed to identify the data distribution in the data stream.

[0333] As abordagens anteriormente descritas são direcionadas a fornecerem uma compensação diferente, e, para muitos cenários, aprimorada entre complexidade, sobrecarga de dados e flexibilidade na distribuição de itens de conteúdo, em relação às abordagens fornecidas por um fluxo de transporte MPEG convencional ou um fluxo de transporte de objeto de áudio.[0333] The previously described approaches are intended to provide a different, and, for many scenarios, improved trade-off between complexity, data overhead, and flexibility in distributing content items, relative to the approaches provided by a conventional MPEG transport stream or an audio object transport stream.

[0334] As abordagens são baseadas em um fluxo de dados inovador que compreende tipos de dados de áudio diferentes daqueles do fluxo de transporte convencional, e que tem uma organização diferente desses dados no fluxo de dados.[0334] The approaches are based on an innovative data stream that comprises different audio data types than those in the conventional transport stream, and that has a different organization of that data in the data stream.

[0335] De modo similar às abordagens MPEG tradicionais, as abordagens são baseadas em fluxo de dados do item de conteúdo audiovisual (fluxo de transporte) que compreende uma pluralidade de fluxos de dados audiovisuais individuais compreendendo componentes audiovisuais (chamados de fluxos elementares) para um item de conteúdo audiovisual.[0335] Similar to traditional MPEG approaches, the approaches are based on an audiovisual content item data stream (transport stream) comprising a plurality of individual audiovisual data streams comprising audiovisual components (called elementary streams) to a audiovisual content item.

[0336] Entretanto, as abordagens são baseadas em fluxos de dados elementares que podem fornecer, cada um, dados de áudio suficientes para uma representação de áudio para o conteúdo, mas que compreendem diferentes tipos de dados de áudio. Dessa forma, o fluxo de transporte é disposto de modo a incluir um fluxo elementar que compreende diferentes tipos de dados de áudio. Na verdade, alguns dos dados de áudio desse fluxo elementar são projetados para serem dados de áudio obrigatórios para a representação de áudio. Os dados de áudio obrigatórios precisam ser renderizados quando a representação de áudio é apresentada. Outros dados do fluxo de dados elementar são designados como dados de áudio substituíveis. Esses dados de áudio substituíveis são dados de áudio para a representação de áudio, mas são dados de áudio que o receptor tem permissão para substituir por outros dados (alternativos).[0336] However, the approaches are based on elementary data streams that can each provide sufficient audio data for an audio representation for the content, but that comprise different types of audio data. In this way, the transport stream is arranged to include an elementary stream comprising different types of audio data. In fact, some of the audio data in this elementary stream is designed to be mandatory audio data for audio representation. Mandatory audio data needs to be rendered when the audio representation is presented. Other data in the elementary data stream is designated as replaceable audio data. This replaceable audio data is audio data for the audio representation, but it is audio data that the receiver is allowed to replace with other (alternative) data.

[0337] Dessa forma, nas abordagens, é fornecido um único fluxo elementar com diferentes tipos de dados para uma dada representação de áudio, a saber, com alguns dados que são designados como dados de áudio obrigatórios que precisam ser renderizados quando a representação de áudio é apresentada, e com outros dados que são designados como dados de áudio substituíveis que podem ser substituídos/ou repostos por outros dados.[0337] Thus, in the approaches, a single elementary stream with different data types is provided for a given audio representation, namely, with some data that is designated as mandatory audio data that needs to be rendered when the audio representation is displayed, and with other data that is referred to as replaceable audio data that can be replaced/or replaced by other data.

[0338] Consequentemente, nas abordagens, um fluxo de transporte fornece uma representação de áudio na qual diferentes tipos de dados de áudio para a representação de áudio são fornecidos dentro de um único fluxo de dados elementar. Além do mais, os dados são especificamente designados como dados que precisam ser apresentados/renderizados (quando a representação de áudio correspondente é apresentada/renderizada) ou dados que podem ser trocados/substituídos por outros dados. Os dados de áudio substituíveis são dados que são designados como sendo possíveis de serem trocados por outros dados, mas que não podem ser apagados sem serem substituídos.[0338] Accordingly, in the approaches, a transport stream provides an audio representation in which different types of audio data for the audio representation are provided within a single elementary data stream. Furthermore, data is specifically designated as data that needs to be presented/rendered (when the corresponding audio representation is presented/rendered) or data that can be exchanged/replaced with other data. Replaceable audio data is data that is designated as being exchangeable for other data, but cannot be erased without being overwritten.

[0339] Essa abordagem específica fornece uma estrutura de fluxo de dados que é substancialmente mais eficiente e fornece uma compensação melhor entre taxa de dados, complexidade e flexibilidade em muitos cenários e aplicações. Adicionalmente, a mesma pode fornecer essas vantagens ao mesmo tempo em que fornece uma retrocompatibilidade maior em relação às abordagens da técnica anterior, como fluxos (streams) de transporte MPEG.[0339] This particular approach provides a data flow structure that is substantially more efficient and provides a better trade-off between data rate, complexity, and flexibility in many scenarios and applications. Additionally, it can provide these advantages while providing greater backwards compatibility with prior art approaches, such as MPEG transport streams.

[0340] Especificamente, as abordagens podem fornecer um fluxo de bits que não requer muita sobrecarga, e ainda fornece uma abordagem flexível. Um receptor de baixa complexidade pode identificar e extrair dados com base em como os dados são estruturados em fluxos elementares. Entretanto, o mesmo pode ainda aumentar a flexibilidade ao designar que diferentes dados de áudio de um fluxo elementar tenham diferentes características no que diz respeito à representação de áudio.[0340] Specifically, the approaches can provide a bit stream that does not require much overhead, yet provides a flexible approach. A low-complexity receiver can identify and extract data based on how the data is structured into elementary streams. However, it can also increase flexibility by designating that different audio data from an elementary stream have different characteristics with regard to audio representation.

[0341] As abordagens podem possibilitar, por exemplo, que um receptor com legado de baixa complexidade, ainda seja capaz de renderizar a representação de áudio do fluxo de dados novo com base meramente na identificação do fluxo elementar. Por exemplo, em muitas modalidades, um decodificador MPEG pode simplesmente extrair o primeiro fluxo elementar e tratá-lo como um fluxo elementar MPEG padrão. Isso pode resultar na geração de uma apresentação de áudio nominal. Entretanto, em adição a tal retrocompatibilidade, um receptor não-legado pode processar o fluxo de dados recebido e trocar os dados de áudio substituíveis por dados alternativos, gerando assim uma apresentação de áudio alternativa. Isso pode ser ainda obtido com baixa complexidade e não requer a sobrecarga e processamento complexo associado aos, por exemplo, objetos de áudio.[0341] The approaches may enable, for example, a low-complexity legacy receiver to still be able to render the audio representation of the new data stream based merely on elementary stream identification. For example, in many embodiments, an MPEG decoder may simply extract the first elementary stream and treat it as a standard MPEG elementary stream. This may result in the generation of a nominal audio presentation. However, in addition to such backward compatibility, a non-legacy receiver may process the received data stream and exchange the substitutable audio data for alternative data, thereby generating an alternative audio presentation. This can still be achieved with low complexity and does not require the overhead and complex processing associated with, for example, audio objects.

[0342] As abordagens fornecem uma solução vantajosa ao problema técnico de como distribuir melhor o conteúdo de áudio para itens de conteúdo audiovisual, e fornecem especificamente uma estrutura de fluxo de dados (transporte) e conteúdo de dados que fornece uma compensação aprimorada entre a taxa de dados, complexidade e flexibilidade, e que pode fornecer também retrocompatibilidade aprimorada.[0342] The approaches provide an advantageous solution to the technical problem of how to best distribute audio content to audiovisual content items, and specifically provide a data flow (transport) and data content structure that provides an improved trade-off between the rate of data, complexity and flexibility, and which can also provide improved backwards compatibility.

[0343] Os dados de áudio obrigatórios são dados que são designados (e em muitas modalidades indicados) a serem dados que precisam ser incluídos em uma renderização da representação de áudio/cena de áudio. Dessa forma, os dados de áudio obrigatórios para uma apresentação de áudio são dados que estão incluídos no fluxo de dados elementar e que precisam ser renderizados se a representação de áudio/cena de áudio do fluxo de dados elementar for selecionada. Dessa forma, os dados de áudio obrigatórios são dados que são designados a serem compulsórios, requisitados, obrigatórios etc., para a renderização da representação de áudio/cena de áudio associada ao fluxo de dados elementar. Em muitas modalidades, os dados de áudio obrigatórios e os dados de áudio substituíveis podem estar compreendidos em um fluxo de dados elementar associado a apenas uma representação de áudio/cena de áudio.[0343] Mandatory audio data is data that is designated (and in many embodiments indicated) to be data that needs to be included in a rendering of the audio representation/audio scene. Therefore, the required audio data for an audio presentation is data that is included in the elementary data stream and that needs to be rendered if the audio representation/audio scene of the elementary data stream is selected. Thus, mandatory audio data is data that is designated to be compulsory, required, required, etc., for the rendering of the audio representation/audio scene associated with the elementary data stream. In many embodiments, the required audio data and the replaceable audio data may be comprised of an elementary data stream associated with only one audio representation/audio scene.

[0344] Os dados de áudio obrigatórios podem ser designados/indicados a serem dados de áudio obrigatório, por exemplo, através da posição no fluxo elementar e/ou pelos dados de controle que descrevem os dados que serão obrigatórios. Dessa forma, em algumas modalidades, o fluxo de dados de transporte, e possivelmente, especificamente, o fluxo de dados elementar, pode incluir dados que indicam quais dados de áudio do fluxo de dados elementar são dados de áudio obrigatórios.[0344] Mandatory audio data may be designated/indicated to be mandatory audio data, for example, through position in the elementary stream and/or by control data describing the data that will be mandatory. Thus, in some embodiments, the transport data stream, and possibly specifically the elementary data stream, may include data indicating which audio data of the elementary data stream is required audio data.

[0345] Dado substituível é um dado que é designado (e em muitas modalidades, indicado) a ser um dado que pode ser incluído em uma renderização da representação de áudio/cena de áudio ou que pode ser substituído por outros dados de áudio na renderização da representação de áudio/cena de áudio. Dessa forma, os dados de áudio substituíveis para uma apresentação de áudio são dados que estão incluídos no fluxo de dados elementar e que precisam ser renderizados se a representação de áudio/cena de áudio do fluxo de dados elementar for selecionada, a menos que haja substituição por outros dados de áudio. Os dados de áudio substituíveis são dados que podem ser renderizados ou que podem ser trocados/substituídos/permutados por dados alternativos quando da renderização/apresentação da representação de áudio/cena de áudio associada ao fluxo de dados elementar.[0345] Replaceable data is data that is designed (and in many embodiments, indicated) to be data that can be included in a rendering of the audio representation/audio scene or that can be replaced by other audio data in the rendering of the audio representation/audio scene. Thus, substitutable audio data for an audio presentation is data that is included in the elementary data stream and that needs to be rendered if the audio representation/audio scene of the elementary data stream is selected, unless overridden by other audio data. Replaceable audio data is data that can be rendered or that can be swapped/replaced/exchanged with alternative data when rendering/presenting the audio representation/audio scene associated with the elementary data stream.

[0346] Nas abordagens descritas, a distribuição de conteúdo é se baseia, consequentemente, em um fluxo (transporte) que inclui uma pluralidade de sub-fluxos de dados (elementares), sendo que uma representação de áudio pode ser descrita por um único fluxo de dados elementar que compreende tanto dados designados como dados obrigatórios, quanto dados designados como dados de áudio substituíveis, isto é, um único fluxo de dados elementar inclui tanto dados de áudio que um receptor precisa apresentar ao apresentar a representação de áudio, quanto dados de áudio que o receptor precisa trocar por outros dados.[0346] In the approaches described, content distribution is consequently based on a stream (transport) that includes a plurality of (elementary) data sub-streams, whereby an audio representation can be described by a single stream elemental data stream that comprises both data designated as mandatory data and data designated as replaceable audio data, that is, a single elementary data stream includes both audio data that a receiver needs to present when presenting the audio representation, and audio that the receiver needs to exchange for other data.

[0347] Dessa forma, o receptor recebe os dados de áudio que ele sabe que precisam ser renderizados, assim como dados que ele sabe que pode trocar por outros dados. Além do mais, ele recebe esses dados em um único fluxo elementar, tornando assim uma apresentação da representação de áudio possível simplesmente pela extração dos dados de áudio a partir de um fluxo de dados elementar e pela renderização dos mesmos (fornecendo assim retrocompatibilidade).[0347] In this way, the receiver receives audio data that it knows needs to be rendered, as well as data that it knows it can exchange for other data. Furthermore, it receives this data in a single elementary stream, thus making a presentation of the audio representation possible simply by extracting the audio data from an elementary data stream and rendering it (thus providing backward compatibility).

[0348] Dessa forma, o fluxo de transporte compreende dados que são associados a restrições especificas a como eles precisam ser usados por um receptor/renderizador. Essa estrutura específica de diferentes tipos de dados que são designados para serem usados de modo diferente, e que são associados a diferentes restrições ao seu uso, pode propiciar a geração de um fluxo de transporte eficiente com compensações aprimoradas, e, especificamente, que ainda possibilita processamento de baixa complexidade e retrocompatibilidade ao mesmo tempo que uma flexibilidade maior.[0348] In this way, the transport stream comprises data that is associated with specific constraints on how it needs to be used by a receiver/renderer. This specific structure of different types of data that are designed to be used differently, and that are associated with different restrictions on their use, can provide the generation of an efficient transport flow with improved tradeoffs, and, specifically, that still allows low complexity processing and backward compatibility while providing greater flexibility.

[0349] Na verdade, a designação de dados de áudio para uma representação de áudio dentro de um fluxo de dados elementar como dados de áudio obrigatórios ou substituíveis, fornece benefícios substanciais. A estrutura, conteúdo e organização descrita do fluxo de dados do item de conteúdo audiovisual fornecem um fluxo de transporte que pode ser processado com baixa complexidade, pode ser retrocompatível, fornecendo ainda maior flexibilidade.[0349] In fact, designating audio data for an audio representation within an elementary data stream as mandatory or replaceable audio data provides substantial benefits. The described structure, content and organization of the audiovisual content item data stream provides a transport stream that can be processed with low complexity, can be backwards compatible, providing even greater flexibility.

[0350] Consequentemente, a abordagem não está focada na derivação, determinação ou seleção de qualquer política específica de mixagem ou áudio, mas, ao invés disso, trata da solução técnica que pode suportar a distribuição efetiva de dados de áudio de modo que se possa atender às orientações. A abordagem possibilita o uso de fluxos de dados que possibilitam que orientações flexíveis (mas não totalmente livres) sejam distribuídas, mantendo, ao mesmo tempo, uma baixa sobrecarga de dados e complexidade reduzida. As abordagens não focam em como selecionar uma estratégia de mixagem, mas em como suportar tecnicamente a distribuição de dados de áudio. A abordagem possibilita que alguns aspectos da orientação de renderização sejam determinados pela fonte (por exemplo, os dados de áudio obrigatórios), enquanto outros aspectos podem ser adaptados na extremidade de recepção/renderização (por exemplo, o receptor pode fazer a seleção entre diferentes componentes de áudio alternativos).[0350] Consequently, the approach is not focused on deriving, determining or selecting any specific mixing or audio policy, but rather addresses the technical solution that can support the effective distribution of audio data so that one can comply with the guidelines. The approach enables the use of data streams that enable flexible (but not completely free) guidance to be distributed while maintaining low data overhead and reduced complexity. The approaches do not focus on how to select a mixing strategy, but on how to technically support the distribution of audio data. The approach enables some aspects of the rendering orientation to be determined by the source (e.g., the required audio data), while other aspects can be adapted at the receiving/rendering end (e.g., the receiver can select between different components alternative audio tracks).

[0351] Deve-se observar também que não é o processamento real no receptor que define os dados. Ao invés disso, é o dado no fluxo de dados que é designado como obrigatório ou substituível para uma representação de áudio. Consequentemente, o dado é definido pelo uso a que se destina, isto é, o dado de áudio obrigatório é o dado que deve ser apresentado caso a representação de áudio seja selecionada, enquanto que o dado de áudio substituível pode ser trocado por outros dados alternativos (mas não pode ser meramente apagado).[0351] It should also be noted that it is not the actual processing at the receiver that defines the data. Rather, it is the data in the data stream that is designated as mandatory or substitutable for an audio representation. Consequently, the data is defined by its intended use, i.e., mandatory audio data is the data that must be presented if the audio representation is selected, while substitutable audio data can be exchanged for other alternative data (but cannot be merely deleted).

[0352] Deve-se considerar que, a título de clareza, a descrição acima descreveu as modalidades da invenção com referência a diferentes circuitos, unidades e processadores funcionais. Entretanto, ficará evidente que qualquer distribuição adequada de funcionalidade entre os diferentes circuitos, unidades ou processadores funcionais pode ser usada sem se desviar da invenção. Por exemplo, a funcionalidade ilustrada a ser executada por processadores ou controladores separados pode ser executada pelo mesmo processador ou pelos mesmos controladores. Por isso, as referências a unidades ou circuitos funcionais específicos devem ser consideradas apenas como referências a meios adequados para fornecer a funcionalidade descrita e não como indicativas de uma estrutura física ou uma organização lógica ou física estrita.[0352] It should be considered that, for the sake of clarity, the above description described embodiments of the invention with reference to different functional circuits, units and processors. However, it will be evident that any suitable distribution of functionality between the different functional circuits, units or processors can be used without departing from the invention. For example, functionality illustrated to be performed by separate processors or controllers may be performed by the same processor or controllers. Therefore, references to specific functional units or circuits should be considered only as references to means suitable for providing the described functionality and not as indicative of a physical structure or strict logical or physical organization.

[0353] A invenção pode ser implementada em qualquer forma adequada, incluindo hardware, software, firmware ou qualquer combinação dos mesmos. A invenção pode, opcionalmente, ser implementada, ao menos parcialmente, como software de computador que é executado em um ou mais processadores de dados e/ou processadores de sinal digital. Os elementos e os componentes de uma modalidade da invenção podem ser física, funcional e logicamente implementados de qualquer forma adequada. De fato, a funcionalidade pode ser implementada em uma unidade única, em uma pluralidade de unidades ou como parte de outras unidades funcionais. Assim, a invenção pode ser implementada em uma unidade única ou pode ser física e funcionalmente distribuída entre diferentes unidades, circuitos e processadores.[0353] The invention may be implemented in any suitable form, including hardware, software, firmware or any combination thereof. The invention may optionally be implemented, at least partially, as computer software that runs on one or more data processors and/or digital signal processors. The elements and components of an embodiment of the invention may be physically, functionally and logically implemented in any suitable manner. In fact, functionality can be implemented in a single unit, in a plurality of units, or as part of other functional units. Thus, the invention can be implemented in a single unit or can be physically and functionally distributed among different units, circuits and processors.

[0354] Embora a presente invenção tenha sido descrita em relação a algumas modalidades, não se pretende limitá-la à forma específica aqui apresentada. Ao invés disso, o escopo da presente invenção é limitado apenas pelas reivindicações em anexo. Adicionalmente, embora possa parecer que um recurso é descrito em relação a modalidades específicas, o elemento versado na técnica irá reconhecer que vários recursos das modalidades descritas podem ser combinados de acordo com a invenção. Nas reivindicações, o termo “que compreende” não exclui a presença de outros elementos ou etapas.[0354] Although the present invention has been described in relation to some embodiments, it is not intended to limit it to the specific form presented here. Instead, the scope of the present invention is limited only by the appended claims. Additionally, although it may appear that a feature is described in relation to specific embodiments, one skilled in the art will recognize that various features of the described embodiments may be combined in accordance with the invention. In the claims, the term “comprising” does not exclude the presence of other elements or steps.

[0355] Além disso, embora individualmente mencionados, uma pluralidade de meios, elementos, circuitos ou etapas de métodos podem ser implementados, por exemplo, por meio de um único circuito, unidade ou processador. Adicionalmente, embora recursos individuais possam estar incluídos em reivindicações diferentes, eles podem ser vantajosamente combinados, e sua inclusão em reivindicações diferentes não implica que uma combinação de recursos não seja viável e/ou vantajosa. Além disso, a inclusão de um recurso em uma categoria das reivindicações não implica em uma limitação a tal categoria, mas, ao invés disso, indica que o recurso é igualmente aplicável a outras categorias das reivindicações, conforme for adequado. Além disso, a ordem dos recursos nas reivindicações não implica em nenhuma ordem específica na qual os recursos precisam ser trabalhados e, em particular, a ordem das etapas individuais em uma reivindicação de método não implica que as etapas precisem ser executadas nessa ordem. Mais propriamente, as etapas podem ser executadas em qualquer ordem adequada. Além disso, referências no singular não excluem uma pluralidade. Dessa forma, as referências a “um(a)”, “uns/umas”, “primeiro(a)”, “segundo(a)”, etc., não excluem uma pluralidade. Os sinais de referência nas reivindicações são fornecidos meramente como exemplos esclarecedores e não devem ser interpretados como limitadores do escopo das reivindicações de forma alguma.[0355] Furthermore, although individually mentioned, a plurality of means, elements, circuits or method steps may be implemented, for example, by means of a single circuit, unit or processor. Additionally, although individual features may be included in different claims, they may be advantageously combined, and their inclusion in different claims does not imply that a combination of features is not viable and/or advantageous. Furthermore, the inclusion of a feature in one category of claims does not imply a limitation to that category, but rather indicates that the feature is equally applicable to other categories of claims, as appropriate. Furthermore, the order of the features in the claims does not imply any specific order in which the features need to be worked on, and in particular, the order of the individual steps in a method claim does not imply that the steps need to be performed in that order. Rather, the steps can be performed in any suitable order. Furthermore, singular references do not exclude a plurality. Thus, references to “one”, “one”, “first”, “second”, etc., do not exclude a plurality. Reference marks in the claims are provided merely as clarifying examples and should not be construed as limiting the scope of the claims in any way.

Claims

1. METHOD OF GENERATING AN AUDIO SIGNAL FOR AN AUDIOVISUAL CONTENT ITEM, characterized by comprising: receiving a data stream from the audiovisual content item comprising a plurality of individual audiovisual data streams, the plurality of streams Individual audiovisual data (streams) comprise audiovisual components for an audiovisual content item; wherein each audiovisual data stream comprises encoded data representing at least one audiovisual component and synchronization data; wherein the data stream of the audiovisual content item comprises a first individual audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, wherein the first audio data comprises audio data required for the audio representation and substitutable audio data for the audio representation, the mandatory audio data corresponding to an audio component that must be rendered when the audio representation is rendered, and the substitutable audio data corresponding to a substitutable audio component that may be replaced by an alternative audio component when the audio representation is rendered, the content item data stream further comprising a content item map table for the audiovisual content item, the content item map table comprising a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the audiovisual content item, and the content item map table comprising a data stream packet identifier common to the audiovisual content item for a set of at least two of the plurality of individual audiovisual data streams; wherein the method further comprises: extracting the required audio data from the first audio data in response to the common data stream packet identifier; recover alternative audio data; replace the substitutable audio data with alternative audio data; generating the audio signal from the required audio data and alternative audio data; wherein the method further comprises: generating a new individual audiovisual data stream from the plurality of individual audiovisual data streams; generate an audio data processing descriptor for second audio data from at least one of the audiovisual data streams, insert the audio data processing descriptor into the new individual audiovisual data stream, and feed the new individual audiovisual data stream to an audio decoder; and wherein generating the audio signal comprises the audio decoder generating the audio signal from audio data of the new individual audiovisual data stream, extracting the audio data processing descriptor from the new individual audiovisual data stream ; and generating the audio signal in response to the audio data processing descriptor.

2. METHOD, according to claim 1, characterized by additionally comprising receiving a second data stream of the audiovisual content item comprising a plurality of audiovisual data streams, wherein the plurality of audiovisual data streams comprises audiovisual components; and that the recovery comprises recovering the alternative audio data of an audiovisual data stream from the second data stream of the audiovisual content item.

3. METHOD, according to claim 1, characterized by the step of generating the audio signal comprising: decoding the mandatory audio data in a first audio decoder to generate a first decoded audio signal; decoding the alternative audio data in a second audio decoder to generate a second decoded audio signal; and generating the audio signal in response to the combination of the at least first decoded audio signal and the second decoded audio signal.

4. METHOD, according to claim 1, characterized in that the content item map table comprises a plurality of secondary packet identifiers, each secondary packet identifier identifying an audiovisual data stream from the set of at least two among the plurality of individual audiovisual data streams; and by the step of extracting audio data for the content item comprising extracting audio data for different audio components in response to the secondary packet identifiers.

5. APPARATUS FOR GENERATING AN AUDIO SIGNAL FOR AN AUDIOVISUAL CONTENT ITEM, characterized by comprising: a receiver for receiving a data stream from the audiovisual content item comprising a plurality of individual audiovisual data streams, the plurality of streams ( streams) of individual audiovisual data comprises audiovisual components for an audiovisual content item; wherein each audiovisual data stream comprises encoded data representing at least one audiovisual component and synchronization data; wherein the content item data stream comprises a first audiovisual data stream comprising first audio data for an audio representation for the audiovisual content item, the first audio data comprising audio data required for the representation of audio and substitutable audio data for the audio representation, the mandatory audio data corresponding to an audio component that must be rendered when the audio representation is rendered, and the substitutable audio data corresponding to a substitutable audio component that can be replaced by an alternate audio component when the audio representation is rendered, the audiovisual content item data stream further comprising a content item map table for the audiovisual content item, the content item map table comprising a list of audiovisual data stream packet identifiers for data packets for audiovisual data streams linked to the audiovisual content item, and the content item map table comprising a common data stream packet identifier for the content item audiovisual for a set of at least two of the plurality of individual audiovisual data streams; wherein the apparatus further comprises: an extractor (403) for extracting the required audio data from the first audio data in response to the common data stream packet identifier; a retriever (407) for retrieving alternative audio data; a replacer (415) for replacing the replaceable audio data with the alternative audio data; an output (415) for generating the audio signal from the mandatory audio data and alternative audio data; an audio decoder for generating the audio signal from the audio data of a new individual audiovisual data stream, the audio decoder comprising the extractor (403), the recoverer (407), the replacer (415) and the output; and wherein the receiver (1401) is arranged to generate the new individual audiovisual data stream from the plurality of new individual audiovisual data streams and to generate an audio data processing descriptor for the second audio data of at least one of the audiovisual data streams and to insert the audio data processing descriptor into the new individual audiovisual data stream and to feed the new individual audiovisual data stream to the audio decoder; and the audio decoder (1403) further comprises an audio data processing descriptor extractor for extracting the audio data processing descriptor from the second audiovisual data stream; and the audio decoder (1403) is arranged to generate the audio signal in response to the audio data processing descriptor.

6. APPARATUS according to claim 5, characterized in that it comprises an audio decoder for generating the audio signal from audio data of the plurality of individual audiovisual data streams, the audio decoder comprising the extractor (403 ), the recuperator (407), the replacer (415) and the outlet; and: by the receiver (1401) being arranged to generate an audio data processing descriptor for the second audio data of at least one of the audiovisual data streams and insert the audio data processing descriptor into a second stream of audiovisual data and feeding the second audiovisual data stream into the audio decoder; and by the audio decoder (1403) further comprising an audio data processing descriptor extractor for extracting the audio data processing descriptor from the second audiovisual data stream; and by the audio decoder (1403) being arranged to generate the audio signal in response to the audio data processing descriptor.

7. APPARATUS according to claim 6, characterized in that the audio data processing descriptor is indicative of whether the second audio data replaces the replaceable data.

8. APPARATUS according to claim 6, characterized in that the audio data processing descriptor is indicative of the second audio data being designated as alternative audio data or additional audio data, and in that the audio decoder (1403) is arranged so as to recover the second audio data as alternative audio data, if the first audio data processing descriptor indicates that the second audio data is designated as alternative audio data, and to recover the second audio data as alternative audio data additional audio data, if the first data processing descriptor indicates that the second audio data is designated as additional audio data; and replacing the substitutable audio data with the second audio data, if the second audio data is designated as substitutable audio data, and the output is arranged to generate the audio signal by combining the required audio data, of the second audio data and the replaceable audio data, if the first audio data processing descriptor indicates that the second audio data is designated as additional audio data.

9. APPARATUS according to claim 6, characterized in that the receiver (1401) is arranged to generate the first audio data processing descriptor from a second audio data processing descriptor received in the data stream of the audiovisual content item.

10. APPARATUS according to claim 6, characterized in that the receiver (1401) is arranged to copy the second audio data processing descriptor to the second audiovisual data stream.

11. APPARATUS according to claim 6, characterized in that the second audio data processing descriptor is comprised in the content item map table.

12. APPARATUS according to claim 6, characterized in that the data stream of the audiovisual content item comprises a plurality of possible audio data processing descriptors for the second audio data; and by the receiver being arranged to select the first audio data processing descriptor from the plurality of possible audio data processing descriptors.