BR112019014283A2 - Decodificador de áudio, codificador de áudio, método para fornecer um sinal de áudio decodificado, método para fornecer um sinal de áudio codificado, fluxo de áudio, provedor de fluxo de áudio e programa de computador que usa um identificador de fluxo. - Google Patents
Decodificador de áudio, codificador de áudio, método para fornecer um sinal de áudio decodificado, método para fornecer um sinal de áudio codificado, fluxo de áudio, provedor de fluxo de áudio e programa de computador que usa um identificador de fluxo. Download PDFInfo
- Publication number
- BR112019014283A2 BR112019014283A2 BR112019014283-5A BR112019014283A BR112019014283A2 BR 112019014283 A2 BR112019014283 A2 BR 112019014283A2 BR 112019014283 A BR112019014283 A BR 112019014283A BR 112019014283 A2 BR112019014283 A2 BR 112019014283A2
- Authority
- BR
- Brazil
- Prior art keywords
- audio
- configuration
- information
- stream
- decoder
- Prior art date
Links
- 230000005236 sound signal Effects 0.000 title claims abstract description 113
- 238000000034 method Methods 0.000 title claims description 77
- 238000004590 computer program Methods 0.000 title claims description 15
- 230000007704 transition Effects 0.000 claims abstract description 65
- 238000012545 processing Methods 0.000 claims description 20
- 230000011664 signaling Effects 0.000 claims description 12
- 230000008569 process Effects 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims 1
- 230000012173 estrus Effects 0.000 claims 1
- 238000005755 formation reaction Methods 0.000 claims 1
- RIHNPJLBFJQNRE-UHFFFAOYSA-N n,n'-bis[2-(1h-imidazol-2-yl)ethyl]pentanediamide Chemical compound N=1C=CNC=1CCNC(=O)CCCC(=O)NCCC1=NC=CN1 RIHNPJLBFJQNRE-UHFFFAOYSA-N 0.000 claims 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims 1
- 230000008859 change Effects 0.000 description 20
- 230000003595 spectral effect Effects 0.000 description 11
- 238000010586 diagram Methods 0.000 description 10
- 238000005070 sampling Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 8
- 230000006978 adaptation Effects 0.000 description 6
- 230000003044 adaptive effect Effects 0.000 description 5
- 239000011324 bead Substances 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000005562 fading Methods 0.000 description 5
- 238000009877 rendering Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000013139 quantization Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000010422 painting Methods 0.000 description 3
- 230000010076 replication Effects 0.000 description 3
- 238000012795 verification Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 238000002513 implantation Methods 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- SEGUUECEFSYLBO-UHFFFAOYSA-N [2-[[1-[2-[[8-amino-4,6-dimethyl-7-oxo-1,9-bis[[7,11,14-trimethyl-2,5,9,12,15-pentaoxo-3,10-di(propan-2-yl)-8-oxa-1,4,11,14-tetrazabicyclo[14.3.0]nonadecan-6-yl]carbamoyl]phenoxazin-3-yl]amino]-2-oxoethoxy]-3-methyl-1-oxobutan-2-yl]amino]-2-oxoethyl] 2-am Chemical compound CC1OC(=O)C(C(C)C)N(C)C(=O)CN(C)C(=O)C2CCCN2C(=O)C(C(C)C)NC(=O)C1NC(=O)C1=C(N)C(=O)C(C)=C2C1=NC1=C(C(=O)NC3C(NC(C(=O)N4CCCC4C(=O)N(C)CC(=O)N(C)C(C(C)C)C(=O)OC3C)C(C)C)=O)C=C(NC(=O)COC(=O)C(C(C)C)NC(=O)COC(=O)C(N)C(C)C)C(C)=C1O2 SEGUUECEFSYLBO-UHFFFAOYSA-N 0.000 description 1
- 108700015902 actinomycin D2 Proteins 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000001627 detrimental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000012530 fluid Substances 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000001343 mnemonic effect Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Stereophonic System (AREA)
Abstract
um decodificador de áudio para fornecer uma representação de sinal de áudio decodificado com base em uma representação de sinal de áudio codificado é configurado para ajustar parâmetros de decodificação na dependência de uma informação de configuração e é também configurado para decodificar um ou mais quadros de áudio usando uma informação de configuração atual. o decodificador de áudio é configurado para comparar uma informação de configuração em uma estrutura de configuração associada com um ou mais quadros a serem decodificados pelas informações de configuração atuais, e fazer uma transição para realizar uma decodificação usando as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados como uma nova informação de configuração se as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, ou uma porção relevante das informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, é diferente a partir das informações de configuração atuais. o decodificador de áudio é configurado para considerar uma informação de identificador de fluxo incluída na estrutura de configuração ao comparar as informações de configuração, tal que uma diferença entre um identificador de fluxo previamente adquirido pelo decodificador de áudio e um identificador de fluxo representado pelas informações de identificador de fluxo na estrutura de configuração associada com o um ou mais quadros a serem decodificados faz com que a transição seja feita.
Description
DECODIFICADOR DE ÁUDIO, CODIFICADOR DE
ÁUDIO, MÉTODO PARA FORNECER UM SINAL DE ÁUDIO DECODIFICADO, MÉTODO PARA FORNECER UM SINAL DE ÁUDIO CODIFICADO, FLUXO DE ÁUDIO, PROVEDOR DE FLUXO DE ÁUDIO E PROGRAMA DE COMPUTADOR QUE USA UM IDENTIFICADOR DE FLUXO.
RELATÓRIO DESCRITIVO
CAMPO DA TÉCNICA [0001] As modalidades de acordo com a invenção são relacionadas a um decodificador de áudio para fornecer uma representação de sinal de áudio decodificado com base em uma representação de sinal de áudio codificado.
[0002] Outras modalidades de acordo com a invenção são relacionadas a um codificador de áudio para fornecer uma representação de sinal de áudio codificado.
[0003] Outras modalidades de acordo com a invenção são relacionadas a um método para fornecer uma representação de sinal de áudio decodificado.
[0004] Outras modalidades de acordo com a invenção são relacionadas a um método para fornecer uma representação de sinal de áudio codificado.
[0005] Outras modalidades de acordo com a invenção são relacionadas a um fluxo de áudio.
[0006] Outras modalidades de acordo com a invenção são relacionadas a um provedor de fluxo de áudio.
[0007] Outras modalidades de acordo com a invenção são relacionadas a um programa de computador para realizar um dos métodos.
ANTECEDENTES DA INVENÇÃO
Petição 870190068437, de 19/07/2019, pág. 6/152
2/111 [0008] A seguir, serão descritos problemas subjacentes a aspectos da invenção e possíveis cenários de uso para modalidades de acordo com a invenção.
[0009] Existem situações em que há transições entre diferentes fluxos de áudio ou entre diferentes sequências de quadros de áudio codificados. Por exemplo, sequências diferentes de quadros de áudio podem compreender diferentes conteúdos de áudio, entre os quais uma transição deve ser feita.
[0010] Por exemplo, quando MPEG-D USAC (ISO/IEC 23003 3 + Amd.1 + Amd.2 + Amd.3) é utilizado em um caso de uso de transmissão contínua adaptativa, pode ocorrer uma situação na qual dois fluxos dentro de um chamado conjunto de adaptação (que pode, por exemplo, agrupar dois ou mais fluxos entre os quais um usuário pode comutar) tem estruturas de configuração exatamente idênticas, embora suas taxas de bits sejam diferentes. Isso pode acontecer, por exemplo, se o codificador simplesmente optar por operar o codificador com exatamente o mesmo conjunto de ferramentas de codificação para ambas as taxas de bits.
[0011] Por exemplo, um codificador de áudio pode usar as mesmas configurações fundamentais de codificação (que também são sinalizadas para um decodificador de áudio), mas ainda pode fornecer representações diferentes dos valores de áudio. Por exemplo, o codificador de áudio pode usar uma quantização mais grosseira de valores espectrais, o que resulta em uma menor demanda de bits, quando se deseja obter uma taxa de bits mais baixa, embora as configurações
Petição 870190068437, de 19/07/2019, pág. 7/152
3/111 fundamentais do codificador ou decodificador permaneçam inalteradas.
[0012] [0012] Entretanto, isso (por exemplo, a ocorrência de uma situação em que dois fluxos dentro de um conjunto de adaptação têm estruturas de configuração exatamente idênticas, mesmo que suas taxas de bits sejam diferentes) não é problemática como tal.
[0013] Entretanto, verificou-se que, em um caso de uso de transmissão adaptativa, o descodificador deve saber se as unidades de acesso recebidas subsequentemente (ou quadros) provêm ou não do mesmo fluxo ou se ocorreu uma alteração no fluxo.
[0014] Verificou-se que, se uma alteração de fluxos foi detectada, um decodificador de áudio, em alguns casos, será executado através de uma sequência especificada de etapas operacionais que garantam o seguinte:
• Um exemplo de decodificador é desligado de forma adequada e as partes do sinal decodificadas armazenadas temporariamente internamente são alimentadas à saída do decodificador - um processo chamado descarga.
• O decodificador reinstanciará e reconfigurará usando as próprias informações de configuração associadas ao fluxo alterado.
• O decodificador pré-rolará as unidades de acesso embutidas que são protegidas por senha em um quadro de reprodução imediata (IPF). Esta pré-rolagem de unidades de acesso coloca o decodificador em um estado totalmente inicializado, de modo que a saída da
Petição 870190068437, de 19/07/2019, pág. 8/152
4/111 decodificação do primeiro quadro resulte em um sinal de áudio decodificado totalmente compatível.
• Opcionalmente, por exemplo, dependendo de um elemento de sinalização de fluxo de bits correspondente, a saída de áudio do processo de descarga do descodificador e a saída da descodificação da primeira unidade de acesso do descodificador reconfigurado são atravessadas de forma cruzada durante um período de tempo muito curto.
[0015] Todas as etapas acima podem ser executadas, por exemplo, a fim de atingir a meta plena de obter uma transição ininterrupta do áudio decodificado de um fluxo para o áudio decodificado de outro fluxo. 'Ininterrupta significa que não há artefatos audíveis tampouco falhas das transições de fluxo por si só. A transição de fluxo pode ser, de fato, perceptivelmente notável devido - por exemplo - a uma variação na qualidade geral de codificação ou largura de banda ou timbre do áudio. No entanto, um real instante (no real) da transição não causa uma impressão
auditiva | por si só. Em | outras | palavras, nao | há ‘ | 'cliques | ou |
estouros | de ruído ou | sons | inconvenientes | semelhantes | no | |
instante | da transição. | |||||
[0016] | Constatou-se | que | uma informação | sobre | a |
possibilidade de uma alteração de fluxo ter ocorrido pode ser obtida a partir da análise de uma estrutura de configuração que é incorporada em um quadro de playout imediato e da comparação da mesma à configuração do fluxo decodificado atualmente. Por exemplo, um decodificador de áudio pode assume a alteração do fluxo caso, e apenas caso,
Petição 870190068437, de 19/07/2019, pág. 9/152
5/111 uma configuração recebida seja diferente da configuração atual.
[0017] Por exemplo, caso um decodificador receba um quadro de playout imediato (IPF) de um fluxo com uma taxa de bits variável, o mesmo detecta a presença de uma carga de extensão de Pré-Rolagem de Áudio, extrai a estrutura de configuração e conduzirá uma comparação entre essa nova configuração e a configuração atual. Para mais detalhes, consultar também ISO/IEC 23003-3:2012/Amd.3 , sub-clásula Bitrate adaption.
[0018] No entanto, constatou-se que caso ambas as estruturas de configuração, a atual e a nova, sejam idênticas, o decodificador não reconhecerá que está recebendo unidades de acesso de um fluxo diferente do anterior e, então, não reconfigurará o decodificador tampouco decodificará a pré-rolagem de áudio que permanece na carga de extensão do IPF.
[0019] Em vez disso, o decodificador tentará continuar a decodificar como se tivesse recebido unidades de acesso continuadas do fluxo anterior ativo. Isso causará (por exemplo, em um caso convencional em que nenhum streamID é usado ou avaliado) a provável situação em que bordas de janelas e modos de codificação do último quadro decodificado e o novo quadro do novo fluxo não correspondem o que, por sua vez, causará artefatos audíveis, tais como cliques ou estouros de ruído. Isso prejudicará o propósito principal dos IPFs e a ideia de transmissão contínua de áudio adaptativa, que se baseia no conceito de transições
Petição 870190068437, de 19/07/2019, pág. 10/152
6/111 ininterruptas entre fluxos.
[0020] A seguir, serão descritas algumas abordagens convencionais.
[0021] Deve-se verificar que para codificação de voz e de áudio unificada (USAC), não há solução conhecida.
[0022] No áudio de MPEG-H 3D (ISO/IEC 23008-3 + todas as emendas), o problema pode ser solucionado caso os dados de áudio sejam transmitidos por meio do formato de fluxo empacotado Fluxo de Áudio MPEG-H (MHAS) O pacotes de MHAS contêm uma identificação de pacote que pode ser diferenciada entre fluxos e, portanto, pode servir ao propósito de diferenciação entre configurações. No entanto, o formato MHAS não é especificado para MPEG-D USAC.
[0023] Em MPEG-4 HE-AAC (ISO/IEC 14496-3 + todas as emendas), há uma alternativa que exige que um codificador garanta que nos pontos potenciais de transição (os então chamados pontos de acesso de fluxo (SAPs)) todos os fluxos tenham formatos de janela e sequências de janela idênticos e limitações adicionais em relação à ferramenta de processamento de sinal empregada. Isso pode ter efeitos prejudiciais na qualidade do áudio resultante. O IPF mencionado acima foi projetado exatamente para isentar um novo codec de todas dessas limitações.
[0024] Em conclusão, há uma demanda para um conceito que permita uma comutação entre diferentes fluxos de áudio e que forneça um meio-termo aprimorado entre uma quantidade de sobrecarga e a facilidade de implantação.
SUMÁRIO DA INVENÇÃO
Petição 870190068437, de 19/07/2019, pág. 11/152
7/111 [0025] Um modalidade, de acordo com a invenção, cria um decodificador de áudio para fornecer uma representação de sinal de áudio decodificado com base em uma representação de sinal de áudio codificado. O decodificador de áudio é configurado para ajustar parâmetros de decodificação dependentes de uma informação de configuração. O decodificador de áudio é configurado para decodificar um ou mais quadros de áudio com o uso de uma configuração atual (por exemplo, com o uso de uma informação de configuração atualmente ativa). Ademais, o decodificador de áudio é configurado para comparar uma informação de configuração em uma estrutura de configuração associada a um ou mais
quadros a | serem decodificados, | com | as | informações de |
configuração | atual, e para fazer | com | que | uma transição |
realize uma | decodificação com o | uso | das | informações de |
configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados como uma nova informação de configuração caso as informações de configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados, ou uma porção relevante (por exemplo, até e incluindo o identificador de fluxo) das informações de configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados, sejam diferentes das informações de configuração atual. O decodificador de áudio é configurado para considerar uma informação de identificador de fluxo incluída na estrutura de configuração quando comparando as informações de configuração, de modo que uma diferença
Petição 870190068437, de 19/07/2019, pág. 12/152
8/111 entre um identificador de fluxo obtido anteriormente pelo decodificador de áudio e um identificador de fluxo representado pelas informações de identificador de fluxo na estrutura de configuração associada ao um ou mais quadros a serem decodificados provoque a transição.
[0026] Essa modalidade de acordo com a invenção se baseia na ideia de que a presença e avaliação de uma informação de identificador de fluxo, que está incluída na estrutura de configuração, permite uma distinção de diferentes fluxos no lado de um decodificador de áudio, e consequentemente de uma transição, até mesmo no caso em que a real configuração de decodificação (que pode, por exemplo, ser descrita pelo restante das informações de configuração na estrutura de configuração), é idêntica para ambos os fluxos. Consequentemente, o identificador de fluxo pode ser usado como um critério para distinguir entre diferentes fluxos entre os quais uma transição pode ser feita. Visto que as informações de identificador de fluxo estão incluídas na estrutura de configuração (por exemplo, junto de outras informações de configuração que ajustam parâmetros de decodificação do decodificador de áudio) é necessário avaliar quaisquer informações de uma diferente camada de protocolo quando se decide se uma transição deve
ser feita. | Por | exemplo, | as | informações | de | identificador | de |
fluxo são | incluídas em | uma | estrutura | de | subdados de | uma | |
estrutura | de | dados | que | define | os | parâmetros | de |
decodificaçao (a estrutura de configurações), de modo que não seja necessário encaminhar quaisquer informações de um
Petição 870190068437, de 19/07/2019, pág. 13/152
9/111 nível de pacote ao real decodificador de áudio. Com a inclusão das informações de identificador de fluxo na
estrutura de | configuração, o | que | permite | que | o |
decodificador | de áudio reconheça | uma | transição | de | um |
primeiro fluxo | para um segundo fluxo, | porém que | não | tem |
qualquer impacto nos parâmetros de decodificação durante a decodificação de uma porção contígua de um único fluxo, é possível reconhecer, no lado do decodificador de áudio, uma comutação entre diferentes fluxos sem acessar informações de um diferente nível de protocolo até mesmo em uma situação na qual parâmetros de decodificação idênticos são usados em diferentes fluxos. Além disso, não é necessário igualar os parâmetros de decodificação em diferentes fluxos em posições nas quais uma comutação entre diferentes fluxos é permissível.
[0027] Em conclusão, o conceito, conforme definido pela reivindicação independente 1, permite um reconhecimento de uma comutação entre diferentes fluxos com complexidade de implantação moderada (por exemplo, sem extrair informações de sinalização dedicadas de um diferente nível de protocolo e encaminhar as mesmas ao decodificador de áudio) durante a evitação da necessidade de vigorar configurações específicas de codificação/decodificação (tal como uma escolha de janelas e assim por diante) em pontos de transição. Desse modo, a sobrecarga excessiva e degradação de uma quantidade de áudio também pode ser evitada.
[0028] Em uma modalidade preferencial, o decodificador de áudio é configurado para verificar se a estrutura de
Petição 870190068437, de 19/07/2019, pág. 14/152
10/111 configuração compreende as informações de identificador de fluxo e considerar seletivamente as informações de identificador de fluxo na comparação se as informações de identificador de fluxo são incluídas na estrutura de configuração. Consequentemente, não é necessário incluir as informações de identificador de fluxo em cada estrutura de configuração. De preferência, é possível omitir o identificador de fluxo nas estruturas de configuração de quadros de áudio nas quais uma possibilidade de uma comutação entre diferentes fluxos não é exigida. Desse modo, alguns bits podem ser economizados, e a avaliação das informações de identificador de fluxo podem ser evitadas em instantes nos quais uma comutação entre diferentes fluxos não é permissível.
[0029] Em uma modalidade preferencial, o decodificador de áudio é configurada para verificar se a estrutura de configuração compreende uma estrutura de extensão de configuração e verificar se a estrutura de extensão de configuração compreende o identificador de fluxo. O decodificador de áudio pode ser configurado para considerar seletivamente as informações de identificador de fluxo na comparação caso as informações de identificador de fluxo estejam incluídas na estrutura de extensão de configuração. [0030] Consequentemente, o identificador de fluxo pode ser colocado em uma estrutura de extensão de configuração cuja presença é opcional, sendo que a presença das informações de identificador de fluxo podem ser consideradas como opcionais até mesmo caso a estrutura de
Petição 870190068437, de 19/07/2019, pág. 15/152
11/111 extensão de configuração esteja presente. Consequentemente, o decodificador de áudio pode reconhecer com flexibilidade se as informações de identificador de fluxo estão presentes, o que fornece a um codificador de áudio a possibilidade de evitar a inclusão de informações desnecessárias. A colocação do identificador de fluxo em uma estrutura de dados que pode ser ativada e desativada (por exemplo, por um sinalizador na porção fixa (sempre presente) da estrutura de configuração), as informações de identificador de fluxo podem ser colocadas exatamente onde necessário ao mesmo tempo que os bits são economizados caso as informações de identificador de fluxo não sejam necessárias. Isso é vantajoso, visto que não é necessário que cada quadro para o qual há uma estrutura de configuração também inclua uma informação de identificador de fluxo, devido ao fato de que uma comutação entre fluxos é tipicamente apenas possível em períodos específicos.
[0031] Em uma modalidade preferencial, o decodificador de áudio é configurado para aceitar uma ordem variável de itens de informações de configuração na estrutura de extensão de configuração. Por exemplo, o decodificador de áudio é configurado para considerar itens de informações de configuração (por exemplo, extensões de configuração) dispostos na estrutura de extensão de configuração antes das informações de identificador de fluxo (por exemplo, antes do item de nome streamID) (por exemplo, assim como as informações de identificador de fluxo) quando em comparação às informações de configuração na estrutura de
Petição 870190068437, de 19/07/2019, pág. 16/152
12/111 configuração associada a um ou mais quadros a serem decodificados com as informações de configuração atual. Ademais, o decodificador de áudio pode ser configurado para deixar itens de informações de configuração (por exemplo, extensões de configuração) dispostos na estrutura de extensão de configuração (por exemplo, UsacConfigExtension()) após as informações de identificador de fluxo não considerados quando se compara as informações de configuração na estrutura de configuração associada a um ou mais quadros a serem decodificados com as informações de configuração atual.
[0032] Com o uso de tal conceito, uma detecção de transições entre diferentes fluxos pode ser feita de maneira bem flexível. Por exemplo, todos esses itens de informações de configuração que indicam alterações significativas de um fluxo de áudio podem ser colocados na estrutura de extensão de configuração antes das informações de identificador de fluxo de modo que uma alteração desses parâmetros acione uma transição de um fluxo para outro fluxo. Por outro lado, deixando-se alguns itens de informações de configuração não quando se compara as informações na estrutura de configuração associadas a um ou mais quadros a serem decodificados com as informações de configuração atual, é possível alterar parâmetros de configuração subordinados para o decodificador de áudio sem acionar uma transição, isto é, uma comutação de um fluxo para outro fluxo, que pode ser conectada a uma reinicialização. Em outras palavras, avaliando-se apenas os
Petição 870190068437, de 19/07/2019, pág. 17/152
13/111 itens de informações de configuração dispostos na estrutura de extensão de configuração antes das informações de identificador de fluxo, e das informações de identificador de fluxo por si só, na comparação, pode-se evitar que qualquer alteração de um parâmetro de decodificação subordinado acione uma transição. De preferência, é possível para um codificador de áudio colocar tais itens de informações de configuração subordinados (que se referem a parâmetros de decodificação subordinados) atrás das informações de identificador de fluxo na estrutura de extensão de configuração. Logo, o codificador de áudio pode alterar tais itens de informações de configuração subordinados dentro de um fluxo, sem acionar uma transição (ou uma reinicialização) com cada uma das alterações. Por outro lado, esses itens de informações de configuração que permanecem inalterados durante um fluxo podem ser colocados antes das informações de identificador de fluxo na estrutura de extensão de configuração, e uma alteração de tal item de informações de configuração altamente relevante (que pode indicar, por exemplo, uma alteração significativa do fluxo de áudio) resulta em uma transição (e tipicamente em uma reinicialização do decodificador de áudio). Visto que o decodificador de áudio também pode aceitar uma ordem variável dos itens de informações de configuração na estrutura de extensão de configuração, um codificador de áudio pode decidir, dependendo das características do sinal ou dependendo de outros critérios, uma alteração de quais itens de
Petição 870190068437, de 19/07/2019, pág. 18/152
14/111 informações de configuração deve acionar uma transição ou uma reinicialização de um decodificador de áudio e uma alteração de quais itens de informações de configuração devem ser possíveis dentro de um fluxo sem acionar uma transição ou uma reinicialização do decodificador de áudio.
[0033] Em uma modalidade preferencial, o decodificador de áudio é configurado para identificar um ou mais itens de informações de configuração na estrutura de extensão de configuração com base em um ou mais identificadores do tipo de extensão de configuração que antecedem os respectivos itens de informações de configuração. Com o uso de tais identificadores do tipo de extensão de configuração é possível implantar a ordem variáveis de itens de informações de configuração.
[0034] Em uma modalidade preferencial, a estrutura de extensão de configuração é uma estrutura de subdados da estrutura de configuração, em que uma presença da estrutura de extensão de configuração é indicada por um bit da estrutura de configuração que é avaliada pelo decodificador de áudio. As informações de identificador de fluxo são um item de subdados da estrutura de extensão de configuração, em que uma presença das informações de identificador de fluxo é indicada por um identificador do tipo de extensão de configuração associado às informações de identificador de fluxo que são avaliadas pelo decodificador de áudio. Consequentemente, é possível decidir com flexibilidade quando uma informação de identificador de fluxo deve ser
Petição 870190068437, de 19/07/2019, pág. 19/152
15/111 adicionada a um fluxo de áudio, e o decodificador de áudio pode determinar facilmente quando tal informação de identificador de fluxo está disponível. Consequentemente, é suficiente incluir informações de identificador de fluxo (que exigem um número de bits) de um fluxo de em instantes em que pode haver uma comutação entre diferentes fluxos. Os quadros de playout imediato (IPF) dentro de um fluxo de áudio contíguo, em uma posição em que não é possível comutar entre diferentes fluxos, não precisam transportar as informações de identificador de fluxo, o que economiza a taxa de bits.
[0035] Em uma modalidade preferencial, o decodificador de áudio é configurado para obter e processar uma representação de áudio (por exemplo, um quadro de playout imediato, IPF) que compreende uma informação de acesso aleatório (por exemplo, uma carga de extensão de prérolagem de áudio, também denominada de AudioPreRoll()) . As informações de acesso aleatório compreendem uma
estrutura de | configuração | (por | exemplo, | denominado | de |
Config()) e | informações | (por | exemplo, | denominadas | de |
AccessUnit() | ) para tornar | um | estado de | uma cadeia | de |
processamento do decodificador de áudio um estado desejado. O decodificador de áudio é configurado para desvanecer de maneira cruzada entre uma informação de áudio representada por um quadro de áudio processado (decodificado) antes de chegar à representação de áudio que compreende as informações de acesso aleatório (por exemplo, quadro de playout imediato, IPF) e uma informação de áudio derivada
Petição 870190068437, de 19/07/2019, pág. 20/152
16/111 com base na representação de áudio que compreende as informações de acesso aleatório após uma inicialização do decodificador de áudio com o uso da estrutura de configuração das informações de acesso aleatório e após ajustar um estado do decodificador de áudio com o uso das informações para tornar um estado para uma cadeia de processamento um estado desejado, caso o decodificador de áudio constate que as informações de configuração na estrutura de configuração e (por exemplo, Config])) as informações de acesso aleatório ou uma porção relevante das informações de configuração na estrutura de configuração das informações de acesso aleatório sejam diferentes das informações de configuração atual. Por exemplo, caso um valor numPreRollFrames seja igual a zero, uma decodificação dos quadros de pré-rolagem pode ser omitida.
[0036] Em outras palavras, avaliando-se as informações de configuração na estrutura de configuração, ou de uma porção relevante das mesmas (por exemplo, até e incluindo uma informação de identificador de fluxo), o decodificador de áudio pode reconhecer se há ou não uma transição entre diferentes fluxos e, no caso de uma transição entre fluxos diferentes, o decodificador de áudio pode usar as informações de acesso aleatório. As informações de acesso aleatório podem ajudar a passar a cadeia de processamento do decodificador de áudio para o estado adequado (o que normalmente ser efetuado, na ausência de uma transição, por um ou mais quadros anteriores), param, então, evitar artefatos na transição. Em conclusão esse conceito permite
Petição 870190068437, de 19/07/2019, pág. 21/152
17/111 a comutação livre de artefato entre fluxos diferentes, em que o decodificador de áudio não precisa de quaisquer informações de um diferente nível de protocolo, com exceção de uma sequência de representações de quadro.
[0037] Em uma modalidade preferencial, o decodificador de áudio é configurado para continuar a decodificação sem realizar uma inicialização do decodificador de áudio e sem usar as informações para tornar um estado da cadeia de processamento do decodificador de áudio um estado desejado (por exemplo, uma carga de extensão de pré-rolagem), caso o decodificador de áudio tenha decodificado um quadro de áudio que precede diretamente um quadro de áudio representado pela representação de áudio que compreende as informações de acesso aleatório (por exemplo, uma quadro de playout imediato) e caso o decodificador de áudio constate que a porção relevante das informações de configuração na estrutura de configuração das informações de acesso aleatório seja igual às informações de configuração atual. Consequentemente, caso o decodificador de áudio reconheça, comparando-se a porção relevante das informações de configuração na estrutura de configuração às informações de configuração atual, que não há transição entre fluxos diferentes, porém, em vez disso, há um playout contíguo do mesmo fluxo, a sobrecarga overhead (por exemplo, uma sobrecarga de processamento ou sobrecarga computacional) que é causada pela realização do decodificador de áudio é evitada. Desse modo, um alto nível de eficiência é alcançado, e a inicialização do decodificador de áudio é
Petição 870190068437, de 19/07/2019, pág. 22/152
18/111 realizada apenas realizada quando necessário.
[0038] Em uma modalidade preferencial, o decodificador de áudio é configurado para realizar uma inicialização do decodificador de áudio com o uso da estrutura de configuração das informações de acesso aleatório e para ajustar um estado do decodificador de áudio com o uso das informações para tornar um estado da cadeia de processamento um estado desejado, caso o decodificador de áudio não tenha decodificado um quadro de áudio que precede diretamente um quadro de áudio representado pela representação de áudio que compreende as informações de acesso aleatório. Em outras palavras, caso haja um acesso aleatório real (em que o decodificador de áudio sabe que o quadro de áudio antecedentes não decodificou) a inicialização também é realizada. Desse modo, as informações de acesso aleatório são usadas no caso de um acesso aleatório real (isto é, quando pula para um determinado quadro) e quando a comutação entre fluxos diferentes (em que um acesso aleatório real pode ser sinalizado ao decodificador de áudio, e em que uma comutação entre fluxos diferentes pode ser apenas reconhecida pelo decodificador de áudio por uma avaliação das informações de identificador de fluxo).
[0039] Deve-se verificar que o decodificador de áudio, conforme discutido no presente contexto pode ser suplementado opcionalmente por qualquer uma dentre os recursos, funcionalidades e detalhes descritos no presente documento ou individualmente ou em combinação.
Petição 870190068437, de 19/07/2019, pág. 23/152
19/111 [0040] Uma modalidade de acordo a invenção cria um codificador de áudio para fornecer uma representação de sinal de áudio codificado. 0 codificador de áudio codifica quadros em sobreposição ou em não sobreposição de um sinal de áudio com o uso de parâmetros de codificação a fim de obter a representação de sinal de áudio codificado 0 codificador de áudio é configurado para fornecer uma estrutura de configuração que os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) . A estrutura de configuração também compreende um identificador de fluxo.
[0041] Consequentemente, o codificador de áudio fornece uma representação de sinal de áudio que é bem utilizável pelo decodificador de áudio mencionado acima. Por exemplo, o codificador de áudio pode incluir diferentes identificadores de fluxo nas estruturas de configuração dos fluxos diferentes. Consequentemente, o identificador de fluxo pode ser uma informação que não descreve uma configuração de decodificador (ou parâmetro de decodificação) a ser usado por um decodificador de áudio, porém, de preferência, identifica um fluxo. Consequentemente, a representação de sinal de áudio codificado compreende um identificador de fluxo, e a identificação dos fluxos diferentes é possível com base nas informações de sinal de áudio codificado, por si só, sem exigir quaisquer informações de um diferente nível de protocolo. Por exemplo, o uso das informações que é fornecido em um nível de pacote não é necessário, visto que
Petição 870190068437, de 19/07/2019, pág. 24/152
20/111 as informações de identificador de fluxo são uma parte integrante da representação de sinal de áudio ou da estrutura de configuração incluída dentro da representação de sinal de áudio. Consequentemente, decodificadores de áudio, conforme discutido no presente documento, podem reconhecer uma comutação entre fluxos diferentes, até mesmo caso os reais parâmetros de configuração do decodificador permaneçam inalterados.
[0042] Em uma modalidade preferencial, o codificador de áudio é configurado para incluir o identificador de fluxo em uma estrutura de extensão de configuração da estrutura de configuração, sendo que a estrutura de extensão de configuração que compreende o identificador de fluxo pode ser habilitada e desabilitada pelo codificador de áudio. Consequentemente, é possível decidir com flexibilidade, no lado do codificador de áudio, se as informações de identificador de fluxo devem ser incluídas ou não. Por exemplo, a inclusão das informações de identificador de fluxo podem ser omitidas seletivamente para quadros de áudio para os quais o codificador de áudio sabe que não haverá comutação de fluxo.
[0043] Em uma modalidade preferencial, o codificador de áudio é configurado para incluir na estrutura de extensão de configuração um identificador do tipo de extensão de configuração que indica o identificador de fluxo para sinalizar a presença do identificador de fluxo na estrutura de extensão de configuração. Consequentemente, é possível até mesmo omitir as informações de identificador de fluxo,
Petição 870190068437, de 19/07/2019, pág. 25/152
21/111 caso outras informações de extensão de configuração estejam presentes na estrutura de extensão de configuração. Em outras palavras, nem toda estrutura de extensão de configuração precisa necessariamente compreender o identificador de fluxo, o que ajuda a economizar bits.
[0044] Em uma modalidade preferencial, o codificador de áudio é configurado para fornecer pelo menos uma estrutura de configuração que compreende o identificador de fluxo e pelo menos uma estrutura de configuração que não compreende o identificador de fluxo. Consequentemente, o identificador de fluxo está incluído na estrutura de configuração caso o codificador de áudio reconheça que isso é necessário. Por exemplo, o codificador de áudio precisa incluir apenas o identificador de fluxo em estruturas de configuração de quadros nas quais uma comutação entre fluxos é possível. Fazendo isso, uma taxa de bits pode ser mantida razoavelmente pequena.
[0045] Em uma modalidade preferencial, o codificador de áudio é configurado para comutar entre uma provisão de uma primeira informação de áudio codificadas que é representada por uma primeira sequência de quadros de áudio, e uma segunda informação de áudio codificada, que é representado por uma segunda sequência de quadros, em que uma renderização adequada do primeiro quadro de áudio da segunda sequência de quadros de áudio após a renderização de um último quadro da primeira sequência de quadros de áudio exige uma reinicialização de um decodificador de áudio. Nesse caso, o codificador de áudio é configurado
Petição 870190068437, de 19/07/2019, pág. 26/152
22/111 para incluir em uma representação de áudio que representa o primeiro quadro da segunda sequência de quadros de áudio uma estrutura de configuração que compreende um identificador de fluxo associado à segunda sequência de quadros de áudio. 0 identificador de fluxo associado à segunda sequência de quadros de áudio é escolhida como diferente de um identificador de fluxo associado à primeira sequência de quadros. Consequentemente, um codificador de áudio pode fornecer, dentro da estrutura de configuração, uma sinalização que permite que um decodificador de áudio distinga entre fluxos diferentes e reconheça quando uma reinicialização (também denominado de transição) deve ser realizada.
[0046] Em uma modalidade preferencial, o codificador de áudio não fornece quaisquer outras informações de sinalização que indicam uma comutação da primeira sequência de quadros de áudio para a segunda sequência do quadro de com exceção do identificador de fluxo. Consequentemente, uma taxa de bits pode ser mantida razoavelmente baixa. Em particular, pode-se evitar que a sinalização seja incluída em diferentes níveis de protocolo, diferentes das informações de áudio codificadas. Ademais, o codificador de áudio não sabe com antecedência quando uma comutação da primeira sequência de quadros de áudio para a segunda sequência de quadros de áudio realmente ocorre. Por exemplo, um decodificador de áudio pode solicitar primeiramente quadros de áudio da primeira sequência de quadros de áudio, e quando o decodificador de áudio
Petição 870190068437, de 19/07/2019, pág. 27/152
23/111 reconhece alguma necessidade (por exemplo, quando há um aumento ou diminuição de uma taxa de bits disponível) o decodificador de áudio (ou qualquer outro dispositivo de controle que controla a provisão de quadros de áudio) pode decidir que os quadros de áudio de um segundo fluxo agora devem ser processados pelo decodificador de áudio. No entanto, em alguns casos, o decodificador de áudio não pode, por si só, quando (ou exatamente quando) há uma comutação entre uma provisão de quadros de áudio da primeira sequência e uma provisão de quadros de áudio da segunda sequência, e só poderá reconhecer de qual sequência de quadros de áudio os quadros de áudio recebidos atualmente se originam avaliando-se o identificador de fluxo incluído na estrutura de configuração.
[0047] Em uma modalidade preferencial, o codificador de áudio é configurado para fornecer uma primeira sequência de quadros de áudio (por exemplo, um primeiro fluxo) e uma segunda sequência de quadros de áudio (por exemplo, um segundo fluxo) com o uso de diferentes taxas de bits (em que o primeiro fluxo e o segundo fluxo podem representar o mesmo conteúdo de áudio) . Ademais, o codificador de áudio pode ser configurado para sinalizar para o decodificador de áudio parâmetros idênticos de informações de configuração de decodificador para a decodificação da primeira sequência de quadros de áudio e para a decodificação da segunda sequência de quadros de áudio, com exceção dos diferentes identificadores de fluxo de bits. Em outras palavras, o codificador de áudio pode sinalizar para que o
Petição 870190068437, de 19/07/2019, pág. 28/152
24/111 decodificador de áudio use parâmetros de decodificador idênticos, porém, o primeiro fluxo e o segundo fluxo ainda podem compreender diferentes taxas de bits. Isso pode, por exemplo, ser causado com o uso de diferentes resoluções de quantização ou diferentes modelos piscoacústico durante o fornecimento do primeiro fluxo de áudio e do segundo fluxo de áudio. No entanto, essas diferentes resoluções de quantização ou diferentes modelos piscoacústico não afetam os parâmetros de decodificação a serem usados por um decodif icador de áudio pois afetam apenas a real taxa de bits. Desse modo, os diferentes identificadores de fluxo de bits podem ser a única possibilidade para um decodificador de áudio distinguir se um quadro de áudio a ser decodificado é do primeiro fluxo ou do segundo fluxo, e a avaliação do identificador de fluxo de bits também permite que o decodificador de áudio reconheça quando uma transição (ou reinicialização) deve ser realizada.
[0048] Consequentemente, o codificador de áudio pode servir e ambientes nos quais as alterações da taxa de bits disponível podem ocorrer, e uma sobrecarga de sinalização pode ser mantida razoavelmente baixa.
[0049] Ademais, deve-se verificar que o codificador de áudio, conforme discutido no presente contexto pode ser suplementado opcionalmente por qualquer uma dentre os recursos, e as funcionalidades e detalhes descritos no presente documento.
[0050] Outra modalidade, de acordo com a invenção está relacionada método para fornecer uma representação de sinal
Petição 870190068437, de 19/07/2019, pág. 29/152
25/111 de áudio decodificado com base em uma representação de sinal de áudio codificado. 0 método compreende ajustar os parâmetros de decodificação dependentes de uma informação de configuração, e o método compreende decodificar um ou mais quadros de áudio com o uso de uma informação de configuração atual (por exemplo, uma informação de configuração atualmente ativa). 0 método também compreende comparar uma informação de configuração em uma estrutura de configuração associada a um ou mais quadros a serem decodificados com as informações de configuração atual, e o método compreende realizar uma transição (por exemplo, que compreende a reinicialização da decodificação) para realizar uma decodificação com o uso das informações de configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados como uma nova configuração, caso as informações de configuração na estrutura de configuração associadas ao um ou mais quadros a serem decodificados, ou uma porção relevante (por exemplo, até o e incluindo o identificador de fluxo) das informações de configuração na estrutura de configuração associadas ao um ou mais quadros a serem decodificados é diferente das informações de configuração atual. 0 método também compreende considerar uma informação de
identificador | de | f luxo | incluída | na estrutura | de |
configuração | quando se | compara | as informações | de | |
configuração, | de | modo que uma | diferença entre | um | |
identificador | de | f luxo | obtido | anteriormente | na |
de codificação | de | áudio e | um identificador de fluxo |
Petição 870190068437, de 19/07/2019, pág. 30/152
26/111 representado pelas informações de identificador de fluxo na estrutura de configuração associada ao um ou mais quadros a serem decodificados provoque a transição. Esse método se baseia nas mesmas considerações que o decodificador de áudio mencionado acima.
[0051] O método pode ser suplementado por qualquer um dos recursos e funcionalidades e detalhes descritos no presente documento, ou individualmente ou considerados combinação.
[0052] Outra modalidade de acordo a invenção cria um método para fornecer uma representação de sinal de áudio codificado. O método compreende codificar quadros em sobreposição ou em não sobreposição de um sinal de áudio com o uso de parâmetros de codificação a fim de obter a representação de sinal de áudio codificado O método compreende fornecer uma estrutura de configuração que descreve os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio), em que a estrutura de configuração compreende um identificador de fluxo. Esse método se baseia nas mesmas considerações que o codificador de áudio mencionado acima.
[0053] Ademais, deve-se verificar que os métodos descritos no presente contexto pode ser suplementados por qualquer um dentre os recursos e funcionalidades descritos acima em relação ao decodificador de áudio e codificador de áudio correspondentes. Ademais, os métodos podem ser suplementados por qualquer um dentre os recursos,
Petição 870190068437, de 19/07/2019, pág. 31/152
27/111 funcionalidades e detalhes descritos no presente documento, individualmente ou em combinação.
[0054] As modalidades de acordo com a invenção criam um fluxo de áudio. O fluxo de áudio compreende uma representação codificada de quadros em sobreposição ou em não sobreposição de um sinal de áudio. O fluxo de áudio também compreende uma estrutura de configuração que descreve parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio). A estrutura de configuração compreende uma informação de identificador de fluxo que representa um identificador de fluxo (por exemplo, na forma de um valor de número inteiro).
[0055] O fluxo de áudio se baseia nas considerações mencionadas acima. Em particular, o identificador de fluxo, que está incluído na estrutura de configuração do fluxo de áudio que também descreve parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) permite que um decodificador de áudio distinga entre fluxos diferentes, até mesmo caso os mesmos parâmetros de codificação (ou parâmetros de decodificação) sejam usados.
[0056] Em uma modalidade preferencial, as informações de identificador de fluxo são incluídas em uma estrutura de extensão de configuração. Nesse caso, a estrutura de extensão de configuração é, de preferência, uma estrutura de subdados de uma estrutura de configuração, em que uma presença de uma estrutura de extensão de configuração é
Petição 870190068437, de 19/07/2019, pág. 32/152
28/111 indicada por um bit da estrutura de configuração. Ademais, as informações de identificador de fluxo são um item de subdados da estrutura de extensão de configuração, em que uma presença das informações de identificador de fluxo é indicada por um identificador do tipo de extensão de configuração associado às informações de identificador de fluxo. 0 uso de tal fluxo de áudio permite uma inclusão flexível das informações de identificador de fluxo sempre necessário, ao passo que a inclusão das informações de identificador de fluxo pode ser omitida no caso em que não é necessária (por exemplo, para quadros para os quais não há comutação entre múltiplos fluxos permitidos) . Desse modo, a taxa de bits pode ser economizada.
[0057] Em uma modalidade preferencial, o identificador de fluxo é incorporado em uma estrutura de subdados de uma representação de um quadro de áudio (e pode ser extraído pelo decodificador de áudio de tal estrutura de subdados). Incorporando-se o identificador de fluxo em uma estrutura de subdados de uma representação de um quadro de áudio, pode-se evitar que um decodificador de áudio precisa usar uma informação de um nível de protocolo maior. De preferência, para decodificar um quadro de áudio, o decodificador de áudio precisa apenas da representação de um quadro de áudio e pode decidir se houve uma comutação entre fluxos diferentes.
[0058] Em uma modalidade preferencial, o identificador de fluxo é incorporado apenas em uma estrutura de subdados de uma representação de um quadro de áudio que compreende
Petição 870190068437, de 19/07/2019, pág. 33/152
29/111 uma estrutura de configuração (e pode ser extraído pelo decodificador de áudio de uma estrutura de subdados de uma representação de um quadro de áudio que compreende uma estrutura de configuração). Essa ideia se baseia na constatação de que uma comutação entre fluxos (sem artefatos notáveis) pode ser realizada apenas nos quadros que compreende uma estrutura de configuração. Consequentemente, constatou-se que é suficiente para incorporar o identificador de fluxo em uma estrutura de subdados de uma representação de um quadro de áudio que compreende uma estrutura de configuração, ao passo que não há identificador de fluxo incluído em uma representação de um quadro de áudio que não compreende uma estrutura de configuração.
[0059] Os fluxos de áudio descritos no presente documento podem ser suplementados por quaisquer recursos, funcionalidades e detalhes discutidos no presente documento, ou individualmente ou em combinação. Em particular, tais recursos descritos em relação aos codificadores de áudio, os decodificadores de áudio e fornecedores de fluxo também podem ser aplicados ao fluxo de áudio.
[0060] As modalidades de acordo com a invenção criam um provedor de fluxo de áudio para fornecer uma representação de sinal de áudio codificado. O provedor de fluxo de áudio é configurado para fornecer versões codificadas de quadros temporariamente em sobreposição ou em não sobreposição de um sinal de áudio, codificados com o uso de parâmetros de
Petição 870190068437, de 19/07/2019, pág. 34/152
30/111 codificação, como um parte da representação de sinal de áudio codificado. O provedor de fluxo de áudio é configurado para fornecer uma estrutura de configuração que descreve os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) como uma parte da representação de sinal de áudio codificado, em que a estrutura de configuração compreende um identificador de fluxo. Esse provedor de fluxo de áudio se baseia nas mesmas considerações que o codificador de áudio descrito acima e também que o decodificador de áudio descrito acima.
[0061] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que o identificador de fluxo seja incluído em uma estrutura de extensão de configuração da estrutura de configuração, em que a estrutura de extensão de configuração que compreende o identificador de fluxo pode ser habilitada e desabilitada por um ou mais bits na estrutura de configuração. Essa modalidade se baseia nas mesmas idéias, conforme discutido acima em relação ao codificador de áudio e também em relação ao decodificador de áudio. Em outras palavras, o provedor de fluxo de áudio fornece um fluxo de áudio que corresponde ao fluxo de áudio fornecido por um codificador de áudio (embora o provedor de fluxo de áudio possa ser configurado para comutar entre a provisão de fluxos diferentes, por exemplo, fornecido por múltiplos codificadores de áudio que operam em paralelo ou fornecidos
Petição 870190068437, de 19/07/2019, pág. 35/152
31/111 a partir e um meio de armazenamento).
[0062] Na modalidade preferencial, o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que a estrutura de extensão de configuração compreenda um identificador do tipo de extensão de configuração que indica o identificador de fluxo para sinalizar a presença do identificador de fluxo na estrutura de extensão de configuração. Essa modalidade se baseia nas mesmas considerações mencionadas acima em relação ao codificador de áudio e em relação ao fluxo de áudio.
[0063] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que a representação de sinal de áudio codificado compreenda pelo menos uma estrutura de configuração que compreende o identificador de fluxo e pelo menos uma estrutura de configuração que não compreende o identificador de fluxo. Conforme mencionado acima, não é necessário que o identificador de fluxo esteja incluído em cada estrutura de configuração. De preferência, pode haver um ajuste flexível no qual as estruturas de configuração do identificador de fluxo devem ser incluídas. Tipicamente, o identificador de fluxo será incluído em estruturas de configuração de tais quadros de áudio para os quais há uma comutação entre fluxos (ou para os quais uma comutação entre fluxos é antecipada ou permitida). Em outras palavras, uma comutação entre fluxos diferentes que compreendem estruturas de configuração diferentes, com
Petição 870190068437, de 19/07/2019, pág. 36/152
32/111 exceção de diferentes identificadores de fluxo, será realizada apenas pelo provedor de fluxo em quadros nos quais um identificador de fluxo está presente. Desse modo, o decodificador de áudio (que recebe uma representação de áudio codificada do provedor de fluxo de áudio) tem a possibilidade de reconhecer uma comutação entre fluxos diferentes, até mesmo caso os parâmetros de decodificação (que são sinalizados pela estrutura de configuração) sejam substancialmente idênticos ou até mesmo completamente idênticos.
[0064] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para comutar entre uma provisão de uma primeira porção de uma informação de áudio codificada, que é representada por uma primeira sequência de quadros de áudio, e uma segunda porção das informações de áudio codificadas, que é representada por uma segunda sequência de quadros de áudio, em que a renderização adequada de um primeiro quadro de áudio da segunda sequência de quadros de áudio após a renderização de um último quadro da primeira sequência de quadros de áudio que exige uma reinicialização de um decodificador de áudio. O provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que uma representação de áudio que representa o primeiro quadro da segunda sequência de quadros de áudio inclua uma estrutura de configuração que compreende um identificador de fluxo associado à segunda sequência de quadros de áudio, em que o identificador de fluxo associado à segunda sequência de
Petição 870190068437, de 19/07/2019, pág. 37/152
33/111 quadros de áudio é diferente de um identificador de fluxo associado à primeira sequência de quadros de áudio. Em outras palavras, o provedor de fluxo de áudio comuta entre dois fluxos de áudio (sequências de quadros de áudio) que tem identificadores de fluxo diferentes associados. Consequentemente, um decodificador de áudio saberá tipicamente o identificador de fluxo associado à primeira sequência de quadros de áudio (por exemplo, avaliando-se uma estrutura de configuração associada à primeira sequência de quadros de áudio), e quando o decodificador de áudio recebe o primeiro quadro da segunda sequência de quadros de áudio, o decodificador de áudio poderá avaliar a estrutura de configuração que compreende o identificador de fluxo associado à segunda sequência de quadros de áudio e poderá reconhecer uma comutação do primeiro fluxo para o segundo fluxo por meio da comparação dos identificadores de fluxo (que são diferentes para os fluxos diferentes). Desse modo, o provedor de fluxo de áudio fornece quadros de áudio de um primeiro fluxo e, em seguida, comuta para uma provisão de quadros de áudio de um segundo fluxo e fornece as informações adequadas de sinalização, a saber, o identificador de fluxo, dentro da estrutura de configuração do primeiro quadro do segundo fluxo de áudio que é fornecido após a comutação. Consequentemente, nenhuma sinalização extra é necessária para sinalizar a comutação entre diferentes fluxos de áudio.
[0065] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para fornecer a representação
Petição 870190068437, de 19/07/2019, pág. 38/152
34/111 de sinal de áudio codificado de modo que a representação de sinal de áudio codificado não fornece quaisquer outras informações de sinalização que indicam a comutação da primeira sequência de quadros de áudio para a segunda sequência de quadros de áudio com exceção do identificador de fluxo. Consequentemente, uma economiza significativa da taxa de bits pode ser obtida. Além disso, uma complexidade de protocolo é mantida pequena, visto que não é necessário incluir quaisquer informações em diferentes níveis de protocolo e extrair tais informações de diferentes níveis de protocolo no lado de um decodificador de áudio.
[0066] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado, de modo que a primeira sequência de quadros de áudio (por exemplo, um primeiro fluxo) e a segunda sequência de quadros de áudio (por exemplo, um segundo fluxo) sejam codificadas com o uso de diferentes taxas de bits. Ademais, o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que a representação de sinal de áudio codificado sinalize a um decodificador de áudio parâmetros idênticos de informações de configuração de decodificador (ou parâmetros de decodificador, ou parâmetros de decodificação) para a decodificação da primeira sequência de quadros de áudio e para a decodificação da segunda sequência de quadros de áudio, com exceção de diferentes identificadores de fluxo de bits. Desse modo, o provedor de fluxo de áudio fornece
Petição 870190068437, de 19/07/2019, pág. 39/152
35/111 informações de configuração muito semelhantes para os fluxos diferentes (primeiro fluxo e segundo fluxo) que podem, por exemplo, ser diferentes apenas pelo identificadores de fluxo de bits. Nessa situação, o uso dos identificadores de fluxo de bits é parcialmente útil, visto que podem permitir a distinção confiável entre diferentes fluxos de bit com mínima sobrecarga de sinalização.
[0067] Em uma modalidade preferencial, o provedor de fluxo de áudio é configurado para comutar entre uma provisão de uma primeira sequência de quadros de áudio (por exemplo, um primeiro fluxo) e uma segunda sequência de quadros de áudio (por exemplo, a segundo fluxo) para um decodificador de áudio, em que a primeira sequência de quadros de áudio e a segunda sequência de quadros de áudio são codificadas com o uso de diferentes taxas de bits. O provedor de fluxo de áudio é configurado para comutar seletivamente entre a provisão da primeira sequência de quadros de áudio e a provisão da segunda sequência de quadros de áudio em um quadro de áudio para o qual a representação de áudio (por exemplo, um quadro de playout imediato, IPF) compreende uma informação de acesso aleatório (por exemplo, uma carga de extensão de prérolagem de áudio, AudioPreRoll()) ao mesmo tempo que evita comutar entre sequências em quadros de áudio que não compreendem uma informação de acesso aleatório. O provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado de modo que um identificador de fluxo seja incluído em uma estrutura de
Petição 870190068437, de 19/07/2019, pág. 40/152
36/111 configuração de um quadro de áudio que é fornecida durante a comutação da primeira sequência de quadros de áudio para a segunda sequência de quadros de áudio. Por exemplo, garante-se por tal configuração do provedor de fluxo de áudio que há apenas uma comutação entre uma provisão de quadros de uma primeira sequência de quadros de áudio e uma provisão de quadros de uma segunda sequência de quadros de áudio quando o primeiro quadro da segunda sequência de quadros de áudio compreende uma estrutura de configuração que tem um identificador de fluxo e também as informações de acesso aleatório. Consequentemente, um decodificador de áudio pode detectar a comutação entre os diferentes fluxos
de áudio e pode, | então, | reconhecer | que | as informações | de |
acesso aleatório | devem | ser avaliadas | (ao passo que | as | |
informações de | acesso | aleatório | tipicamente nao | são | |
avaliadas quando | não há | comutação | entre | diferentes fluxos |
de áudio e quando o decodificador de áudio é da suposição de que uma sequência de quadros de áudio contígua de um único fluxo é renderizada).
[0068] Desse modo, uma boa qualidade de áudio sem artefatos durante a comutação entre diferentes fluxos de áudio pode ser obtida por tal conceito.
[0069] Em um modalidade adicional, o provedor de fluxo de áudio é configurado para obter uma pluralidade de sequências paralelas de quadros de áudio codificadas com uso de diferentes taxas de bits, e o provedor de fluxo de áudio é configurado para comutar entre uma provisão de quadros de diferentes sequências dentre as sequências
Petição 870190068437, de 19/07/2019, pág. 41/152
37/111 paralelas a um decodificador de áudio, sendo que o provedor de fluxo de áudio é configurado para sinalizar a um decodificador de áudio a qual das sequências um ou mais quadros está associado com o uso do identificador de fluxo que está incluído na estrutura de configuração de uma primeira representação de áudio fornecida após uma comutação. Consequentemente, o decodificador de áudio pode reconhecer uma transição entre fluxos diferentes com uma pequena sobrecarga e sem usar informações de outras camadas de protocolo.
[0070] Deve-se observar que o provedor de fluxo de áudio discutido no presente documento pode ser suplementado por qualquer um dentre os recursos, funcionalidade e detalhes descritos no presente documento, ou individualmente ou em combinação.
[0071] Outra modalidade de acordo a invenção cria um método para fornecer uma representação de sinal de áudio codificado. O método compreende fornece versões codificadas de quadros de sobreposição ou em não sobreposição de um sinal de áudio, codificada com o uso de parâmetros de codificação, como um parte da representação de sinal de áudio codificado. O método compreende fornecer uma estrutura de configuração que descreve os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) como uma parte da representação de sinal de áudio codificado, em que a estrutura de configuração compreende um identificador de fluxo.
Petição 870190068437, de 19/07/2019, pág. 42/152
38/111 [0072] Esse método se baseia nas mesmas considerações que o provedor de fluxo discutido acima. O método pode ser suplementado por quaisquer outros dentre os recursos, funcionalidades e detalhes descritos no presente documento, por exemplo, em relação ao provedor de fluxo como também em relação ao codificador de áudio, ao decodificador de áudio ou ao fluxo de áudio.
[0073] Outra modalidade de acordo com a invenção cria um programa de computador para realizar os métodos descritos no presente documento.
BREVE DESCRIÇÃO DAS FIGURAS [0074] As modalidades de acordo com a presente invenção serão descritas subsequentemente com referência às Figuras anexas nas quais:
A Figura 1 mostra um diagrama de blocos esquemático de um decodificador de áudio, de acordo com uma modalidade (simples) da presente invenção;
A Figura 2 mostra um diagrama de blocos esquemático de um decodificador de áudio, de acordo com uma modalidade da presente invenção;
A Figura 3 mostra um diagrama de blocos esquemático de um codificador de áudio, de acordo com uma modalidade (simples) da presente invenção;
A Figura 4 mostra um diagrama de blocos esquemático de um provedor de fluxo de áudio, de acordo com uma modalidade (simples) da presente invenção;
A Figura 5 mostra um diagrama de blocos esquemático de um provedor de fluxo de áudio, de acordo com
Petição 870190068437, de 19/07/2019, pág. 43/152
39/111 uma modalidade da presente invenção;
A Figura 6 mostra uma representação de um quadro de áudio que permite um acesso aleatório e que compreende uma porção de configuração com um identificador de fluxo em uma porção de extensão de configuração, de acordo com uma modalidade da presente invenção;
A Figura 7 mostra uma representação de um fluxo de áudio exemplificativo, de acordo com uma modalidade da presente invenção;
A Figura 8 mostra uma representação de um fluxo de áudio exemplificativo, de acordo com uma modalidade da presente invenção;
A Figura 9 mostra uma representação esquemática de uma possível funcionalidade de decodificador de um decodificador de áudio, conforme descrito no presente documento;
A Figura 10a mostra uma representação de uma estrutura de configuração exemplificativa para uso pelos codificadores de áudio e decodificadores de áudio descritos no presente documento; e
A Figura 10b mostra uma representação de uma extensão de estrutura de configuração exemplificativa para uso pelos codificadores de áudio e decodificadores de áudio descritos no presente documento.
A Figura | 10c | mostra | uma representação | de um |
elemento de fluxo de | bits | de | identificador de | f luxo |
exemplificativo; e | ||||
A Figura | lOd | mostra | um exemplo de um | valor |
Petição 870190068437, de 19/07/2019, pág. 44/152
40/111 de usacConfigExtType, que pode substituir opcionalmente a tabela 74 no padrão USAC;
A Figura lia mostra urn fluxograma de urn método para fornecer uma representação de sinal de áudio decodificado com base em uma representação de sinal de áudio codificado, de acordo com uma modalidade da presente invenção;
A Figura 11b mostra um fluxograma de um método para fornecer uma representação de sinal de áudio codificado, de acordo com uma modalidade da presente invenção; e
A Figura 11c mostra um fluxograma de um método para fornecer uma representação de sinal de áudio codificado, de acordo com uma modalidade da presente invenção.
DESCRIÇÃO DETALHADA DAS MODALIDADES
1. DECODIFICADOR DE ÁUDIO DE ACORDO COM A
FIGURA 1 [0075] A Figura 1 mostra um diagrama de blocos esquemático de um decodificador de áudio, de acordo com uma modalidade (simples) da presente invenção.
[0076] O decodificador de áudio 100 recebe uma representação de sinal de áudio codificado 110 e fornece, com base no mesmo, uma representação de sinal de áudio decodificado 112. Por exemplo, a representação de sinal de áudio codificado 110 pode ser um fluxo de áudio que compreende uma sequência de quadros de codificação de voz e de áudio unificada (USAC). No entanto, a representação de
Petição 870190068437, de 19/07/2019, pág. 45/152
41/111 sinal de áudio codificado pode assumir uma diferente forma e pode ser, por exemplo, uma representação de áudio definida por uma sintaxe de fluxo de bits de qualquer um dentre os padrões de codificação de áudio conhecidos. A representação de sinal de áudio codificado pode compreender, por exemplo, uma informação de configuração 110 que pode estar incluída, por exemplo, em uma estrutura de configuração e que pode, por exemplo, compreender um identificador de fluxo. O identificador de fluxo pode estar incluído, por exemplo, nas informações de configuração ou na estrutura de configuração. As informações de configuração ou estrutura de configuração podem estar associadas, por exemplo, a um ou mais quadros a serem decodificados e pode descrever, por exemplo, parâmetros de decodificação para serem usados pelo decodificador de áudio.
[0077] No presente contexto, o decodificador 100 pode compreender, por exemplo, um núcleo de decodificador 130, que pode ser configurado para decodificar um ou mais quadros de áudio com o uso de uma informação de configuração atual (em que as informações de configuração atual podem definir, por exemplo, parâmetros de decodificação). O decodificador de áudio também é configurado para ajustar os parâmetros de decodificação dependentes das informações de configuração 110a.
[0078] Por exemplo, o decodificador de áudio é configurado para comparar uma informação de configuração em uma estrutura de configuração associada a um ou mais
Petição 870190068437, de 19/07/2019, pág. 46/152
42/111 quadros a serem decodificados com uma informação de configuração atual (por exemplo, uma informação de configuração usada para a decodificação um ou mais quadros decodificados anteriormente). Ademais, o decodificador de áudio pode ser configurado para fazer com que uma transição realize uma decodif icação com o uso das informações de configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados como uma nova informação de configuração, caso as informações de configuração na estrutura de configuração associadas ao um ou mais quadros a serem decodificados, ou uma porção relevante das informações de configuração na estrutura de configuração associada ao um ou mais quadros a serem decodificados, sejam diferentes das informações de configuração atual. Durante a realização da transição, o decodificador de áudio pode, por exemplo, reinicializar o núcleo de decodificador 130 com o uso de uma informação de acesso aleatório, que está destinada a descrever um estado do núcleo de decodificador que deve ser usado para decodificar adequadamente um quadro de áudio (ou um primeiro quadro de áudio) após a transição.
[0079] Em particular, o decodificador de áudio é configurado para considerar um identificador de fluxo, que está incluído na estrutura de configuração (isto é, dentro das informações de configuração) quando se compara as informações de configuração (isto é, quando se compara as informações de configuração na estrutura de configuração associadas ao um ou mais quadros a serem decodificados com
Petição 870190068437, de 19/07/2019, pág. 47/152
43/111 as informações de configuração atual), de modo que uma diferença entre um identificador de fluxo obtido anteriormente pelo decodificador de áudio e o identificador de fluxo representado pelas informações de identificador de fluxo na estrutura de configuração associada ao um ou mais quadros a serem decodificados provoque a transição.
[0080] Em outras palavras, o decodificador de áudio pode compreender, por exemplo, uma memória para a configuração atual (ou para as informações de configuração atual) que pode indicada com 140. O decodificador de áudio 100 também pode compreender um comparador (ou qualquer outro meio para realizar uma comparação) 150, que pode comprar pelo menos uma porção relevante de uma informação de configuração atual, incluindo um a identificador de fluxo, com uma porção correspondente de uma informação de configuração associada a um próximo (áudio) quadro a ser decodificado incluindo um identificador de fluxo. A porção relevante pode ser, por exemplo, uma porção até e incluindo o identificador de fluxo, em que as informações de configuração que estão, após o identificador de fluxo, em um fluxo de bits que representa as informações de configuração podem ser negligenciadas em algumas modalidades.
[0081] Caso essa comparação, que pode ser realizada pelo comparador 150, indique uma diferença entre as informações de configuração atual (ou a porção relevante do mesmo) e as informações de configuração associadas ao próximo (áudio) quadro a ser decodificado (ou a porção relevante do mesmo),
Petição 870190068437, de 19/07/2019, pág. 48/152
44/111 pode-se reconhecer que uma transição deve ser feita.
[0082] A realização da transição pode compreender, por exemplo, reinicializar o núcleo de decodificador, até mesmo caso os parâmetros de decodificação descritos pelas informações de configuração associadas ao próximo (áudio) quadro a ser decodificado é idêntico à configuração de decodificador (parâmetros de decodificação) descrita pelas informações de configuração atual (em que as informações de configuração associadas ao próximo quadro de áudio a ser decodificado é diferente apenas das informações de configuração atual em que o identificador de fluxo é). Por outro lado, caso as informações de configuração associadas ao próximo quadro de áudio a ser codificado sejam ainda mais diferentes das informações de configuração atual, por exemplo, definindo-se diferentes parâmetros de decodificação, o decodificador de áudio 100 realizará naturalmente uma transição que significa tipicamente reinicializar o núcleo de decodificador 130 e mudar os parâmetros de decodificação.
[0083] Em conclusão, o decodificador de áudio 100 de acordo com A Figura 1 tem capacidade para reconhecer uma transição entre quadros de diferentes fluxos de áudio até mesmo caso os parâmetros de decodificação a serem usados
pelo núcleo | de decodificador | 130 | permaneçam inalterados | ||||
avaliando- | se | um identificador | de | f luxo | incluído | em | uma |
estrutura | de | configuração de | um | quadro | de áudio, | o | que |
elimina a | necessidade de uma | sinalizaçao | dedicada | de | uma |
transiçao entre fluxos de áudio e/ou de uma condição para
Petição 870190068437, de 19/07/2019, pág. 49/152
45/111 reinicializar o núcleo de decodificador. Desse modo, um decodificador 100 pode decodificar quadros de áudio até mesmo caso haja uma transição de um fluxo para outro fluxo, devido ao fato de que o decodificador de áudio pode reconhecer tal transição e manipular as mesmas adequadamente, por exemplo, reinicializando-se o decodificador de áudio e reconfigurando-se o decodificador de áudio com novos parâmetros de configuração (caso necessário).
[0084] Deve-se observar que o decodificador de áudio 100
de acordo com | a Figura | 1 | pode ser | suplementado | ||
opcionalmente | por | qualquer | um | dentre os | recursos | e |
funcionalidades | e | descritos | no | presente documento, | ou | |
individualmente | ou | em combinação. | ||||
2 . | DECODIFICADOR | DE ÁUDIO DE | ACORDO COM | A |
FIGURA 2 [0085] A Figura 2 mostra um diagrama de blocos esquemático de um decodificador de áudio 200 de acordo com uma modalidade da presente invenção.
[0086] O decodificador de áudio 200 é configurado para receber uma representação de sinal de áudio codificado 210 e fornecer, com base no mesmo, uma representação de sinal de áudio decodificado 212. A representação de sinal de áudio codificado 210 pode ser, por exemplo, um fluxo de áudio que compreende uma sequência de quadros de codificação de voz e de áudio unificada (USAC). No entanto, uma sequência de quadros de áudio codificada que usa um conceito de codificação de áudio diferente também pode ser
Petição 870190068437, de 19/07/2019, pág. 50/152
46/111 inserida no decodificador de áudio 200. Por exemplo, o decodificador de áudio pode receber um quadro de áudio 220 de um primeiro fluxo e pode receber subsequentemente (como um próximo quadro de áudio) um quadro de áudio 222 de um segundo fluxo. Os quadros de áudio 220, 222 pode ser fornecido, por exemplo, por um provedor de fluxo de áudio. O quadro de áudio 220 pode compreender, por exemplo, uma representação codificada 220a de um sinal de áudio, por exemplo, na forma de valores espectrais codificados e fatores de escala codificados e/ou na forma de valores espectrais codificados e coeficientes de codificação de previsão linear codificados (TXC) e/ou na forma de uma excitação codificada e de coeficientes de codificação de previsão linear. O quadro de áudio 222 pode compreender, por exemplo, uma representação codificada 222a de um sinal de áudio, que pode ter a mesma forma da representação codificada 220a do sinal de áudio incluído no quadro 220. No entanto, além disso, o quadro 222 também pode compreender uma informação de acesso aleatório 222b que, por sua vez, pode compreender uma estrutura de configuração 222c e uma informação 222d para tornar um estado de uma cadeia de processamento (por exemplo, de um núcleo de decodificador) um estado desejado. Essa informação 222d pode ser indicada como, por exemplo, AudioPreRoll.
[0087] O decodificador de áudio 200 pode extrair , por exemplo, da representação de sinal de áudio codificado 210 a estrutura de configuração 222c, que também pode ser considerada como uma informação de configuração. A
Petição 870190068437, de 19/07/2019, pág. 51/152
47/111 estrutura de configuração 222c pode compreender, por exemplo, uma informação ou um sinalizador (ou um bit) que indica se uma estrutura de extensão de configuração 226 está presente como parte da estrutura de configuração. Essa informação ou sinalizador ou bit é indicado com 224a.
[0088] A estrutura de extensão de configuração 226 pode compreender, por exemplo, uma informação ou um sinalizador ou um bit ou um identificador que indica se um identificador de fluxo está presente. As informações mais recentes, o sinalizador, bit ou identificador são indicados com 228. Caso as informações ou sinalizador ou bit ou identificador 228 indiquem a presença de um identificador de fluxo, também há um identificador de fluxo 230, que pode ser tipicamente parte da estrutura de extensão de configuração 226.
[0089] Ademais, a estrutura de extensão de configuração podem compreender uma informação quanto à possibilidade de haver outras informações, como um bit ou sinalizador ou identificador adequado e também pode compreender as outras informações (caso aplicável).
[0090] O decodificador de áudio 100 pode compreender, por exemplo, uma memória 240, que pode economizar uma informação de configuração atual (por exemplo, uma informação de configuração usada para a decodificação de um quadro anterior e extraído de uma estrutura de configuração do quadro anterior ou de um quadro antecedente) . O decodificador de áudio 200 também compreende um comparador ou uma comparação 250, que é configurada para comparar as
Petição 870190068437, de 19/07/2019, pág. 52/152
48/111 informações de configuração associadas ao quadro de áudio a ser decodificado com as informações de configuração atual que são armazenadas na memória 240. Por exemplo, o comparador ou comparação 250 pode ser configurado para comparar as informações de configuração da estrutura de configuração 222c do quadro de áudio a ser decodificado com as informações de configuração atual armazenadas na memória até o e incluindo o identificador de fluxo. Em outras palavras, quaisquer itens de informações da estrutura de configuração 222c até e incluindo o identificador de fluxo podem ser comparados às informações de configuração atual da memória 240 para determinar se as informações de configuração (até o e incluindo o identificador de fluxo) no quadro 222 são idênticas com as informações de configuração atual extraídas de um dentre os quadros de áudio anteriores. Nessa comparação, será verificado naturalmente se a estrutura de configuração 222c compreende, fato, a estrutura de extensão de configuração 226 e o identificador de fluxo 230. Caso a estrutura de extensão de configuração 226 não esteja presente, naturalmente a mesma pode não ser considerada na comparação. Além disso, caso o identificador de fluxo 230 não está presente (por exemplo, devido ao fato de que um sinalizador 228 indica que não está incluído no quadro 222), então, naturalmente não será avaliado na comparação. Além disso, quaisquer informações de configuração que estão após o identificador de fluxo 230 na estrutura de configuração 222c serão tipicamente negligenciadas na
Petição 870190068437, de 19/07/2019, pág. 53/152
49/111 comparação devido ao fato de que supõe-se que tais informações de configuração sejam de importância subordinada e que a alteração de tais informações de configuração, que estão após o identificador de fluxo 230 na estrutura de configuração 222c, não sinaliza uma comutação entre os fluxos diferentes porém podem ocorrer até mesmo dentro de um único fluxo.
[0091] Em conclusão, a comparação 250 compara tipicamente informações de configuração, até o e incluindo um identificador de fluxo (porém, de preferência, omitindo a configuração que está disposta na estrutura de extensão de configuração após a identificador de fluxo) de um quadro de áudio a ser decodificado com as informações de configuração atual (obtidas de um quadro de áudio decodificado anteriormente). Consequentemente, a comparação 250 detecta um novo fluxo (ou um subfluxo) caso haja uma diferença nas informações de configuração constatadas na comparação. Consequentemente, a comparação é usada para controlar uma transição do primeiro fluxo (ou subfluxo) a um segundo fluxo (ou subfluxo).
[0092] Por exemplo, efetuar tal transição pode compreender descarregar uma decodificação de um último quadro do primeiro fluxo, uma reconfiguração, uma inicialização de um estado de uma cadeia de processamento a um estado desejado, e a execução de um desvanecimento cruzado, por exemplo, entre uma representação de domínio de tempo de um último quadro do primeiro fluxo e um primeiro quadro do segundo fluxo.
Petição 870190068437, de 19/07/2019, pág. 54/152
50/111 [0093] 0 decodificador de áudio 200 também compreende um núcleo de decodificador 216 que pode ser configurado para decodificar quadros de um primeiro fluxo (ou de uma primeira sequência de quadros) com o uso de uma primeira configuração (que pode ser descrita pelas informações de configuração atual). Ademais, um núcleo de decodificador 216 pode ser configurado para decodificar um segundo fluxo ou uma segunda sequência de quadros com o uso de uma segunda configuração (por exemplo, com o uso de uma nova configuração, que é descrita pelas informações de configuração 222c do quadro de áudio a ser decodificado). Por exemplo, uma reinicialização do núcleo de decodificador pode ser acionada quando a comparação 250 constata que uma diferença entre uma porção significativa das informações de configuração 222c do quadro de áudio 222 a ser decodificado e as informações de configuração atual na memória 240.
[0094] Por exemplo, uma reinicialização do decodificador pode ser usada entre a decodificação do último quadro do primeiro fluxo e do primeiro quadro do segundo fluxo. Alternativamente, uma nova instância do decodificador
pode ser | usada, | por | exemplo, caso | o | decodificador seja |
implantado | (pelo | menos | parcialmente) | no | software. Ademais, |
durante a | comutaçao da | decodificação | do | primeiro fluxo para |
a decodificação do segundo fluxo (transição), um estado da cadeia de processamento do núcleo de decodificador pode se tornar um estado desejado com o uso de algumas informações secundárias. Por exemplo, um estado de contexto de uma decodificação aritmética pode se tornar um estado
Petição 870190068437, de 19/07/2019, pág. 55/152
51/111 desejado ou um conteúdo de um filtro distinto de tempo pode entrar em um estado desejado. Isso pode ser feito com o uso de informações dedicadas, que também são indicados como pré-rolagem de áudio APR. Tornar o estado da cadeia de processamento um estado desejado é importante, visto que o primeiro quadro do segundo fluxo processado (decodificado) pelo decodificador de áudio pode não ser o primeiro quadro real do segundo fluxo de áudio. De preferência, o primeiro quadro do segundo fluxo de áudio processados pelo decodificador de áudio podem ser algum quadro durante o segundo fluxo de áudio quando um provedor de fluxo de áudio comuta de uma provisão de quadros de um primeiro fluxo de áudio para uma provisão de quadros do segundo fluxo de áudio. Desse modo, o primeiro quadro do segundo fluxo de áudio processado pelo decodificador de áudio pode depender de uma definição específica de estados de uma cadeia de decodificação, o que normalmente seria causado pela decodificação dos quadros antecedentes do segundo fluxo de áudio (que antecede o quadro de áudio a ser decodificado, que é o primeiro quadro de áudio do segundo fluxo de áudio manipulado pelo decodificador de áudio após a transição). Desse modo, durante a comutação da decodificação dos quadros de áudio do primeiro fluxo de áudio para a decodificação de quadros de áudio do segundo fluxo de áudio, a definição ausente dos estados do decodificador de áudio, o que normalmente seria efetuado por uma decodificação de quadros antecedentes do segundo fluxo de áudio, agora é feita com o uso das informações de pré
Petição 870190068437, de 19/07/2019, pág. 56/152
52/111 rolagem de áudio, o que define uma definição apropriada dos estados da decodificação de áudio.
[0095] Conforme pode ser observado em uma referência numérica 270, a decodificação do último quadro do primeiro fluxo de áudio fornece uma porção decodificada 272 (também denominada de porção útil). De modo opcional, a decodificação do último quadro do primeiro fluxo de áudio pode fornecer até mesmo uma porção decodificada maior, que é parcialmente descartada. Ademais, durante a decodificação do primeiro quadro do segundo fluxo de áudio, há uma de uma porção de pré-rolagem 274, durante a qual os estados de decodificador são inicializados para decodificar adequadamente o primeiro quadro do segundo fluxo de áudio. Ademais, o núcleo de decodificador 260 também fornece uma porção útil 276 do primeiro quadro do segundo fluxo de áudio manipulado pelo decodificador 200, em que uma porção útil 276 do primeiro quadro do segundo fluxo de áudio se sobrepõem temporariamente à porção útil 272 do último quadro do primeiro fluxo. Consequentemente, um desvanecimento cruzado pode ser realizado opcionalmente entre uma extremidade da porção útil 272 do último quadro do primeiro fluxo e um início da porção útil da primeiro quadro do segundo fluxo. Consequentemente, o sinal de saída decodificado 212 pode ser derivado, em que uma transição livre de artefatos entre o último quadro do primeiro fluxo (processado pelo decodificador de áudio 200) e o primeiro quadro do segundo fluxo (processado pelo decodificador de áudio 200) é fornecido.
Petição 870190068437, de 19/07/2019, pág. 57/152
53/111 [0096] Em suma, o decodificador de áudio 200 pode reconhecer quando um codificador de áudio ou um provedor de
fluxo | de áudio | comutam de | uma | provisão | de | quadro | de | áudio | |
de | um | primeiro | fluxo para | uma | provisão | de | quadros | de | áudio |
de | um | segundo | fluxo. Com | essa | finalidade, | o decodificador |
de áudio avalia as informações de configuração 222c (também indicadas como estrutura de configuração) e realiza uma comparação com uma informação de configuração atual armazenada em uma memória 240. Quando se reconhece que um quadro de áudio a ser decodificado pertence a um fluxo de áudio diferente quando comparado a quadros decodificados anteriormente de áudio, uma reinicialização do núcleo de decodificador é realizada, o que inclui tipicamente tornar o estado da cadeia de processamento do núcleo de decodificador um estado desejado avaliando-se algumas informações de pré-rolagem de áudio. Consequentemente, o decodificador de áudio pode lidar adequadamente com situações em que um codificador de áudio, ou um provedor de fluxo de áudio, fornece um quadro de áudio de um novo fluxo (segundo fluxo de áudio) sem mais notificações (com exceção da provisão da estrutura de configuração 222c que inclui o identificador de fluxo 230).
[0097] Deve-se observar que o decodificador de áudio 200 descrito no presente documento pode ser suplementado por qualquer um dentre os recursos e funcionalidades e detalhes no presente documento, ou individualmente ou em combinação.
3. CODIFICADOR DE ÁUDIO DE ACORDO COM A FIGURA 3
Petição 870190068437, de 19/07/2019, pág. 58/152
54/111 [0098] A Figura 3 mostra um diagrama de blocos esquemático de um codificador de áudio, de acordo com uma modalidade da invenção.
[0099] O codificador de áudio 300 recebe um sinal de áudio de entrada 310 (por exemplo, na forma de uma representação de domínio de tempo) e fornece, com base no mesmo, uma representação de sinal de áudio codificado 312. O codificador de áudio 300 compreende um núcleo de codificador 320, que é configurado para codificar quadros em sobreposição ou em não sobreposição do sinal de áudio de entrada 310 com o uso dos parâmetros de codificação, para obter uma representação de sinal de áudio codificado. O codificador de áudio 320 pode compreender, por exemplo, uma conversão de domínio de tempo em domínio espectral e uma codificação da representação de domínio espectral. O processamento pode ser realizado, por exemplo, no sentido do quadro.
[0100] Ademais, o codificador de áudio pode compreender, por exemplo, uma provisão de estrutura de configuração 330, que é configurada para fornecer uma estrutura de configuração 332 que descreve os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) . A estrutura de configuração 332 pode corresponder, por exemplo, à estrutura de configuração 222c. Em particular, a estrutura de configuração 332 pode compreender parâmetros de codificação (por exemplo, em uma forma codificada) ou, equivalentemente, parâmetros de decodificação (por exemplo,
Petição 870190068437, de 19/07/2019, pág. 59/152
55/111 em uma forma codificada) o que descreve uma definição a ser usada por urn decodificador (ou núcleo de decodificador) durante a decodificação da representação de sinal de áudio codificado 312. Um exemplo de uma estrutura de configuração 332 será descrito a seguir. Ademais, a estrutura de configuração 332 compreende um identificador de fluxo que pode corresponder ao identificador de fluxo 230. Por exemplo, o identificador de fluxo pode indicar um fluxo de áudio (por exemplo, uma peã contígua de conteúdo de áudio que é codificado de maneira contígua com o uso de uma definição de codificador específico). Por exemplo, os identificadores de fluxo fornecidos pela provisão de estrutura de configuração 330 podem ser escolhidos de modo todos aqueles fluxos de áudio entre os quais deve haver a possibilidade de comutar sem artefatos, e sem notificar explicitamente o decodificador de áudio sobre a comutação, devam transportar diferentes identificadores de fluxo. No entanto, em alguns casos, pode ser suficiente se tais fluxos que têm parâmetros de codificação idênticos associados (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) compreenderem diferentes identificadores de fluxo. Em outras palavras, diferentes identificadores de fluxo podem ser exigidos apenas para tais fluxos para quais os outros parâmetros de codificação ou parâmetros de decodificação são idênticos.
[0101] Consequentemente, um controle de codificador 340 pode controlar, por exemplo, tanto o núcleo de codificador
Petição 870190068437, de 19/07/2019, pág. 60/152
56/111
320 quanto a provisão de estrutura de configuração 330. Ο controle de codificador 340 pode, por exemplo, decidir sobre os parâmetros de codificação a serem usados pelo núcleo de codificador 320 (pode corresponder, por exemplo, pelo menos parcialmente, aos parâmetros de decodificação a serem usados por um decodificador de áudio) e também podem informar a provisão de estrutura de configuração 330 sobre os parâmetros de codificação/parâmetros de decodificação a serem incluídos na estrutura de configuração 332. Consequentemente, a representação de áudio codificada 312 compreende o conteúdo de áudio codificado e também a estrutura de configuração 332. Consequentemente, um decodificador de áudio (por exemplo, o decodificador de áudio 100 ou o decodificador de áudio 200) pode reconhecer instantaneamente quando um fluxo de áudio diferente, codificado com o uso de diferentes parâmetros de codificação, é fornecido (até mesmo caso nem todos os parâmetros de codificação sejam refletidos pelos parâmetros de decodificação incluídos na estrutura de configuração).
[0102] Em relação a esse problema, deve-se verificar que tipicamente não é necessário sinalizar todos os parâmetros de codificação para um decodificador de áudio. Por exemplo, é necessário sinalizar apenas aqueles parâmetros de codificação a um decodificador de áudio que afeta o algoritmo de decodificação. Os parâmetros de codificação que são enviados ao decodificador de áudio a fim de determinar uma definição do decodificador de áudio também são indicados como parâmetros de decodificação. Por outro
Petição 870190068437, de 19/07/2019, pág. 61/152
57/111 lado, alguns parâmetros de codificação importantes não são sinalizados tipicamente para um decodificador de áudio, pois, em vez disso, são refletidos implicitamente na representação de sinal de áudio codificado. Por exemplo, a taxa de bits desejada podem ser um importante parâmetro de codificação e pode decidir o quão superficial um codificador de áudio quantize valores espectrais e/ou quantos valores espectrais u áudio quantize para um valor pequeno ou até mesmo para um valor igual a zero. No entanto, para o decodificador de áudio, é suficiente observar o resultado da codificação, porém o mesmo não precisará saber a estratégia específica do codificador de como manter a taxa de bits razoavelmente pequena. Além disso, pode haver diferentes abordagens no lado do codificador para obter uma taxa de bits suficientemente pequena, dependendo do tipo de conteúdo de áudio e também dependendo da real taxa de bits desejada. Esses parâmetros podem ser considerados como parâmetros de codificação, porém não serão refletidos em um conjunto de parâmetros de decodificação (e não serão incluídos na representação codificada dos quadros de áudio), em que os parâmetros de decodificação (e esses parâmetros de codificação que são incorporados na representação de áudio codificada) descrevem tipicamente apenas qual definição um deve usar, isto é, como deve lidar com as informações codificadas informações fornecidas pelo codificador.
[0103] Consequentemente, esse pode ser de fato o caso que os parâmetros de decodificação, que podem ser incluídos
Petição 870190068437, de 19/07/2019, pág. 62/152
58/111 na estrutura de configuração 332, podem ser idênticos, embora o núcleo de codificador use diferentes parâmetros de codificação (por exemplo, em termos de uma taxa-alvo de bits, ou em termos de parâmetros que afetam a taxa-alvo de bits, como uma resolução de quantização ou um modelo piscoacústico envolvido).
[0104] Em outras palavras, o codificador de áudio pode, por exemplo, codificar um determinado conteúdo de áudio com o uso de diferentes parâmetros de codificação, embora os parâmetros de decodificação a serem usados pelo
decodificador | (a | f im | de | processar | e decodificar a | |
representação | codificada | do | conteúdo de | áudio) | possam ser | |
idênticos. | ||||||
[0105] Em | tais | casos | r | o codificador de | áudio pode |
fornecer diferentes identificadores de fluxo dentro do estrutura de configuração 332, de modo que um decodificador de áudio ainda possa distinguir tais representações codificadas diferentes de um conteúdo de áudio.
[0106] Ademais, deve-se verificar que o codificador de áudio 300, de acordo com a Figura 3, pode ser suplementado opcionalmente por qualquer um dentre os recursos, funcionalidade e detalhes descritos no presente documento.
4. PROVEDOR DE FLUXO DE ÁUDIO DE ACORDO COM A FIGURA 4 [0107] A Figura 4 mostra um diagrama de blocos esquemático de um provedor de fluxo de áudio, de acordo com uma modalidade da presente invenção.
[0108] O provedor de fluxo de áudio 400 é configurado
Petição 870190068437, de 19/07/2019, pág. 63/152
59/111 para fornecer uma representação de sinal de áudio codificado 412. 0 provedor de fluxo de áudio é configurado para fornecer versões codificadas 422 de quadros (temporariamente) em sobreposição ou em não sobreposição de um sinal de áudio, codificados com o uso de parâmetros de codificação, como um parte da representação de sinal de áudio codificado 412.
[0109] Ademais, o provedor de fluxo de áudio é configurado para fornecer uma estrutura de configuração 424 que descreve os parâmetros de codificação (ou, equivalentemente, parâmetros de decodificação a serem usados por um decodificador de áudio) como uma parte da representação de sinal de áudio codificado, em que a estrutura de configuração 424 compreende um identificador de fluxo.
[0110] Por | exemplo, o provedor de fluxo | de áudio pode | |||
compreender | uma | provisão | (ou provedor) | das versões | |
codificadas | de | quadros | em sobreposição | ou em | não |
sobreposição | do | sinal de | áudio. Ademais, | o provedor | de |
fluxo de áudio | também pode compreender uma provisão | de | |||
estrutura de | configuração | ou provedor de | estrutura | de |
configuração 423 para fornecer a estrutura de configuração 424 .
[0111] Consequentemente, o provedor de fluxo de áudio pode fornecer, como parte da representação de sinal de áudio codificado 412, porções de diferentes fluxos de áudio, em que o provedor de fluxo de áudio pode, por exemplo, armazenar em uma memória ou receber de um
Petição 870190068437, de 19/07/2019, pág. 64/152
60/111 codificador de áudio. Durante o fornecimento de uma porção de um primeiro fluxo de áudio e, em seguida, da comutação para uma provisão de uma porção de um segundo fluxo de áudio, uma estrutura de configuração 424 pode ser associada ao primeiro quadro de áudio do segundo fluxo de áudio que é fornecido após a comutação do primeiro fluxo de áudio para o segundo fluxo de áudio. A estrutura de configuração 424 pode, por exemplo, ser parte dos respectivos fluxos de áudio que são recebidos pelo provedor de fluxo de áudio de um codificador de áudio ou que são armazenados em uma memória do provedor de fluxo de áudio. Desse modo, o provedor de fluxo de áudio pode armazenar, por exemplo, uma sequência de quadros de áudio contígua de um primeiro fluxo de áudio e também armazenar uma sequência de quadros de áudio contígua de um segundo fluxo de áudio. Pelo menos alguns dos quadros do primeiro fluxo de áudio e alguns dos quadros do segundo fluxo de áudio podem ter estruturas de configuração respectivas associadas, que descrevem parâmetros de decodificação a serem usados por um decodificador de áudio. As estruturas de configuração também podem compreender identificadores de fluxo respectivos, por exemplo, números inteiros que identificam um fluxo de áudio. Por exemplo, o provedor de fluxo de áudio pode ser configurado para fornecer quadros 1 para n-1 (em que 1 para n-1 pode índices de tempo) para um primeiro quadro de áudio e quadros n para n+x (em que n para n+x pode ser índices de tempo) de um segundo fluxo de áudio como parte da representação de sinal de áudio codificado
Petição 870190068437, de 19/07/2019, pág. 65/152
61/111
412, em que quadros 1 para n-1 do segundo fluxo de áudio pode não ser fornecido como parte da representação de sinal de áudio codificado 412 que é direcionado a um decodificador de áudio específico ou a um grupo específico de decodificadores de áudio. 0 primeiro fluxo de áudio e o segundo fluxo de áudio pode representar, por exemplo, conteúdo idêntico codificado com uma diferente taxa de bits. Consequentemente, quadros 1 para n-1 do conteúdo de áudio são representados, na representação de sinal de áudio codificado 412 direcionada a um determinado dispositivo ou grupo de dispositivos, pelo primeiro fluxo de áudio, codificado em uma primeira taxa de bits, e quadros n para n+x do conteúdo de áudio são representados por quadros n para n+x do segundo fluxo de áudio, que é codificado em uma segunda taxa de bits diferente da primeira taxa de bits.
[0112] Por exemplo, o provedor de fluxo de áudio 400, ou algum controle externo, pode garantir que o primeiro quadro n do segundo fluxo de áudio, que está incluído na representação de sinal de áudio codificado 412, compreenda uma estrutura de configuração. Em outras palavras, pode-se garantir, por exemplo, que a comutação entre a provisão de quadros de áudio do primeiro fluxo de áudio e a provisão de quadros de áudio do segundo fluxo de áudio ocorra apenas em um quadro apropriado, que compreende uma estrutura de configuração e que também compreende, de preferência, algumas informações para inicializar um decodificador de áudio (como, por exemplo, um pré-rolagem de áudio).
[0113] Desse modo, o provedor de fluxo de áudio pode,
Petição 870190068437, de 19/07/2019, pág. 66/152
62/111 por exemplo, fornecer algumas porções de um conteúdo de áudio codificado em uma primeira taxa de bits (por exemplo, fornecendo-se quadros 1 para n-1 do primeiro fluxo de áudio) e outras porções do fluxo de áudio codificado com o uso de uma segunda taxa de bits (por exemplo, fornecendo-se quadros de áudio n para n+x do segundo fluxo de áudio). Possivelmente, as estruturas de configuração do primeiro fluxo de áudio e do segundo fluxo de áudio serão idênticas com exceção do fato de que o identificador de fluxo é diferente. Isso se deve ao fato de que os parâmetros de decodificação refletidos na estrutura de configuração 424 não precisam necessariamente refletir os diferentes parâmetros de codificação (ou todos os parâmetros de codificação) usados para a codificação do primeiro fluxo de áudio e para a codificação do segundo fluxo de áudio, de modo que seja, de fato, (apenas) o identificador de fluxo, que também está incluído na estrutura de configuração, o que permite que um decodificador de áudio determine se uma transição deve ser feito (por exemplo, reinicializando-se um núcleo de decodificador).
[0114] Uma decisão quanto à possibilidade de fornecer quadros de áudio do primeiro fluxo de áudio ou do segundo fluxo de áudio pode, em algumas modalidades, pode ser fornecida pelo provedor de fluxo de áudio (por exemplo, com base em uma conhecimento das condições de rede, por exemplo, uma carga de rede ou uma taxa de bits de rede disponível de uma rede entre o provedor de fluxo de áudio e um decodificador de áudio). Alternativamente, no entanto,
Petição 870190068437, de 19/07/2019, pág. 67/152
63/111 um decodificador de áudio, ou um dispositivo intermediário (por exemplo, um dispositivo de gerenciamento de rede) pode decidir qual fluxo de áudio deve ser usado.
[0115] No entanto, deve-se verificar que o decodificador de áudio, ou pelo menos o núcleo de decodificador de áudio, pode não ser informado explicitamente pelo provedor de fluxo de áudio e/ou pela rede intermediária em que uma alteração do fluxo ocorreu. Em outras palavras, o decodificador de áudio não recebe quaisquer informações adicionais, com exceção de que a estrutura de configuração 424, que sinaliza para o decodif icador de áudio que os quadros n para n+x são do segundo fluxo de áudio, ao passo que os quadros 1 para n-1 são do primeiro fluxo de áudio.
[0116] Em conclusão, o provedor de fluxo de áudio pode fornecer com flexibilidade uma representação codificada de um conteúdo de áudio a um decodificador de áudio na forma de uma representação de sinal de áudio codificado. O provedor de fluxo de áudio pode, por exemplo, comutar com flexibilidade entre uma provisão de quadros codificados de um primeiro fluxo de áudio e quadros codificado de um segundo fluxo de áudio, em que uma comutação entre fluxos de áudio é sinalizada por uma alteração do identificador de fluxo que está incluída na estrutura de configuração 424, que é parte da representação de sinal de áudio codificado 412 .
[0117] Deve-se verificar que o provedor de fluxo de áudio 400 pode ser suplementado opcionalmente por qualquer um dentre os recursos, funcionalidade e detalhes descritos
Petição 870190068437, de 19/07/2019, pág. 68/152
64/111 no presente documento.
[0118] A seguir, um exemplo da funcionalidade do provedor de fluxo de áudio 400 será descrito com referência à Figura 5 o que mostra uma diagrama de blocos esquemático de um provedor de fluxo de áudio de acordo com a modalidade da invenção.
[0119] O provedor de fluxo de áudio mostrado na Figura 5 é indicado com 500 e pode corresponder ao provedor de fluxo de áudio 400 de acordo com a Figura 4. O provedor de fluxo de áudio 500 é configurado para fornecer uma representação de sinal de áudio codificado 512, o que pode corresponder à representação de sinal de áudio codificado 412.
[0120] Em particular, o provedor de fluxo de áudio pode ser configurado para comutar entre uma provisão de quadros de um primeiro fluxo de áudio e de um segundo fluxo de áudio. Por exemplo, o provedor de fluxo de áudio 500 pode ser configurado para comutar entre uma provisão de quadros
do primeiro | fluxo de | áudio e do | segundo fluxo | de áudio | |
apenas | nos | então | chamados | quadros de | playout |
independentes | (também | denominados | de IPFs). | ||
[0121] | 0 | provedor | de fluxo | de áudio 500 | pode ter |
armazenado em uma memória ou receber de um codificador de áudio um primeiro fluxo de áudio 520 e um segundo fluxo de áudio 530. O primeiro fluxo de áudio pode ser, por exemplo, codificado em uma primeira taxa de bits e pode compreender, nas estruturas de configuração (por exemplo, de quadros de playout imediato) um primeiro identificador de fluxo. O segundo fluxo de áudio 530 pode ser codificado em uma
Petição 870190068437, de 19/07/2019, pág. 69/152
65/111 segunda taxa de bits e pode compreender, em estruturas de configuração (por exemplo, de quadros de playout imediato), um segundo identificador de fluxo. No entanto, o primeiro fluxo de áudio e o segundo fluxo de áudio podem representar, por exemplo, um mesmo conteúdo de áudio. No entanto, o primeiro fluxo de áudio e o segundo fluxo de áudio também pode representar diferentes conteúdos de áudio.
[0122] Por exemplo, o primeiro fluxo de áudio 520 pode compreender quadros de playout independentes em quadros indicados com n4, n2, n3 e n4. Por exemplo, um ou mais quadros de áudio normais, que não são quadros de playout independentes, podem ser dispostos entre dois quadros de playout independentes adjacentes. No entanto, os quadros de playout independentes também podem ser adjacentes em algumas situações.
[0123] De modo semelhante, o segundo fluxo de áudio 530 também compreende quadros de playout independentes nas posições de quadro n4, n2, n3 e n4.
[0124] Deve-se observar que as posições dos quadros de playout independentes nos dois fluxos 520, 530 podem ser opcionalmente idênticos, porém também podem ser diferentes. A título de simplicidade, supõe-se que as posições de quadro dos quadros de playout independentes são idênticos em ambos os fluxos.
[0125] No entanto, a princípio, é importante apenas que o primeiro quadro após a comutação seja um quadro de playout independente. Por exemplo, durante a comutação de
Petição 870190068437, de 19/07/2019, pág. 70/152
66/111 uma provisão de quadros de áudio do primeiro fluxo de áudio para uma provisão de quadros de áudio do segundo fluxo de áudio, deve-se garantir, pelo provedor de fluxo de áudio 500, que um primeiro quadro de uma porção de quadros fornecido do segundo fluxo de áudio é um quadro de playout independente.
[0126] Um exemplo será descrito com referência a uma representação de sinal de áudio codificado mostrada na referência numérica 550. Conforme pode ser observado, a representação de sinal de áudio codificado 512 compreende, em seu início, uma porção 552 que compreende um ou mais quadros de um primeiro fluxo de áudio. No entanto, após a provisão de um quadro de áudio que tem índice ηχ-l do primeiro fluxo de áudio, o provedor de fluxo de áudio 500 pode decidir (com base em uma decisão interna, ou com base em algumas informações de controle recebidas externamente) para comutar para o segundo fluxo de áudio. Consequentemente, uma porção 554 de quadros de áudio do segundo fluxo de áudio é fornecida dentro da representação de sinal de áudio codificado 512. Por exemplo, os quadros que têm índices de quadro de n2 para n2-l do segundo fluxo de áudio são fornecidos na porção 554 dentro da representação de sinal de áudio codificado 512. Deve-se observar que o primeiro quadro da porção 554 é um quadro de playout independente, que está no índice de quadro ni dentro do segundo fluxo de áudio 530. No entanto, quando um quadro que tem um índice de quadro n2-l tiver sido fornecido dentro da representação de sinal de áudio
Petição 870190068437, de 19/07/2019, pág. 71/152
67/111 codificado 512, o provedor de fluxo de áudio pode decidir novamente retornar à provisão de quadros de áudio do primeiro fluxo de áudio 520. Consequentemente, após (ou diretamente após) o quadro de áudio que tem o índice de quadro n2-l (que se baseia no segundo fluxo de áudio 530),
um quadro que | tem | o índice de quadro | n2, que é | obtido | do |
primeiro fluxo | de | áudio 520 pode ser | fornecido | dentro | da |
representação | de | sinal de áudio | codificado | Deve- | -se |
observar que o quadro que tem o índice n2 também é um quadro de playout independente. Consequentemente, uma porção do primeiro fluxo de áudio é obtida começando do quadro que tem o índice n2 e que termina no índice de quadro n4-l .
[0127] Em conclusão, a representação de sinal de áudio codificado 512 é uma concentração de porções de um ou mais quadros, em que algumas porções dos quadros são obtidas do primeiro fluxo de áudio 520 e em que algumas porções do quadros são obtidas do segundo fluxo de áudio 530. O primeiro quadro de cada porção é, de preferência, um quadro de playout independente, que é de preferência garantido pela operação do provedor de fluxo de áudio.
[0128] Tal quadro de playout independente de preferência compreende uma estrutura de configuração com um identificador de fluxo, em que o identificador de fluxo pode ser, por exemplo, contido em uma estrutura de extensão de configuração. Por exemplo, as informações de configuração do primeiro fluxo e do segundo fluxo podem ser idênticas com exceção do identificador de fluxo (e,
Petição 870190068437, de 19/07/2019, pág. 72/152
68/111 possivelmente, com exceção das informações de configuração que estão contidas dentro da estrutura de extensão de configuração após o identificador de fluxo).
[0129] Por exemplo, os quadros de playout independentes podem corresponder ao quadro 220, conforme explicado acima em relação ao decodificador de áudio 200.
[0130] Em conclusão, o provedor de fluxo de áudio 500 pode ter acesso a uma pluralidade de fluxos de áudio (por exemplo, os primeiro fluxo de áudio 520 e o segundo fluxo de áudio 530 e, opcionalmente, fluxos de áudio adicionais) e podem selecionar porções de quadros desses dois ou mais fluxos de áudio para inclusão na representação de sinal de áudio codificado 512, que é encaminhada (por exemplo, por meio da de comunicação) a um decodificador de áudio. Durante a seleção das porções de quadros a serem incluidos na representação de sinal de áudio codificado 512, o provedor de fluxo de áudio pode garantir que o primeiro quadro de cada porção é um quadro de playout independente que compreende informações suficientes para renderização (livre de artefatos) sem ter decodificado quaisquer quadros anteriores do dito fluxo de áudio. Ademais, o provedor de fluxo de áudio fornece a representação de sinal de áudio codificado de maneira que uma comutação entre porções de quadros de áudio dos fluxos diferentes seja reconhecível para um decodificador de áudio que recebe a representação de sinal de áudio codificado 512 de uma diferença dentro da porção relevante da estrutura de configuração. Para algumas transições, as estruturas de configuração podem ser
Petição 870190068437, de 19/07/2019, pág. 73/152
69/111 diferentes em relação à configuração de parâmetros de decodificador, porém para uma ou mais outras transições, as estruturas de configuração podem ser diferentes apenas no identificador de fluxo, ao passo que a outra configuração de decodificação parâmetros podem ser idênticas.
[0131] Consequentemente, os decodificadores de áudio podem reconhecer uma comutação entre diferentes fluxos de áudio e realizar uma reinicialização (transição) sempre que apropriado.
5. QUADRO DE ÁUDIO DE ACORDO COM A FIGURA 6 [0132] A Figura 6 mostra uma representação de um quadro de áudio que permite um acesso aleatório e que compreende uma porção de configuração com um identificador de fluxo em uma porção de extensão de configuração.
[0133] Por exemplo, uma Figura 6 mostra um exemplo de um quadro de áudio que pode assumir a função do quadro de áudio 222 descrita com referência à Figura 2. Por exemplo, o quadro de áudio pode ser i, quadro de USAC. O quadro de áudio da Figura 6 pode ser considerado como um ponto de acesso de fluxo ou quadro de playout intermediário.
[0134] O quadro pode seguir, por exemplo, as convenções de sintaxe do padrão de codificação de voz e de áudio unificada, incluindo as emendas disponíveis, porém pode ser adaptado à sintaxe de fluxos de bits de outros padrões de áudio ou de padrões de áudio mais recente.
[0135] Por exemplo, o quadro de USAC 600 pode compreender um sinalizador de independência de USAC 610. Ademais, o quadro de USAC pode compreender um elemento de
Petição 870190068437, de 19/07/2019, pág. 74/152
70/111 extensão indicado como USAC ExtElement. O elemento de extensão 620 pode ser um elemento de extensão com uma informação de configuração e com dados de pré-rolagem.
[0136] Opcionalmente, pode haver um sinalizador USAC ExtElementPresent que indica que a presença de dados adicionais. Por exemplo, é preferencial esse sinalizador seja igual a 1 no caso de um IPF (por exemplo, um ponto de acesso de fluxo). No entanto, esse sinalizador pode ser considerado como opcional.
[0137] Ademais, pode haver, opcionalmente um sinalizador USAC ExtElementUseDefaultLength que pode ser usado para codificar se um comprimento padrão do elemento de extensão deve ser usado ou se o comprimento do elemento de extensão é codificado. Por exemplo, é preferencial (porém não necessário) que esse sinalizador tenha um valor igual a zero no caso de um IPF.
[0138] Ademais, há dados de segmento de extensão de elemento, que também são denominados de USACExtElementSegmentData. Esses dados de segmentos de elemento de extensão compreendem uma informação de prérolagem de áudio, também denominadas de AudioPreRoll() em uma emenda do padrão USAC. A pré-rolagem de áudio compreende opcionalmente uma informação de comprimento de configuração configLen e uma informação de configuração Config(), em que as informações de configuração podem ser idênticas às informações de configuração de USAC que também são denominadas de UsacConfig(). De preferência, porém, não necessariamente, configLen deve assumir um
Petição 870190068437, de 19/07/2019, pág. 75/152
71/111 valor maior que zero caso as informações de configuração estejam presentes. Por exemplo, um valor maior que zero de config Len pode indicar que as informações de configuração não estão presentes. As informações de configuração podem compreender algumas informações básicas de configuração, como uma informação sobre uma frequência de amostragem e uma informação sobre um comprimento de quadro de SBR e uma informação sobre uma configuração de canal e vários outros itens de configuração de decodificador (opcionais) . A outra configuração de decodificador itens pode compreender, por exemplo, um ou mais ou até mesmo todos os itens de configuração descritos na definição do elemento de sintaxe UsacDecoderConfig() no padrão USAC.
[0139] Ademais, as informações de configuração compreende, como uma estrutura de subdados, uma estrutura de extensão de configuração. A estrutura de extensão de configuração pode seguir, por exemplo, a sintaxe do elemento de sintaxe UsacConfigExtension(). Por exemplo, a estrutura de extensão de configuração pode compreender uma informação em relação a várias extensões de configuração numConfigExtensions. Caso haja uma extensão de configuração do tipo ID_Config_Ext_Stream_ID, que é tipicamente o caso em modalidades de acordo com a invenção, o identificador de fluxo é representado por um elemento de sintaxe de fluxo de bits streamld(), que pode ser representado, por exemplo, por um valor de 16 bits.
[0140] Em conclusão, a estrutura de configuração que é
Petição 870190068437, de 19/07/2019, pág. 76/152
72/111 está incluída em um quadro de USAC em um elemento de extensão compreende algumas informações de configuração para definir parâmetros de decodificador e compreende adicionalmente, como uma extensão de configuração, um
identificador | de fluxo, que | pode | ser representado por um | |
número | inteiro | , por exemplo, | de 16 | bits . |
[0141] | As | informações | de | pré-rolagem de áudio |
compreendem opcionalmente informações adicionais, como um sinalizador applyCrossfade que indica a possibilidade de
aplicar | um desvanecimento | cruzado (em que, | por | exemplo, um | |
valor | maior que zero | pode | indicar nao | aplicar um | |
desvanecimento cruzado), | uma | informação | sobre vários | ||
quadros | de pré-rolagem e | uma | informação | em | relaçao aos |
quadros | de pré-rolagem, | que | podem ser | indicadas como | |
auLen | e AccessUnit(). | ||||
[0142] | De modo opciona | 11 o | quadro de | USAC | compreende |
adicionais mais elementos de extensão e compreende tipicamente um ou mais dentre um único elemento de canal, um elemento de par de canal ou um elemento de efeito de frequência inferior.
[0143] Em conclusão, um quadro de USAC (por exemplo, o quadro de USAC 222 ou um dentre os quadros de playout imediatos IPF) pode compreender, por exemplo, uma extensão elemento de sintaxe, em que a dita extensão elemento de sintaxe compreende a estrutura de configuração (por exemplo, 222c) e informações sobre um ou mais quadros de pré-rolagem, que podem, por exemplo, ser usados para tornar um estado de uma cadeia de processamento um estado desejado
Petição 870190068437, de 19/07/2019, pág. 77/152
73/111 e que pode, por exemplo, corresponder às informações 222d. Ademais, o quadro de USAC também compreende informações de áudio codificadas, como o único elemento de canal, o elemento de par de canal ou o elemento de efeitos de baixa frequência. Desse modo, é possível que um decodificador de áudio reconheça uma alteração de um fluxo de áudio com base no identificador de fluxo streamld(). Além disso, é possível que um decodificador de áudio realize uma decodificação livre de artefatos do quadro de USAC 600, visto que os parâmetros de decodificação possam ser definidos com base nas informações de configuração incluídas na estrutura de configuração e visto que um estado adequado da decodificação de áudio pode ser definido com base nas informações de quadro de pré-rolagem. Desse modo, o quadro de USAC descrito permite comutar entre uma decodificação de um diferente fluxo de áudio e também permite uma detecção da comutação por um decodificador de áudio sem informações.
[0144] O quadro de USAC 600 descrito no presente documento pode corresponder ao quadro de áudio 222 ou pode corresponder ao primeiro quadro de um segundo fluxo de áudio incluído na representação de sinal de áudio codificado 312 ou pode corresponder a um primeiro quadro do segundo fluxo de áudio incluído na representação de sinal codificada 412 ou pode corresponder a um quadro de playout imediato IPF, conforme mostrado na Figura 5.
6. FLUXO DE ÁUDIO EXEMPLIFICATIVO DE ACORDO COM A FIGURA 7
Petição 870190068437, de 19/07/2019, pág. 78/152
74/111 [0145] A Figura 7 mostra uma representação de um fluxo de áudio exemplificativo que pode ser fornecido por um dentre os codificadores de áudio descritos no presente documento e que pode ser decodificado por um dentre os decodificadores de áudio descritos no presente documento. O fluxo de áudio da Figura 7 também pode ser fornecido por um provedor de fluxo de áudio, conforme descrito no presente documento.
[0146] O fluxo de áudio 700 compreende, por exemplo, como um primeiro bloco de informações, uma informação de configuração de decodificador. As informações de configuração de decodificador podem compreender, por exemplo, um elemento de fluxo de bits UsacConfig(), conforme definido no padrão USAC. As informações de configuração de decodificador podem indicar, por exemplo, um identificador de fluxo de um e pode ser considerado como um ponto de acesso de fluxo que está no início do fluxo.
[0147] O fluxo de áudio também compreende uma unidade de informações de dados de quadro de áudio 720 que pode, por exemplo, compreender nenhum dado de pré-rolagem e que pode compreender nenhuma informação de identificador de fluxo. Por exemplo, a unidade de informações 720 pode ser um quadro de USAC e pode corresponder, por exemplo, ao elemento de sintaxe de fluxo de bits UsacFrame(), conforme definido no padrão USAC.
[0148] Ambas as unidades de informações 710 e 720 podem, por exemplo, podem pertencer a um primeiro fluxo de áudio.
[0149] O fluxo de áudio 700 também pode compreender a
Petição 870190068437, de 19/07/2019, pág. 79/152
75/111 unidade de informações 730 que pode, por exemplo, representar o primeiro quadro do segundo fluxo que está incluído no fluxo de áudio 700. A unidade de informações 730 pode compreender, por exemplo, dados de quadro de áudio, dados de pré-rolagem e uma informação de identificador de fluxo. As informações de identificador de fluxo pode indicar, por exemplo, um identificador de fluxo de dois que é diferente do identificador de fluxo incluído na unidade de informações 710.
[0150] A unidade de informações 730 pode ser considerada, por exemplo, como um ponto de acesso de fluxo.
[0151] Por exemplo, a unidade de informações 730 pode ser de acordo com a sintaxe do elemento de fluxo de bits UsacFrame(), conforme definido, no padrão USAC. No entanto, a unidade de informações 730 pode compreender um elemento de extensão do tipo id_ext_ele_audiopreroll. Esse elemento de extensão pode compreender uma estrutura de configuração, por exemplo, de acordo com a sintaxe de fluxo de bits UsacConf ig com uma estrutura de extensão de configuração, por exemplo, de acordo com a sintaxe de fluxo de bits UsacConfigExtension. A estrutura de extensão de configuração pode compreender, por exemplo, um elemento de extensão do tipo ID_CONFIG_EXT_STREAM_ID que codifica um identificador de fluxo. Desse modo, o item de informações ou unidade de informações 730 pode compreender, por exemplo, as informações do quadro de USAC 600, conforme explicado acima.
[0152] Desse modo, a unidade de informações 730 pode
Petição 870190068437, de 19/07/2019, pág. 80/152
76/111 representar um quadro de áudio do segundo fluxo e fornecer uma informação completa de configuração para configurar um decodificador de áudio para decodificar apropriadamente o quadro de áudio. Em particular, as informações de configuração também compreendem uma pré-rolagem de informações de áudio para definir os estados do decodificador de áudio, e as informações de configuração compreendem um identificador de fluxo que permite que o decodificador de áudio reconheça se unidade de informações 730 for associada a um fluxo de áudio diferente quando comparada à unidade de informações 700, 710.
[0153] O fluxo de áudio 700 também compreende uma unidade de informação 740 que segue a unidade de informações 700. A unidade de informações 740 pode ser, por exemplo, um quadro de áudio normal que compreende apenas dados de quadro de áudio, sem dados de pré-rolagem, sem dados de configuração e sem um identificador de fluxo. Por exemplo, a unidade de informações 740 pode seguir a sintaxe de fluxo de bits UsacFrame() sem usar nenhum elemento de extensão.
[0154] O fluxo de áudio 700 também pode compreender a unidade de informações 750 que pode compreender, por exemplo, dados de quadro de áudio e dados de pré-rolagem, porém que pode não compreender um identificador de fluxo. Portanto, a unidade de informações 750 pode ser utilizável apenas como um ponto de acesso de fluxo, porém pode não permitir uma detecção de uma comutação entre diferentes fluxos .
Petição 870190068437, de 19/07/2019, pág. 81/152
77/111 [0155] Por exemplo, a unidade de informações 750 pode ser de acordo com a sintaxe de fluxo de bits UsacFrame(), com um elemento de extensão ID_ext_ele_audiopreroll. No entanto, na unidade de informações 750, as informações de configuração, que são parte da pré-rolagem de áudio elemento de extensão, não compreendem um identificador de fluxo. Desse modo, a unidade de informações 750 pode não ser usada confiadamente como uma primeira unidade de informações após uma comutação entre diferentes fluxos de áudio. Por outro lado, a unidade de informações 730 pode ser usada confiadamente como uma primeira unidade de informações após uma comutação entre diferentes fluxos de áudio, visto que o identificador de fluxo incluído no mesmo permite uma detecção de uma comutação entre fluxos diferentes e visto que a unidade de informações também compreende informações completas para decodificação, incluindo informações de configuração e informações prérolagem .
[0156] Em conclusão, o fluxo de áudio 700 pode compreender unidades de informações ou quadros de áudio codificados que têm um conteúdo de informações diferente. Pode haver quadros de áudio muito simples que compreendem apenas dados de áudio codificado, sem dados de configuração e sem dados de pré-rolagem. Além disso, pode haver quadros de áudio que compreendem informações de áudio codificadas, assim como informações de configuração, que também incluem um identificador de fluxo e informações de pré-rolagem. Tais quadros permitem que a identificação de uma comutação
Petição 870190068437, de 19/07/2019, pág. 82/152
78/111 entre diferentes fluxos de áudio e para uma decodificação independente completa.
[0157] Ademais, também pode haver, opcionalmente, quadros que têm apenas uma informação parcial, porém que, por exemplo, não permitem uma identificação confiável de uma comutação entre fluxos diferentes devido ao fato de que não há informações de identificador de fluxo.
[0158] Deve-se observar que os decodificadores de áudio de acordo com as Figuras 1 e 2 podem tipicamente usar o fluxo de áudio 700 e que os codificadores de áudio e provedores de fluxo de áudio de acordo com Figuras 3 e 4 podem fornecer tipicamente o fluxo de áudio 700, conforme mostrado na Figura 7, (por exemplo, como a representação de sinal de áudio codificado 312, 314).
7. FLUXO DE ÁUDIO DE ACORDO COM A FIGURA 8 [0159] A Figura 8 mostra uma representação de um fluxo de áudio exemplificativo, de acordo com outra modalidade da presente invenção.
[0160] O fluxo de áudio de acordo com a Figura 8 é indicado em sua totalidade com 800.
[0161] Deve-se observar que as unidades de informações 810a a 810e pertencem a um primeiro fluxo de áudio. Por exemplo, uma unidade de informação 810a pode compreender uma configuração de decodificador e pode seguir, por exemplo, a sintaxe de fluxo de bits UsacConfig() conforme definido no padrão USAC. A configuração de decodificador pode compreender, por exemplo, uma estrutura de configuração que pode ser semelhante à estrutura de
Petição 870190068437, de 19/07/2019, pág. 83/152
79/111 configuração 222c. Por exemplo, a unidade de informações 810 pode incluir uma extensão de identificador de fluxo, em que o identificador de fluxo pode, por exemplo, estar incluído em uma estrutura de extensão de configuração da estrutura de configuração.
[0162] A unidade de informações 810b pode compreender, por exemplo, dados de quadro de áudio (like, por exemplo, valores espectrais codificados e informações de fator de escala codificado) sem dados de pré-rolagem e sem um identificador de fluxo. A unidade de informações 810d pode ter estrutura semelhante ou idêntica à unidade de informações 810b e pode, também, representa dados de quadro de áudio sem dados de pré-rolagem e sem um identificador de fluxo.
[0163] Ademais, o fluxo de áudio pode compreender uma porção 820, que segue a porção 810 e que é associado a um segundo fluxo de áudio que é diferente do primeiro fluxo de áudio. A porção 820 compreende uma unidade de informação 820a, que compreende dados de quadro de áudio com dados de pré-rolagem, sendo que os dados de pré-rolagem incluem (por exemplo, dentro de uma estrutura de configuração) uma extensão de identificador de fluxo. Desse modo, a unidade de informações 820a representa um quadro de áudio. Caso um decodificador de áudio constate, com base na extensão de identificador de fluxo, que um quadro de áudio decodificado anteriormente era de outro fluxo de áudio, os dados de prérolagem podem ser usados pelo decodificador de áudio para definir o decodificador de áudio para um estado apropriado
Petição 870190068437, de 19/07/2019, pág. 84/152
80/111 antes da decodificação dos dados de quadro de áudio na unidade de informações 820a. Desse modo, o unidade de informações 820a é bem adequado para ser a primeira unidade de informações após uma comutação entre diferentes fluxos de áudio.
[0164] O bloco 820 também compreende uma, duas ou mais unidades de informações 820b, 820d que compreendem dados de quadro de áudio, porém que não compreendem dados de prérolagem e que também não compreendem um identificador de fluxo.
[0165] Os fluxos de dados 800 também compreendem uma porção 830, que é associada a um terceiro fluxo de áudio. A porção 830 compreende uma unidade de informação 830a, que compreende dados de quadro de áudio com dados de prérolagem e que inclui uma extensão de identificador de fluxo. A porção 830 compreende adicionalmente uma unidade de informação 830b que compreende dados de quadro de áudio sem dados de pré-rolagem e sem um identificador de fluxo. A terceira porção 830 também compreende adicionalmente uma unidade de informação 830d que compreende dados de quadro de áudio com dados de pré-rolagem, porém sem um identificador de fluxo.
[0166] Desse modo, pode-se observar que o fluxo de áudio 800 compreende porções subsequentes que se original de diferentes fluxos de áudio, em que em cada transição de um fluxo para outro, há uma unidade de informação (por exemplo, um quadro de áudio codificado) que compreende dados de quadro de áudio com dados de pré-rolagem e com um
Petição 870190068437, de 19/07/2019, pág. 85/152
81/111 identificador de fluxo. Consequentemente, visto que há informações de identificador de fluxo disponíveis em cada comutação de um fluxo de áudio para outro fluxo de áudio dentro do quadro de áudio codificado, o decodificador de áudio pode reconhecer facilmente a dita transição avaliando-se o identificador de fluxo (por exemplo, em termos de uma comparação com um identificador de fluxo armazenado obtido anteriormente).
[0167] Deve-se observar que o fluxo de áudio pôde ser fornecido pelo codificador de áudio ou pelo provedor de fluxo de bits descrito no presente documento e que o fluxo de áudio 800 pôde ser avaliado pelo avaliado pelo decodificador de áudio descrito no presente documento.
8. FUNCIONALIDADE DE DECODIFICADOR DE ACORDO COM A FIGURA 9 [0168] A Figura 9 mostra uma representação esquemática de uma possível funcionalidade de decodificador de um decodificador de áudio, conforme descrito no presente documento.
[0169] Por exemplo, a funcionalidade, conforme descrito com referência à Figura 9 pode ser implantada no codificador de áudio 100, de acordo com a Figura 1, ou no decodificador de áudio 200, de acordo com a Figura 2. Por exemplo, a funcionalidade descrita na Figura 5 pode ser usada para decidir como continuar com a decodificação.
[0170] No entanto, deve-se verificar que a funcionalidade, conforme descrito com referência à Figura 9 é um apenas um exemplo e que, por exemplo, uma ordem da
Petição 870190068437, de 19/07/2019, pág. 86/152
82/111 decisão pode ser mudada desde que a funcionalidade geral permaneça igual. Além disso, é possível combinar decisões desde que a funcionalidade geral não seja modificada.
[0171] Supõe-se que a funcionalidade, conforme explicado na Figura 9, tem conhecimento sobre uma informação em relação aos quadros decodificados anteriormente e avalia um novo quadro de áudio, que pode estar de acordo com a sintaxe descrita no presente documento.
[0172] Por exemplo, em uma primeira verificação 110, o decodificador de áudio pode verificar se há um acesso aleatório, isto é, uma operação de pulo para um ponto de acesso de fluxo. Caso seja reconhecido que há um pulo para um ponto de acesso de fluxo, em que ordem normal dos quadros é mudada intencionalmente, a funcionalidade de decodificador prossegue com uma etapa 920 de avaliar dados de configuração do ponto de acesso de fluxo a fim de reinicializar o decodificador. Um desvanecimento cruzado pode ser realizado opcionalmente a fim de evitar uma comutação abrupta. Deve-se observar que um acesso aleatório significa pular de um primeiro quadro para um segundo quadro, em que o segundo quadro tem um índice de quadro que não está diretamente atrás do índice de quadro do quadro decodificado anteriormente. Em outras palavras, um acesso
aleatório é um pulo de | um quadro | que tem | um índice | de | |
quadro n para um quadro | que tem um | índice de | quadro | o, | em |
que o é diferente de n+1. | |||||
[0173] Na etapa 920, | o pulo é | realizado, | sendo | que | o |
alvo de pulo é um quadro que é um quadro de playout
Petição 870190068437, de 19/07/2019, pág. 87/152
83/111 imediato e que compreende informações suficientes para reinicializar o decodificador.
[0174] No entanto, caso constate-se na verificação 910 que não há acesso aleatório, mas sim uma reprodução contígua, uma verificação adicional 930 pode ser realizada. Em outras palavras, a verificação 930 é realizada caso a decodificação prossiga do quadro que tem o índice de quadro n para um quadro que tem o índice de quadro n+1.
[0175] Na verificação 930, verifica-se que a possibilidade de uma configuração (relevante) definida em uma estrutura de configuração de um ponto de acesso de fluxo (ou quadro de playout intermediário) sem considerar um identificador de fluxo (por exemplo, até, porém sem incluir o identificador de fluxo) é diferente de uma configuração atual. Caso a configuração (relevante) descrita em uma estrutura de configuração do ponto de acesso de fluxo seja diferente da configuração atual (caminho sim), a decodificação pode prosseguir na etapa 940. No entanto, deve-se verificar que a etapa 930 pode naturalmente ser executada apenas se o próximo quadro for um ponto de acesso de fluxo que compreende uma estrutura de configuração. Caso o próximo quadro does não compreenda uma estrutura de configuração, a etapa 930 não pode ser executada naturalmente e nenhuma diferença da configuração atual pode ser constatada.
[0176] No entanto, caso seja constatado, na etapa 930, que a configuração na estrutura de configuração do próximo
Petição 870190068437, de 19/07/2019, pág. 88/152
84/111 quadro (sem considerar o identificador de fluxo) seja idêntica ao configuração atual, é feita uma próxima verificação que é mostrada no bloco 950. Na etapa 950, determina-se a possibilidade de o ponto de acesso de fluxo compreender (por exemplo, dentro da estrutura de configuração) um identificador de fluxo. Por exemplo, o identificador de fluxo does não precisa ser necessariamente incluído, porém é incluído apenas na estrutura de configuração, caso haja uma estrutura de extensão de configuração e caso essa estrutura de extensão de configuração compreenda realmente um elemento de estrutura de dados que é um identificador de fluxo. Caso seja constatado, na comparação 950, que o ponto de acesso de fluxo compreende um identificador de fluxo (ramificação sim), o identificador de fluxo incluído no ponto de acesso de fluxo do próximo quadro (quadro a ser decodificado) é comparado ao atual identificador de fluxo (armazenado). Caso constate-se que o identificador de fluxo incluído no próximo quadro (quadro a ser decodificado) é diferente do atual identificador de fluxo (ramificação sim da decisão 960) pula-se para o 940. Por outro lado, caso constate-se que o identificador de fluxo do próximo quadro pé idêntico ao identificador de fluxo armazenado, as informações de configuração adicionais (por exemplo, extensões de configuração) que seguem na estrutura de extensão de configuração após o identificador de fluxo, são deixados desconsiderados para a determinação da possibilidade de realizar uma transição ou a
Petição 870190068437, de 19/07/2019, pág. 89/152
85/111 inicialização inicial (ramificação não da etapa 960).
[0177] No entanto, caso constate-se na verificação 950 que o ponto de acesso de fluxo (o próximo quadro a ser decodificado) não compreende um identificador de fluxo ou caso constate-se que o identificador de fluxo do próximo quadro a ser decodificado é igual ao identificador de fluxo armazenado, o procedimento continua na etapa 970.
[0178] Além disso, deve-se verificar que a etapa 940 compreende desvanecer entre um quadro de áudio que usa uma configuração velha e um quadro de áudio que usa uma nova configuração. Para a decodificação do quadro de áudio que usa a nova configuração, há uma reinicialização do decodificador de áudio (que pode compreender inicializar uma nova instância de decodificador) . Além disso, a velha instância de decodificador é descarregada e um desvanecimento cruzado é realizado.
[0179] Por outro lado, a etapa 970 compreende decodificar o próximo quadro sem reinicializar o decodificador, em que uma informação de pré-rolagem, que pode ser incluída no próximo quadro, é descartada (não considerada).
[0180] Em conclusão, há diferentes possibilidades que podem ser executadas sempre que o decodificador de áudio chega a um quadro de playout intermediário que também pode ser considerado como um ponto de acesso de fluxo. Além disso, deve-se verificar que nenhum processamento específico é feito tipicamente em quadros que não são quadros de playout intermediários ou pontos de acesso de
Petição 870190068437, de 19/07/2019, pág. 90/152
86/111 fluxo devido ao fato de que tais quadros não permitem uma reinicialização de um decodificador de áudio visto que não há estrutura de configuração e nenhuma informação de prérolagem disponível em tais quadros de áudio.
[0181] Quando um decodificador sabe que há um pulo, isto é, um desvio de uma ordem de quadro normal, há naturalmente uma reinicialização do decodificador de áudio que usa tipicamente as informações de pré-rolagem e, também, uma nova estrutura de configuração (até mesmo durante o pulo dentro do mesmo fluxo).
[0182] Caso não haja tal pulo, há diferentes casos:
Caso o decodificador de áudio constate que as informações de configuração de um próximo fluxo a serem decodificadas, até e incluindo o identificador de configuração, são diferentes de uma informação armazenada, também haverá uma reinicialização do decodificador de áudio. Por outro lado, caso o decodificador de áudio constate que as informações de configuração do próximo quadro a serem decodificadas, até e incluindo o identificador de fluxo (caso presente), sejam idênticas às informações armazenadas obtidas de um quadro decodificado anteriormente, nenhuma reinicialização será realizada. De todo modo, as informações de configuração que são colocadas após o identificador de fluxo na estrutura de configuração serão negligenciadas pelo decodificador de áudio durante a decisão de realizar ou não uma reinicialização. Além disso, caso o decodificador de áudio constate que não há identificador de fluxo dentro da estrutura de configuração,
Petição 870190068437, de 19/07/2019, pág. 91/152
87/111 o mesmo naturalmente nao considerará o identificador de fluxo na comparação às informações armazenadas.
[0183] No entanto, a fim de realizar a avaliação de maneira computacionalmente diferente, o decodificador pode verificar primeiramente as informações de configuração que antecedem o identificador de fluxo com as informações armazenadas de configuração, em seguida, a verificação quanto à possibilidade de haver um identificador de fluxo incluído na estrutura de configuração e, em seguida, prosseguir com uma comparação do identificador de fluxo (caso presente na estrutura de configuração) com um identificador de fluxo armazenado. Assim que o decodificador de áudio constatar uma diferença, o mesmo pode decidir uma reinicialização. Por outro lado, caso o decodificador de áudio não constate uma discrepância entre as informações de configuração, até e incluindo o identificador de fluxo, o mesmo pode decidir omitir uma reinicialização.
[0184] Consequentemente, alterações menores na configuração alterações, que não devem resultar em uma reinicialização, podem ser sinalizadas após o identificador de fluxo na estrutura de extensão de configuração por um codificador de áudio e o decodificador de áudio pode, nesse caso, prosseguir para decodificação com apenas uma configuração levemente mudada (o que não exige reinicialização).
[0185] Em conclusão, a funcionalidade de decodificador, conforme descrito, com referência à Figura 9 pode ser usada
Petição 870190068437, de 19/07/2019, pág. 92/152
88/111 em qualquer um dos decodificadores de áudio descritos no presente documento, porém deve ser considerado como opcional.
9. SINTAXE DE FLUXO DE BITS DE ACORDO COM AS FIGURAS 10A, 10B, IOC E 10D [0186] A seguir, uma sintaxe de fluxo de bits será descrita . Em particular, uma sintaxe de uma estrutura de configuração será descrita. Como exemplo, será descrita uma sintaxe de uma estrutura de configuração UsacConfig(), que pode substituir a estrutura de configuração 222c ou a estrutura de configuração 332 ou a estrutura de configuração 424 ou a estrutura de configuração Config() mostrada na Figura 6 ou da estrutura de configuração UsacConfig(), conforme mostrado na Figura 7, ou a estrutura de configuração Config mostrada na Figura 8.
[0187] A Figura 10 mostra uma representação da estrutura de configuração UsacConfig(). Conforme pode ser observado, a dita estrutura de configuração pode compreender, por exemplo, uma informação de índice frequência de amostragem 1020a e, opcionalmente, uma informações de frequência de amostragem 1020b. As informações de índice frequência de amostragem 1020a (possivelmente em combinação com as informações de frequência de amostragem 1020b), por exemplo, descrevem a frequência de amostragem usada por um codificador e, portanto, também descrevem a frequência de amostragem a ser usada por um decodificador de áudio.
[0188] Ademais, a estrutura de configuração também pode
Petição 870190068437, de 19/07/2019, pág. 93/152
89/111 compreender uma informação de índice de comprimento de quadro para uma replicação de banda espectral (SBR). Por exemplo, o índice pode determinar vários parâmetros para uma replicação largura de banda espectral, por exemplo, conforme definido no padrão USAC.
[0189] Ademais, a estrutura de configuração também pode compreender um índice de configuração de canal 1024a que pode determinar, por exemplo, uma configuração de canal. Uma informação de índice de configuração de canal pode definir, por exemplo, vários canais e um mapeamento de alto-falante associado. Por exemplo, as informação de índice de configuração de canal podem ter o significado, conforme definido no padrão USAC. Por exemplo, caso a informação de índice de configuração de canal seja igual à zero, os detalhes em relação a uma configuração de canal podem ser incluídos em uma estrutura de dados UsacChannelConfig() 1024b.
[0190] Ademais, a estrutura de configuração pode compreender uma informação de configuração de decodificador 1026a que pode descrever (ou enumerar), por exemplo, elementos de informações que estão presentes em um quadro de áudio estrutura de dados. Por exemplo, as informações de configuração de decodificador podem compreender um ou mais dentre os elementos que são descritos no padrão USAC.
[0191] Ademais, a estrutura de configuração 1010 também compreende um sinalizador (por exemplo, denominado UsacConfigExtensionPresent) que indica a presença de uma estrutura de extensão de configuração (por exemplo, a
Petição 870190068437, de 19/07/2019, pág. 94/152
90/111 estrutura de extensão de configuração 226) . A estrutura de configuração 1010 também compreende a estrutura de extensão de configuração, que é, por exemplo, designada com UsacConfigExtension() 1028a. A estrutura de extensão de configuração é de preferência uma parte da estrutura de configuração 1010 e, por exemplo, pode ser representada por uma sequência de bits que segue imediatamente os bits que representam os outros itens de configuração da estrutura de configuração 1010. A estrutura de extensão de configuração pode, por exemplo, transportar as informações de identificador de fluxo, conforme será descrito abaixo.
[0192] A seguir, uma possível sintaxe da estrutura de extensão de configuração será descrita fazendo referência à Figura 10b, em que a estrutura de extensão de configuração é designada em sua totalidade com 1030 e corresponde à estrutura de extensão de configuração 1028a.
[0193] A estrutura de extensão de configuração (também designada como UsacConfigExtension() ) pode, por exemplo, codificar várias extensões de configuração em um elemento de sintaxe 1040a. Deve-se observar que a ordem de diferentes itens de informação de extensão de configuração pode ser escolhida arbitrariamente, visto que há uma informação de tipo extensão de configuração 1042a e uma informação de comprimento de extensão de configuração 1044a para cada item de extensão de configuração. Consequentemente, a estrutura de extensão de configuração 1030 pode transportar uma pluralidade de itens de extensão de configuração (ou itens de informação de extensão de
Petição 870190068437, de 19/07/2019, pág. 95/152
91/111 configuração) em uma ordem variável, em que um codificador de áudio pode determinar qual item de extensão de configuração é codificado primeiro e qual item de extensão de configuração é codificado posteriormente. Por exemplo, para cada item de informação de configuração, pode haver primeiro um identificador do tipo de extensão de configuração 1042a, seguido por uma informação de comprimento de extensão de configuração 1044, e então pode haver a carga do respectivo item de informação de extensão de configuração. A codificação da carga do respectivo item de informação de extensão de configuração pode, por exemplo, variar dependendo do tipo do item de informação de extensão de configuração indicado pelas informações de tipo extensão de configuração, e o comprimento da carga do respectivo item de informação de extensão de configuração pode ser determinado pelo valor da respectiva informação de comprimento de extensão de configuração 1044a. Por exemplo, no caso em que o item de informação de extensão de configuração é uma informação de preenchimento, pode haver um ou mais bytes de preenchimento. Por outro lado, se o item de informação de extensão de configuração for uma informação de intensidade de extensão de configuração, pode haver uma estrutura de dados que compreende uma informação acerca da intensidade (por exemplo, designada como loudnesslnfoSet()).
[0194] Ademais, se o item de informação de extensão de configuração for um identificador de fluxo, pode haver uma representação de número de um identificador de fluxo que é
Petição 870190068437, de 19/07/2019, pág. 96/152
92/111 designado como streamld(). Exemplos de sintaxe para diferentes tipos de itens de informação de extensão de configuração são mostrados em numerais de referência 1046a, 1048a e 1050a.
[0195] Em conclusão a sintaxe da estrutura de extensão de configuração se dá de modo que a ordem de diferentes itens de informações de configuração possa ser variada. Por exemplo, o item de informação de extensão de configuração de identificador de fluxo pode ser colocado antes ou após outros itens de informação de extensão de configuração por um codificador de áudio. Consequentemente, o codificador de áudio pode controlar, pela colocação do item de informação de extensão de configuração de identificador de fluxo dentro da estrutura de extensão de configuração, quais outros itens de informação da estrutura de extensão de configuração devem ser considerados em uma comparação entre a configuração indicada pela estrutura de configuração atual e uma informação de configuração anteriormente adquirida por um decodificador de áudio. Tipicamente, os itens de informações de configuração que precedem a estrutura de extensão de configuração e quaisquer itens de informação de extensão de configuração até e incluindo as informações de identificador de fluxo serão considerados em tal comparação, enquanto quaisquer itens de informação de extensão de configuração que são codificados no fluxo de bits após o item de informação de extensão de configuração de identificador de fluxo terá sido negligenciado na comparação.
Petição 870190068437, de 19/07/2019, pág. 97/152
93/111 [0196] Desse modo, a estrutura de configuração conforme explicado em relação às Figuras 10a e 10b é adequada para o conceito de acordo com a presente invenção.
[0197] A Figura 10 mostra uma item de informação de sintaxe do identificador de fluxo (extensão de configuração), que é também designado com Streamld() (ou com streamld()). Conforme pode ser observado, o identificador de fluxo pode ser representado por uma representação de número de binário de 16 bits. Consequentemente, mais do que 65.000 valores diferentes podem ser codificados como o identificador de fluxo, que é tipicamente suficiente para reconhecer quaisquer transições entre diferentes fluxos de áudio.
[0198] A Figura lOd mostra um exemplo de uma alocação de identificadores de tipo para diferentes itens de informação de extensão de configuração. Por exemplo, um item de informação de extensão de configuração do tipo identificador de fluxo pode ser representado por um valor de sete das informações de tipo extensão de configuração 1042a. Outros tipos de itens de informação de extensão de configuração podem ser, por exemplo, representados por outros valores do identificador do tipo de extensão de configuração 1042a.
[0199] Em conclusão, as Figuras 10a a lOd descrevem uma possível sintaxe (ou extensão de sintaxe) de uma estrutura de configuração que pode ser usada por um codificador de áudio para codificar uma informação de identificador de fluxo que pode ser usada por um decodificador de áudio para
Petição 870190068437, de 19/07/2019, pág. 98/152
94/111 extrair uma informação de identificador de fluxo.
[0200] No entanto, deve-se observar que a estrutura de configuração descrita aqui deve ser somente considerada como um exemplo e pode ser modificada através de uma ampla faixa. Por exemplo, as informações de índice de frequência de amostragem e/ou as informações de frequência de amostragem e/ou as informações de índice de comprimento de quadro de replicação de largura de banda espectral e/ou as informações de índice de configuração de canal poderíam ser codificados de maneira diferente. Além disso, opcionalmente, um ou mais dos itens de informação mencionados acima poderíam ser removidos. Ademais, o item de informação de UsacDecoderConfig também podería ser omitido.
[0201] Ademais, a codificação do número de extensões de configuração, dos tipos de extensão de configuração e do comprimento de extensão de configuração podería ser modificada. Além disso, os diferentes itens de informação de extensão de configuração também devem ser considerados como opcionais, e também podería ser possivelmente codificado de maneira diferente.
[0202] Ademais, o identificador de fluxo também podería ser codificados com mais ou menos bits, em que diferentes tipos de representação de número poderíam ser usados. Ademais, a alocação de números de identificador a diferentes tipos de extensão de configuração devem ser considerados como um exemplo preferencial, mas não como um recurso essencial.
Petição 870190068437, de 19/07/2019, pág. 99/152
95/111
9. CONCLUSÕES [0203] A seguir, alguns aspectos de acordo com a invenção serão descritos, que podem ser usados individualmente ou quando tomados em combinação com as modalidades descritas no presente documento.
[0204] Em particular, uma solução de acordo com a presente invenção será descrita no presente documento.
[0205] Deve-se observar que aspectos das modalidades de acordo com a presente invenção são descritos pelas reivindicações anexas.
[0206] No entanto, modalidades conforme definido pelas reivindicações podem ser opcionalmente suplementadas por qualquer um dos recursos descritos no presente documento, tanto individualmente como em combinação. Além disso, devese observar que quaisquer definições em parênteses () ou [] devem ser consideradas como sendo opcionais, em particular quando usadas nas reivindicações.
[0207] Todavia, deve-se observar que recursos da invenção descritos a seguir também podem ser usados separadamente a partir dos recursos das reivindicações.
[0208] Ademais, recursos e funcionalidades descritos nas reivindicações e descritos a seguir podem ser opcionalmente combinados com recursos e funcionalidades descritos na seção que descreve problemas subjacentes a aspectos da invenção, possíveis situações de uso para as modalidades e abordagens convencionais. Em particular, recursos e funcionalidades descritos no presente documento podem ser usados em um decodificador de áudio de USAC de acordo com
Petição 870190068437, de 19/07/2019, pág. 100/152
96/111
ISO/IEC 23003-3: 2012, incluindo a emenda 3, subcláusula adaptação de taxa de bits (por exemplo, conforme padronizado na data de depósito do pedido de prioridade da presente aplicação, ou conforme padronizado na data de depósito da presente invenção, mas também - opcionalmente incluindo modificações futuras adicionais).
[0209] De acordo com um aspecto da invenção, é proposto introduzir (por exemplo, em uma sintaxe de fluxo de bits de USAC) uma nova extensão de configuração para USAC com usacConfigExtType==ID_CONFIG_EXT_STREAM_ID com uma estrutura de fluxo de bits associada que contém um campo de bits de identificador de 16 bits universal simples. Esse identificador deve ser diferente (pode ser, por exemplo, escolhido diferente por um codificador de áudio ou por um provedor de fluxo de áudio) entre quaisquer duas estruturas de configuração para todos os fluxos dentro de um conjunto de fluxos que são destinados por uma comutação ininterrupta entre os mesmos. Um exemplo para tal conjunto de fluxos é um denominado conjunto de adaptação em um caso de uso de entrega de MPEG-DASH.
[0210] A extensão de configuração de ID de fluo exclusivo proposto, por exemplo, garantirá que, em um ponto de comparação da corrente (ou a configuração atual) com uma nova estrutura de configuração (por exemplo, no lado de um codificador de áudio ou no lado de um decodificador de áudio), a nova configuração (e, portanto, o novo fluxo) é corretamente identificado e o decodificador se comportará conforme esperado e destinado, por exemplo, o decodificador
Petição 870190068437, de 19/07/2019, pág. 101/152
97/111 conduzirá um alinhamento de decodificador apropriado, prérolagem de unidades de acesso e realização de um fading cruzado (se for aplicável).
[0211] A seguir, há um texto de especificação proposto (modificação) (por exemplo, de MPEG-D USAC (ISO/IEC 230033+AMD.1+AMD-2+AMD.3) conforme padronizado na data de depósito da presente aplicação ou conforme padronizado na data de depósito do pedido de prioridade, e que compreende opcionalmente quaisquer modificações futuras).
[0212] As passagens mencionadas nos aspectos descritos a seguir da invenção que podem ser usados individualmente ou em combinação com um decodificador de áudio de USAC ou dentro de outro decodificador de áudio baseado em quadro.
[0213] Uma extensão de configuração, conforme mostrado na tabela 15 a seguir, pode ser usada por um codificador de áudio, de modo a fornecer um fluxo de bits de áudio e pode ser usada por um decodificador de áudio de modo a extrair informações de um fluxo de bits de áudio.
[0214] Ao usar uma codificação e decodificação de áudio de acordo com o padrão de USAC mencionado acima, a tabela 15 na seção 5.2 deve ser substituída pela versão atualizada seguinte da tabela 15:
TABELA | 15 | - SINTAXE | DE | |
UsacConfigExtension() | ||||
Sintaxe | n- de .. « Ί . Mnemonica bits | |||
UsacConfigExtension ( ) | ||||
{ |
Petição 870190068437, de 19/07/2019, pág. 102/152
98/111 numConfigExtensions escapedValue(2,4,8) + 1;
Codificaç ão pode variar para (confExtIdx=0; confExtIdxcnumConfigExtensions; confExtIdx++) {
usacConfigExtType[confExtldx] = escapedValue(4,8,16); | Codificaç ão pode variar |
usacConfigExtLength[confExtldx] = escapedValue(4,8,16); | Codificaç ão pode variar |
comutar (usacConfigExtType[confExtIdx]) { caso ID_CONFIG_EXT_FILL:
enquanto (usacConfigExtLength[confExtldx]—) { fill_byte[i] ; / * deve ser '10100101' */ }
quebra;
caso ID_CONFIG_EXT_LOUDNESS_INFO: loudnesslnfoSet() quebra;
||||||||||||||ίθΟ^ () ;
|||||||||||||||||j||B^ padrão:
enquanto (usacConfigExtLength[confExtldx]—) { tmp; 8 }
quebra;
} }
} opcional
Uimsbf opcional idoia opcional
Uimsbf
Petição 870190068437, de 19/07/2019, pág. 103/152
99/111 [0215] Além disso, ao considerar uma codificação de áudio ou uma decodificação de áudio de acordo com o padrão de USAC, ao fim da seção 5.2 do padrão de USAC, uma nova tabela AMD.01 conforme a seguir deve ser adicionada (em que detalhes de codificação, número de bits são opcionais):
TABELA AMD.01 - SINTAXE DE Streamld()
Sintaxe | n- de bits Mnemônica |
Streamld() { streamidentifier } | |
16 Uimsbf |
[0216] No entanto, nas ditas tabelas, detalhes de codificação e, por exemplo, um número de bits deve ser considerado como sendo opcional.
[0217] Ademais, ao considerar uma codificação ou decodificação de acordo com o padrão de USAC, a subcláusula 6.1.15 a seguir deve ser adicionada após 6.1.14 UsacConfigExtension():
6.1.15 IDENTIFICADOR DE FLUXO EXCLUSIVO (IP DE FLUXO)
6.1.15.1 TERMOS, DEFINIÇÕES E SEMÂNTICA [0218] streamidentifier um identificador de fluxo de número inteiro não sinalizado de dois bits (ID de fluxo) que deve identificar exclusivamente uma configuração de um fluxo dentro de um conjunto de fluxos associados que são destinados para comutação ininterrupta entre os mesmos, streamidentifier pode tomar valores de 0 a 65535. (detalhes de codificação são opcionais)
Petição 870190068437, de 19/07/2019, pág. 104/152
100/111 [0219] EXAMPLE ao ser parte de um conjunto de adaptaçao de MPEG-DASH conforme definido em ISO/IEC 23009, todos os IDs de fluxo de fluxos pelo fato de que conjunto de adaptação de DASH deve ser distinto em pares.
6.1.15.2 DESCRIÇÃO DE IDENTIFICADOR DE FLUXO [0220] Extensões de configuração do tipo ID_CONFIG_EXT_STREAM_ID fornecem um recipiente para sinalizar um identificador de fluxo (abreviado: ID de fluxo) A extensão de configuração de ID de fluxo permite anexar a número inteiro exclusivo a uma estrutura de configuração de modo que as configurações de fluxo de bits de áudio de dois fluxos possam ser distinguidas mesmo se o resto da estrutura de configuração for idêntico em (bit-).
[0221] O usacConfigExtLength de uma extensão de configuração do tipo ID_CONFIG_EXT_STREAM_ID deve ter o valor 2 (dois). (opcional, também podería ser diferente) [0222] Qualquer dado fluxo de bits de áudio não deve ter mais do que uma extensão de configuração do tipo ID_CONFIG_EXT_STREAM_ID. (opcional) [0223] Se a instância de decodificador operativa de modo regular receber uma nova estrutura de configuração, por exemplo, por meio de um Config () em uma carga de extensão ID_EXT_ELE_AUDIOPREROLL, a mesma deve comparar essa nova estrutura de configuração com a configuração atualmente ativa (consultar, por exemplo, 7.18.3.3). Tal comparação, por exemplo, pode ser conduzida por meio de uma comparação em bits das estruturas de configuração correspondentes.
Petição 870190068437, de 19/07/2019, pág. 105/152
101/111 [0224] Se as estruturas de configuração conterem extensões de configuração, então, por exemplo, todas as extensões de configuração até e incluindo a extensão de configuração de tipo ID_CONFIG_EXT_STREAM_ID devem ser incluídas na comparação. Todas as extensões de configuração seguindo a extensão de configuração de tipo ID_CONFIG_EXT_STREAM_ID não devem ser, por exemplo, consideradas durante a comparação, (opcional) [0225] NOTA A regra acima permite que um codificador controle se alterações em extensões de configuração particulares devem causar uma reconfiguração de decodificador ou não.
[0226] Deve-se observar que definições e detalhes desta passagem a ser adicionada ao padrão pode ser opcionalmente usada em modalidades de acordo com a presente invenção, tanto individualmente quanto tomadas em combinação, independentemente de quais.
[0227] Ao considerar uma codificação ou decodificação de USAC, a tabela 74 na cláusula 6 deve ser substituída pela tabela conforme mostrado na Figura lOd.
[0228] Para concluir algumas possíveis alterações que podem ser introduzidas ao padrão de USAC foram descritas. No entanto, o conceito conforme descrito aqui também podem ser usadas em conexão com outros padrões de codificação de áudio. Em outras palavras, também seria possível introduzir alguma estrutura de configuração de qualquer outro padrão de codificação de áudio, uma informação de identificador de fluxo, conforme descrito aqui.
Petição 870190068437, de 19/07/2019, pág. 106/152
102/111 [0229] Os recursos descritos aqui em relação às informações de identificador de fluxo também poderíam ser aplicados quando tomados em combinação com outros padrões de codificação. Nesse caso, a terminologia deve ser adaptada à terminologia do respectivo padrão de codificação de áudio.
[0230] A seguir, alguns efeitos opcionais e vantagens ou recursos de acordo com a presente invenção serão descritos.
[0231] A extensão de configuração apresentada fornece uma solução facilmente implantável para distinguir entre estruturas de configuração que são de outro modo idênticas em bit. A distinguibilidade obtida entre configurações permite, por exemplo, correção e a funcionalidade originalmente destinada de transmissão continua adaptativa dinâmica com transições ininterruptas entre fluxos.
[0232] A seguir, algumas soluções alternativas serão descritas.
[0233] Por exemplo, o problema mencionado acima podería ser evitado caso o codificador garantir que todos os fluxos
dentro de | um conjunto | de | fluxos | têm | diferentes |
configurações | , isto é, os | mesmos | fazem | uso de | diferentes |
ferramentas | de codificação | ou | usam | diferentes |
parametrizações. Caso as diferenças na taxa de bits dos fluxos individuais sejam grandes o suficiente, isso resulta, em geral, em configurações que são distintas em pares. Caso uma rede fina de taxas de bits seja necessária, o que é frequentemente o caso, a solução (convencional), em alguns casos, não funcionará.
Petição 870190068437, de 19/07/2019, pág. 107/152
103/111 [0234] Em contraste, com o uso de um identificador de fluxo, que é incluído em uma porção de configuração (também designada como estrutura de configuração), para distinguir fluxos diferentes, fluxos também podem ser distinguidos caso o resto da estrutura de configuração seja idêntica (que é algumas vezes o caso se taxas de bits forem similares).
[0235] Alternativamente (por exemplo, como uma alternativa ao de um identificador de fluxo), poderia-se criar uma extensão de configuração não-especifiçada apropriada que é variada para cada fluxo, mas é de certa forma estruturada de modo diferente. O efeito seria o mesmo. Embora a funcionalidade correta não possa ser garantida, devido ao fato de que não se possa garantir que todas as implantações de decodificador avaliem essa extensão de configuração não especificada quando configurações são comparadas na situação descrita acima.
[0236] Em contraste, modalidades de acordo com a invenção criam um conceito no qual um identificador de fluxo é claramente especificado em uma estrutura de configuração e permite distinção bem definida de fluxos diferentes.
[0237] Deve-se observar que a implantação do conceito inventivo pode ser reconhecido por uma análise da estrutura de configuração dos fluxos de USAC. Ademais, implantações do conceito inventivo podem ser reconhecidos por teste para a presença de extensões de configuração conforme descrito acima.
Petição 870190068437, de 19/07/2019, pág. 108/152
104/111 [0238] A seguir, alguns campos possíveis de aplicação para aspectos de acordo com a invenção serão descritos.
[0239] Modalidades de acordo com a invenção fornecem uma distinguibilidade de estruturas de dados de outro modo idênticas.
[0240] Modalidades adicionais de acordo com a invenção fornecem uma distiguibilidade de estruturas de configuração de codec de áudio de outro modo idênticas.
[0241] Modalidades de acordo com a invenção permitem um transmissão contínua adaptativa ininterrupta contínua de áudio através de qualquer rede de transmissão.
[0242] A seguir, alguns aspectos adicionais serão descritos, que devem ser considerados como sendo opcionais.
[0243] Por exemplo, um comportamento de codificador de áudio/provedor de fluxo de áudio será descrito a seguir. A seguir, alguns detalhes opcionais relacionados ao codificador de áudio (que também pode tomar a forma de um provedor de fluxo de áudio) serão descritos.
[0244] O codificador de áudio geralmente não gera um fluxo (único) que altera subitamente sua configuração, mas o codificador ou uma estrutura de codificador que compreende múltiplas instâncias de codificador gera múltiplos fluxos em paralelo que compreendem respectivamente, em posições sincronizadas (pontos de tempo) dentro dos fluxos, IPFs (quadros de playout imediato).
[0245] Uma estrutura de decodificador então seleciona, de acordo com critérios específicos e/ou predeterminados,
Petição 870190068437, de 19/07/2019, pág. 109/152
105/111 como, por exemplo, uma qualidade de uma conexão de internet, um dos fluxos gerados em paralelo e pede (ou solicita) um servidor de lado de codificador para enviar exatamente esse fluxo e então encaminha o fluxo ao decodificador. Todos os fluxos codificados adicionais são simplesmente ignorados. Uma alteração entre fluxos é então somente permitida nos IPFs.
[0246] O decodificador de áudio não reconhece inicialmente tal alteração e/ou não é informado acerca de tal alteração, por exemplo, pela estrutura de decodificador. Em vez disso, o decodificador de áudio precisa detectar uma alteração de fluxo por uma comparação das estruturas de configuração incorporadas (Configstructures). A partir da vista do decodificador, isso aparece como se o codificador tivesse somente gerado um fluxo com uma configuração de mudança (Config). De fato, em geral, esse não é o caso. Em vez disso, múltiplos variantes (que compreendem diferente taxas de bits) são sempre (continuamente) gerados em paralelo pelo codificador; somente o estrutura de decodificador e o servidor de lado de codificador (ou provedor de fluxo) dividem os fluxos e redispor (reconcatenar) porções dos fluxos (ou dos fluxos).
[0247] Detalhes opcionais adicionais são mostrados nas Figuras.
[0248] Ademais, deve-se observar que os aparelhos mostrados nas Figuras pode ser suplementados por qualquer um dos recursos e funcionalidades descritas no presente
Petição 870190068437, de 19/07/2019, pág. 110/152
106/111 documento, tanto individualmente como em combinação.
[0249] Em conclusão, um codificador de áudio ou um provedor de fluxo de áudio pode comutar entre a provisão de fluxos diferentes a um determinado decodificador de áudio (ou a um dispositivo de decodificação de áudio), em que a comutação pode ser realizada, por exemplo, na solicitação do decodificador de áudio ou do dispositivo de decodificação de áudio, ou na solicitação de qualquer outro dispositivo de gerenciamento de rede, ou mesmo por uma decisão do codificador de áudio ou provedor de fluxo de áudio. A comutação entre a provisão de quadros de diferentes fluxos de áudio pode ser usada para adaptar a taxa de bits real a uma taxa de bits disponível. A configuração de decodificador, que é sinalizada de um codificador de áudio (ou provedor de fluxo de áudio) a um decodificador de áudio pode ser idêntica entre fluxos diferentes, mas o identificador de fluxo deve ser diferente entre fluxos diferentes. Consequentemente, o decodificador de áudio pode reconhecer, com o uso do identificador de fluxo, quando a reinicialização do decodificador de áudio deve ser realizada com o uso das informações adicionais (por exemplo, informações de configuração e informações de pré-rolagem) incluído em um quadro de playout imediato.
[0250] Para incluir adicionalmente, com o uso de um identificador de fluxo (streamID), conforme descrito no presente documento, pode superar os problemas mencionados na seção que descreve problemas subjacentes a aspectos da invenção e possíveis situações de uso para as modalidades.
Petição 870190068437, de 19/07/2019, pág. 111/152
107/111
10. MÉTODOS [0251] As Figuras 11a a 11c mostram fluxogramas de métodos de acordo com modalidades de acordo com a presente invenção.
[0252] Os métodos conforme mostrado nas Figuras 11a a 11c podem ser suplementados por qualquer um dos recursos e funcionalidades descritas no presente documento.
11. ALTERNATIVAS DE IMPLANTAÇÃO [0253] Embora alguns aspectos tenham sido descritos no contexto de um aparelho, é claro que esses aspectos também representam uma descrição do método correspondente, em que um bloco ou dispositivo corresponde a uma etapa de método ou um recurso de uma etapa de método. De modo análogo, aspectos descritos no contexto de uma etapa de método também representam uma descrição de um bloco correspondente ou item ou recurso de um aparelho correspondente. Algumas ou todas as etapas de método podem ser executadas por um aparelho de hardware (ou com o uso do mesmo), como por exemplo, um microprocessador, um computador programável ou um circuito eletrônico. Em algumas modalidades, um ou mais das etapas de método mais importantes podem ser executadas por tal aparelho.
[0254] O sinal de áudio codificado inventivo pode ser armazenado em um meio de armazenamento digital ou pode ser transmitido em um meio de transmissão tal como um meio de transmissão sem fio ou um meio de transmissão com fio tal como a Internet.
[0255] Dependendo de determinados requisitos de
Petição 870190068437, de 19/07/2019, pág. 112/152
108/111 implantaçao, modalidades da invenção podem ser implantadas
em | hardware | ou | em software. | A | implantaçao | pode ser |
real | izada com | o | uso de um meio | de | armazenamento digital, | |
por | exemplo, | um | disquete, um DVD, | um Blu-Ray, | um CD, um | |
ROM, | um PROM, | um | EPROM, um EEPROM | ou | uma memória | FLASH, que |
têm sinais de controle eletronicamente legíveis armazenados no mesmo, que cooperam (ou têm capacidade de cooperar) com um sistema de computador programável de modo que o respectivo método seja realizado. Portanto, o meio de armazenamento digital pode ser legível em computador.
[0256] Algumas modalidades de acordo com a invenção compreendem uma portadora de dados que tem sinais de controle eletronicamente legíveis, que têm capacidade de cooperar com um sistema de computador programável, de modo que um dos métodos descritos no presente documento seja realizado.
[0257] Em geral, modalidades da presente invenção podem ser implantadas como um produto de programa de computador com um código de programa, sendo que o código de programa é operativo para realizar um dos métodos quando o produto de programa de computador é executado em um computador. O código de programa pode ser, por exemplo, armazenado em uma portadora legível em máquina.
[0258] Outras modalidades compreendem o programa de computador para realizar um dos métodos descritos no presente documento, armazenados em uma portadora legível em máquina.
[0259] Em outras palavras, uma modalidade do método
Petição 870190068437, de 19/07/2019, pág. 113/152
109/111 inventivo é, portanto, um programa de computador que tem um código de programa para realizar um dos métodos descritos no presente documento, quando o programa de computador é executado em um computador.
[0260] Uma modalidade adicional dos métodos inventivos é, portanto, uma portadora de dados (ou um meio de armazenamento digital, ou um meio legível em computador) que compreende, registrado no mesmo, o programa de computador para realizar um dos métodos descritos no presente documento. A portadora de dados, o meio de armazenamento digital ou o meio registrado são tipicamente tangíveis e/ou não transitórios.
[0261] Uma modalidade adicional do método inventivo é, portanto, um fluxo de dados ou uma sequência de sinais que representa o programa de computador para realizar um dos métodos descritos no presente documento. O fluxo de dados ou a sequência de sinais pode ser, por exemplo, configurada para ser transferida por meio de uma conexão de comunicação de dados, por exemplo, por meio da Internet.
[0262] Uma modalidade adicional compreende um meio de processamento, por exemplo, um computador, ou um dispositivo lógico programável, configurado ou adaptado para realizar um dos métodos descritos no presente documento.
[0263] Uma modalidade adicional compreende um computador que tem instalado no mesmo o programa de computador para realizar um dos métodos descritos no presente documento.
[0264] Uma modalidade adicional de acordo com a invenção
Petição 870190068437, de 19/07/2019, pág. 114/152
110/111 compreende um aparelho ou a sistema configurado para transferir (por exemplo, de modo eletrônico ou óptico) um programa de computador para realizar um dos métodos descritos no presente documento a um receptor. O receptor pode, por exemplo, ser um computador, um dispositivo móvel,
um dispositivo | de memória | ou similares. | 0 aparelho | ou |
sistema pode | compreender, | por exemplo, | um servidor | de |
arquivos para | transferir | o programa de | computador | ao |
receptor.
[0265] Em algumas modalidades, um dispositivo lógico programável (por exemplo, um arranjo de porta programável de campo) pode ser usado para realizar algumas ou todas as funcionalidades dos métodos descritos no presente documento. Em algumas modalidades, um arranjo de porta programável de campo pode cooperar com um microprocessador de modo a realizar um dos métodos descritos no presente documento. Em geral, os métodos são de preferência realizados por qualquer aparelho de hardware.
[0266] O aparelho descrito no presente documento pode ser implantado com o uso de um aparelho de hardware, ou com o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.
[0267] O aparelho descrito no presente documento, ou qualquer componentes do aparelho descrito no presente documento, podem ser implantados pelo menos parcialmente em hardware e/ou em software.
[0268] Os métodos descritos no presente documento podem ser realizados com o uso de um aparelho de hardware, ou com
Petição 870190068437, de 19/07/2019, pág. 115/152
111/111 o uso de um computador, ou com o uso de uma combinação de um aparelho de hardware e um computador.
[0269] Os métodos descritos no presente documento, ou quaisquer componentes do aparelho descritos no presente documento, pode ser realizados pelo menos parcialmente por hardware e/ou por software.
[0270] As modalidades descritas acima são meramente ilustrativas para os princípios da presente invenção. Entende-se que modificações e variações das disposições e dos detalhes descritos no presente documento serão evidentes a outros elementos versados na técnica. Portando, há a intenção de se limitar somente pelo escopo das reivindicações de patente a seguir e não pelos detalhes específicos apresentados por meio de descrição e explicação das modalidades no presente documento.
Claims (28)
1. Decodificador de áudio (100; 200) para fornecer uma representação de sinal de áudio decodificado (112; 212) com base em uma representação de sinal de áudio codificado (110; 210; 312; 412; 550; 600; 700; 800), em que o decodificador de áudio é caracterizado por ser configurado para, ajustar parâmetros de decodificação na dependência de uma informação de configuração (110a; 222c; 332; 424; 1010, 10.30), em que o decodificador de áudio é configurado para decodificar um ou mais quadros de áudio usando uma informação de configuração atual (140; 240), e em. que o decodificador de áudio é configurado para comparar uma informação de configuração (110a; 222c; 332; 424; 1010, 1030) em uma estrutura de configuração associada com. um ou mais quadros (222) a serem, decodificados, com. as informações de configuração atuais (140; 240), e fazer uma transição para realizar uma decodificação usando as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados como uma nova informação de configuração se as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, ou uma porção relevante (1020a, 1020b, 1022a, 1024a, 1024b, 1026a, 1050a) das informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, é diferente a partir das informações de configuração atuai
Petição 870190068437, de 19/07/2019, pág. 117/152 em que o decodificador de áudio é configurado para considerar uma informação de identificador de fluxo (230; streamID, 1050a, streamidentifier) incluída na estrutura de configuração ao comparar as informações de configuração, tal que uma diferença entre um identificador de fluxo previamente adquirido pelo decodificador de áudio e um identificador de fluxo representado pelas de identificador de fluxo na estrutura de configuração associada com o um ou mais quadros a serem decodificados faz com que a transição seja feita.
2. Decodificador de áudio, de acordo com a reivindicação 1, em que o decodificador de áudio é caracterizado por ser configurado para verificar se a utura figuração de as informaç de identificador de fluxo streamID, streamidentifier), e considerar seletivamente as informações de identificador de fluxo na comparação se as informações de identificador de fluxo são incluídas na estrutura de configuração (222c; 1010, 1030) .
3. Decodificador de áudio, de acordo com a reivindicação 1 ou 2, em que o decodificador de áudio é caracterizado por ser configurado para verificar se a estrutura de configuração (222c; 1010, 1030) compreende uma estrutura de extensão de configuração (226; 1030), e para verificar se a estrutura de extensão de configuração compreende as informações de identificador de fluxo (230;
streamID, 1050a, streamldentifierj, e em que o decodificador áudio
Petição 870190068437, de 19/07/2019, pág. 118/152 configurado para considerar seletivamente as informações de identificador de fluxo na comparação se as informações de identificador de fluxo são incluídas na estrutura de extensão de configuração.
4. Decodificador de áudio, de acordo com a reivindicação 3, em que o decodificador de áudio é caracterizado por ser configurado para aceitar uma ordem variável de itens de informação de configuração (1046a, 1048a, 1050a) na estrutura de extensão de configuração (226; 1030; UsacConfigExtension() ) , e em que o decodificador de áudio é configurado para considerar itens de informação de configuração dispostos na estrutura de extensão de configuração antes das informações de identificador de fluxo (230; streamID, 1050a, streamidentifier) ao comparar as informações de configuração na estrutura de configuração associadas com. um ou mais quadros a serem decodificados com.
as informações de configuração atuais (140; 240), e em. que o decodificador áudio configurado para deixar itens de informação de configuração dispostos na estrutura de extensão de configuração depois das informações de identificador de fluxo não consideradas ao comparar as informações de configuração na estrutura de configuração associadas com um ou mais quadros a serem decodificados com as informações de configuração atuais
5. Decodificador de áudio, de acordo com a reivindicação 4, em que o decodificador de áudio é
Petição 870190068437, de 19/07/2019, pág. 119/152 caracterizado por ser configurado para identificar um ou mais itens de informação de configuração (1046a, 1048a, 1050a) na estrutura de extensão de configuração com base em um ou mais identificadores de tipo de extensão de configuração (1042) precedendo os respectivos itens de informação de configuração.
6. Decodificador de áudio, de acordo com qualquer uma das reivindicações 3 a 5, caracterizado pela
(UsacConfigExtensionPresent) da estrutura de configuração (222c; 1010, 1030) que é avaliada pelo decodificador de áudio, e em. que as informações de identificador de fluxo (230; streamID, 1050a, streamidentifier) são um item.
de subdados da estrutura de extensão de configuração, em. que uma presença das informações de identificador de fluxo é indicada por um identificador de tipo de extensão de configuração (1042) associado com as informações de identificador de fluxo que é avaliada pelo decodificador de áudio.
7. Decodificador de áudio, de acordo com qualquer uma das reivindicações 1 a 6, em que o decodificador de áudio é caracterizado por ser configurado para obter e processar uma representação de quadro de áudio que compreende uma
Petição 870190068437, de 19/07/2019, pág. 120/152 informação de acesso aleatório (222b), em que as informações de acesso aleatório compreendem uma estrutura de configuração (222c; 1010, 1030)) e informação (222d; AccessUnit()) para trazer um estado de uma cadeia de processamento do decodificador de áudio para um estado desejado, em que o decodificador de áudio é configurado para atravessar de forma cruzada entre uma informação de áudio (272) representado por um quadro de áudio (220) processado antes de chegar à representação de quadro de áudio que compreende as informações de acesso aleatório e uma informação de áudio (276) derivada com base na representação de quadro de áudio (222) que compreende as informações de acesso aleatório depois de uma inicialização do decodificador de áudio usando a estrutura de configuração (222c) das informações de acesso aleatório e depois de ajustar um. estado do decodificador de áudio usando as informações (222d) para trazer um estado da cadeia de processamento para um. estado desejado se o decodificador de áudio descobrir que as informações de configuração na. estrutura de configuração (222c) das informações de acesso aleatório, ou uma porção relevante das informações de configuração na estrutura de configuração das informações de acesso aleatório, é diferente a partir das informações de configuração atuais (240).
8. Decodificador de áudio, de acordo com a reivindicação 7, em que o decodificador de áudio é
Petição 870190068437, de 19/07/2019, pág. 121/152 caracterizado por ser configurado para continuar decodificando sem realizar uma inicialização do decodificador de áudio e sem usar as informações (222d) para trazer um estado da cadeia de processamento do decodificador de áudio para um estado desejado se o decodificador de áudio decodificou um quadro de áudio diretamente precedendo um quadro de áudio representado pela representação de quadro de áudio que compreende as informações de acesso aleatório e se o decodificador de áudio descobrir que a porção relevante das informações de configuração (222c) na estrutura de configuração das informações de acesso aleatório é igual às informações de configuração atuais (240) .
9. Decodificador de áudio, de acordo com a reivindicação 7 ou 8, em que o decodificador de áudio é caracterizado por ser configurado para realizar uma inicialização do decodificador de áudio usando a estrutura de configuração (222c) das informações de acesso aleatório e ajustar um estado do decodificador de áudio usando as informações (222d) para trazer um estado da cadeia de processamento para um estado desejado se o decodificador de áudio não decodificou um quadro de áudio diretamente precedendo um quadro de áudio representado por uma representação de quadro de áudio que compreende as informações de acesso aleatório.
10. Codificador de áudio (300) para fornecer uma representação de sinal de áudio codificado (110; 210; 312; 412; 550; 600; 700; 800),
Petição 870190068437, de 19/07/2019, pág. 122/152 em que o codificador de áudio é caracterizado por ser configurado para codificar quadros sobrepostos ou não sobrepostos de ura sinal de áudio (310) usando parâmetros de codificação, para obter a representação de sinal de áudio codificado, em que o codificador de áudio é configurado para fornecer uma estrutura de configuração (110a; 222c; 332; 424; 1010, 1030) que descreve os parâmetros de codificação ou parâmetros de decodificação a serem usados por um decodificador de áudio, em que a estrutura de configuração compreende um identificador de fluxo (230; streamID, 1050a, str e am.I dent i f i er) .
11. Codificador de áudio, de acordo com a reivindicação 10, em que o codificador de áudio é caracterizado por ser configurado para incluir o identificador de fluxo (230; streamID, 1050a, streamidentifier) em uma estrutura de extensão de conf i gu r a ç a o (226;
1030; UsacConfigExtension()) da estrutura de configuração (222c; 1010), em que a estrutura de extensão de configuração que compreende o identificador de fluxo pode desabilitado pele codificador de áudio.
12. Codificador de áudio, de acordo com a reivindicação 11, em que o codificador de áudio é caracterizado por ser configurado para incluir na estrutura de extensão configuração (226;
1030;
UsacConfigExtension()) um identificador de tipo de extensão
Petição 870190068437, de 19/07/2019, pág. 123/152 de configuração (1042) que designa o identificador de fluxo para sinalizar a presença do identificador de fluxo (230; streamID, 1050a, streamidentifier) na estrutura de extensão de configuração.
13. Codificador de áudio, de acordo com qualquer uma das reivindicações 10 a 12, em que o codificador de áudio é caracterizado por ser configurado para fornecer pelo menos uma estrutura de configuração (222c
1010,
1030) que compreende o identificador de fluxo e pelo menos uma estrutura de configuração que não compreende o identificador de flux
14. Codificador de áudi de acordo com qualquer uma das reivindicações 10 a 13, em. que o codificador de áudio é caracterizado por ser configurado para comutar entre uma provisão de uma primeira informação de áudio codificada (552; 710, 720; 810) que é representada por uma primeira sequência de quadros de áudio, e uma segunda informação de áudio codificada (554; 730, 740, 750;
82 0) que é representada por uma. segunda sequência de qu a d r o s de á u d i o, em. que uma interpretação apropriada de um.
primeiro quadro de áudio (7.30; 820a) da segunda sequência de quadros de áudio depois de uma interpretação de um último quadro (720; 810e) da primeira sequência de quadros de áudio requer uma reinicialização de um decodificador de em que o codificador de áudio é configurado para incluir em uma representação de quadro de áudio que
Petição 870190068437, de 19/07/2019, pág. 124/152 representa o primeiro quadro da segunda sequência de quadros de áudio uma estrutura de configuração (222c; 1010,
1030) que compreende um identificador de fluxo (230;
streamID, 1050a, streamidentifier) associado com a segunda sequência de quadros de áudio, em que o identificador de fluxo associado com a segunda sequência de quadros de áudio é diferente de um identificador de fluxo associado com a primeira sequência de quadros de áudio.
Codificador de áudio, de acordo com qualquer uma das reivindicações 10 a 14, em one o codificador de áudio é caracterizado por não fornecer
QucLÍQuvL Oucicl informação de sinalizaçao que indica a comutação a partir da primeira sequência de informações de quadros de áudio (552; '710, 720 ; 810) para a segunda sequência de quadros de áudio (554; 730, 740, 750; 820) exceto para o identificador de fluxo.
qu a 1 qu e r
16. Codificador de áudio uma das reivindicações 14 ou de acordo com.
15, em. que o codificador de áudio é caracterizado por ser configurado para fornecer a primeira sequência de quadros de áudio (552; 710, 720; 810) e a segunda sequência de quadros de áudio (554; 730, /40, 750; 820) usando diferentes taxas de em que o codificador de áudio é configurado para sinalizar a um decodificador de áudio informações de configuração de decodificador idênticas (222c; 1010, 1030) para a decodificação da primeira sequência de quadros de
Petição 870190068437, de 19/07/2019, pág. 125/152 áudio e para a decodificaçao da segunda sequência de quadros de áudio, exceto para diferentes identificadores de fluxo de bits (230; streamin', 1050a, streamidentifier).
17. Método para fornecer uma representação sinal decodificado com base em uma representação de sinal de áudio codificado.
em cfue o método é caracterizad compreender ajustar parâmetros de decodificação dependência de uma informação de configuração (110a; 222c;
332; 424; 1010, 1030), em que o método compreende decodificar um ou mais quadros de áudio usando uma informação de configuração atual (140; 240), e em. que o método compreende comparar uma informação de configuração (110a; 222c; .332; 424; 1010,
1030) em. uma. estrutura, de configuração associada com um ou mais quadros (222) a. serem decodificados, com as informações de configuração atuais, e em que o método compreende efetuar uma. transição para realizar uma decodificação usando as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados como uma nova informação de configuração se as informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, ou uma porção relevante (1020a, 1020b, 1022a, 1024a, 1024b, 1026a, 1050a) das informações de configuração na estrutura de configuração associadas com o um ou mais quadros a serem decodificados, é diferente a
Petição 870190068437, de 19/07/2019, pág. 126/152 partir das informações de configuração atuais;
em que o método compreende considerar uma informação de identificador de fluxo (230; streamID, 1050a, streamidentifier) incluída na estrutura de configuração ao comparar as informações de configuração, tal que uma diferença entre um identificador de fluxo previamente adquirido na decodificação de áudio e um identificador de fluxo representado pelas informações de identificador de fluxo na estrutura de configuração associada com o um ou mais quadros a serem decodificados faz com que a transição s e j a t e 1t a .
18. Método para fornecer uma representação de sinal de áudio codificado (110; 210; 312; 412; 550; 600;
em cfue o método é caracterizad compreender codificar quadros sobrepostos ou não sobrepostos de um sinal de áudio (310) usando parâmetros de codificação, para obter a representação de sinal de áudio codificado, em. que o método compreende fornecer uma estrutura de configuração (110a; 222c; 332; 424; 1010, 1030) que descreve os parâmetros de codificação ou parâmetros de decodificação a serem usados por um decodificador de áudio, em que a estrutura de configuração compreende um identificador de fluxo (230; streamID, 1050a, streamidentifier).
19. Fluxo de áudio (110; 210; 312; 412;
Petição 870190068437, de 19/07/2019, pág. 127/152
550; 600; 700
800), caracterizado por compreender:
uma representação codificada (222a) de quadros sobrepostos ou não sobrepostos de um sinal de áudio; e uma estrutura de configuração (222c) que descreve parâmetros de codificação ou parâmetros de decodificação a serem usados por um decodificador de áudio, em que a estrutura de configuração compreende uma informação de identificador de fluxo (230; streamID, 1050a, streamidentifier) que representa um identificador de fluxo.
20. Fluxo de áudio, de acordo com a reivindicação 19, caracterizado identificador de fluxo pelas informações de (230; streamID, str e am I de n t i f i e r) serem incluídas em uma estrutura de extensão de configuração (226; 1030;
UsacConfigExtension()), e em. que a estrutura. de extensão de configuração é uma estrutura, de subdados de uma estrutura de configuração (222c; 1010), em que uma. presença da estrutura de extensão de configuração é indicada por um bit (UsacConfigExtensionPresent) da estrutura de configuraçãc em que as informações de identificador de fluxo (230; streamID, 1050a, streamidentifier) são um item de subdados da estrutura de extensão de configuração, em que uma presença das informações de
Petição 870190068437, de 19/07/2019, pág. 128/152
13/19 identificador de fluxo é indicada por um identificador de tipo de extensão de configuração (1042) associado com as informações de identificador de fluxo.
21. Fluxo de áudio, de acordo com a reivindicação 19 ou 20, caracterizado pelo identificador de fluxo ser incorporado em uma estrutura de subdados (222c,
226; 1010,
1030) de uma representação (222) de um quadro de
22. Fluxo de áudio, de acordo com qualquer uma das reivindicações 19 a 21, caracterizado pelo identificador de fluxo ser apenas incorporado em uma estrutura de subdados de uma representação de um quadro de áudio que compreende uma estrutura de configuração.
23. Provedor de fluxo de áudio (400) para fornecer uma representação de sinal de áudio codificado
configurado para fornecer uma estrutura de configuração (220; 1010, 1030) que descreve os parâmetros de codificação ou parâmetros de decodificação a serem usados por um decodificador de áudio como uma parte da representação de
Petição 870190068437, de 19/07/2019, pág. 129/152 inal de áudio ira con trearnId de fluxo áudio flux o d e á u d i o em de fluxo uma.
jonrigur que repres de identifi ie fluxo pode
Pr por ser inal um de cc audio riu t ui de áudio, de i fluxo de áudio par utura de de iqu r a ç a o c omp r e e n um.
tipo de (1042) treamID streamidentifi
') (3.1? cL de conriguraçao com qualquer reivindi udio por
Petição 870190068437, de 19/07/2019, pág. 130/152 configurado para fornecer a representação de sinal de áudio
identificador de fluxo e pelo menos uma estrutura de configuração que não compreende o identificador de fluxo.
27. Provedor de fluxo de áudio, de acordo
porção (554; 730, 740, 750; 820) das informações de áudio codificada, que é representada por uma segunda sequência de qu a d r o s de á u d i o, em. que uma interpretação apropriada de um. primeiro quadro de áudio (730; 820a) da segunda sequência de quadros de áudio depois de uma. interpretação de um. último quadro (720; 810e) da primeira sequência de quadros de áudio requer uma reinicialização de um decodificador de áudio;
em que o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado tal que uma representação de quadro de áudio que representa o primeiro quadro da segunda sequência de quadros de áudio inclui uma estrutura de configuração (222c; 1010) que compreende um identificador de fluxo (230;
Petição 870190068437, de 19/07/2019, pág. 131/152 streamID, 1050a, streamidentifier) associada com a segunda sequência de quadros de áudio, em que o identificador de fluxo associado com a segunda sequência de quadros de áudio é diferente de um identificador de fluxo associado com a primeira sequência de quadros de áudio.
28. Provedor de fluxo de áudio, de acordo com qualquer uma das reivindicações 23 a 27, em que o provedor de fluxo de áudio é caracterizado por ser configurado para fornecer a representação de sinal de áudio codificado tal que a representação de sinal de áudio codificado não fornecer qualquer outro informação de sinalização que indica a comutação a partir da primeira sequência de quadros de áudio para a segunda sequência de
provedor de fluxo de áudio é caracterizado por ser configurado para fornecer a representação de sinal de áudio codificado tal que a primeira sequência de quadros de áudio (552; 710, 720; 810) e a segunda sequência de quadros de áudio (554; 730, 740, 750; 820) são codificadas usando diferentes taxas de bits, e
Petição 870190068437, de 19/07/2019, pág. 132/152
17/19 decodificação da primeira sequência de quadros de áudio e para a decodificação da segunda sequência de quadros de áudio, exceto para diferentes identificadores de fluxo de bits .
30. Provedor de fluxo de áudio, de acordo com qualquer uma das reivindicações 23 a 29, em que o
820) a um decodificador de áudio, em que a primeira sequência de quadros de áudio e a segunda sequência de quadros de áudio são codificadas usando diferentes taxas de bits, em que o provedor de fluxo de áudio é configurado para comutar seletivamente entre a provisão da primeira sequência de quadros de áudio e a provisão da segunda sequência de quadros de áudio em um. quadro de áudio para o qual a representação de quadro de áudio compreende uma informação de acesso aleatório (222b; AudioPreRoll()) enquanto evita comutar entre sequências em. quadros de áudio que não compreendem uma informação de acesso aleatório, em que o provedor de fluxo de áudio é configurado para fornecer a representação de sinal de áudio codificado tal que um identificador de fluxo é incluído em uma estrutura de configuração (222c; 1010, 1030) de um quadro de áudio que é fornecido ao comutar a partir da primeira sequência de quadros de áudio para a segunda
Petição 870190068437, de 19/07/2019, pág. 133/152 sequência de quadros de áudio.
31. Provedor de fluxo de áudio, de acordo com a reivindicação 30, em que o provedor de fluxo de áudio é caracterizado por ser configurado para obter uma pluralidade de sequências paralelas (520, 530) de quadros de áudio codificados usando diferentes taxas de bits, e em que o provedor de fluxo de áudio é configurado para comutar entre uma provisão de quadros a partir das diferentes sequências a um decodificador de áudio, em que o provedor de fluxo de áudio é configurado para sinalizar para o decodif icador de áudio ao qual as sequências um ou mais quadros são associada usando o identificador de fluxo que é incluído na estrutura de configuração de uma primeira representação de quadro de áudio fornecido depois de uma
32. Método para fornecer uma representação de sinal de áudio codificado, em. que o método é caracterizado por compreender fornecer versões codificadas de quadros sobrepostos ou não sobrepostos de um. sinal, de áudio, codificado usando parâmetros de codificação, como uma parte da representação de sinal de áudio codificado, em que o método compreende fornecer uma estrutura de configuração que descreve os parâmetros de codificação ou parâmetros de decodificação a serem usados por um decodif icador de áudio como uma parte da representação de sinal de áudio codificado, em que a estrutura de configuração
Petição 870190068437, de 19/07/2019, pág. 134/152 comoreende um identificador de fluxo.
33. Programa de computador caracterizado por realizar o método, de acordo com reivindicação 17 ou 18 ou 32, quando o programa de computador é executado em um
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP17150915 | 2017-01-10 | ||
EP17150915.1 | 2017-01-10 | ||
EP17151083.7 | 2017-01-11 | ||
EP17151083 | 2017-01-11 | ||
PCT/EP2018/050575 WO2018130577A1 (en) | 2017-01-10 | 2018-01-10 | Audio decoder, audio encoder, method for providing a decoded audio signal, method for providing an encoded audio signal, audio stream, audio stream provider and computer program using a stream identifier |
Publications (1)
Publication Number | Publication Date |
---|---|
BR112019014283A2 true BR112019014283A2 (pt) | 2020-02-11 |
Family
ID=60943036
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BR112019014283-5A BR112019014283A2 (pt) | 2017-01-10 | 2018-01-10 | Decodificador de áudio, codificador de áudio, método para fornecer um sinal de áudio decodificado, método para fornecer um sinal de áudio codificado, fluxo de áudio, provedor de fluxo de áudio e programa de computador que usa um identificador de fluxo. |
Country Status (15)
Country | Link |
---|---|
US (3) | US11217260B2 (pt) |
EP (3) | EP3822969B1 (pt) |
JP (3) | JP6955029B2 (pt) |
KR (3) | KR20230129569A (pt) |
CN (10) | CN116631417A (pt) |
AU (6) | AU2018208522B2 (pt) |
BR (1) | BR112019014283A2 (pt) |
CA (2) | CA3049729C (pt) |
ES (2) | ES2853936T3 (pt) |
MX (6) | MX2019008250A (pt) |
PL (2) | PL3568853T3 (pt) |
SG (2) | SG11201906367PA (pt) |
TW (1) | TWI673708B (pt) |
WO (1) | WO2018130577A1 (pt) |
ZA (1) | ZA201905161B (pt) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MX2021001970A (es) * | 2018-08-21 | 2021-05-31 | Dolby Int Ab | Métodos, aparatos y sistemas para generación, transporte y procesamiento de tramas de ejecución inmediata (ipfs). |
CN115668365A (zh) * | 2020-05-20 | 2023-01-31 | 杜比国际公司 | 用于统一语音和音频解码改进的方法和装置 |
CN113473170B (zh) * | 2021-07-16 | 2023-08-25 | 广州繁星互娱信息科技有限公司 | 直播音频处理方法、装置、计算机设备及介质 |
WO2023021137A1 (en) * | 2021-08-19 | 2023-02-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for providing an encoded representation of an audio information, computer program and encoded audio representation using immediate playout frames |
US20230117444A1 (en) * | 2021-10-19 | 2023-04-20 | Microsoft Technology Licensing, Llc | Ultra-low latency streaming of real-time media |
Family Cites Families (42)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3765622B2 (ja) * | 1996-07-09 | 2006-04-12 | ユナイテッド・モジュール・コーポレーション | オーディオ符号化復号化システム |
US6904089B1 (en) * | 1998-12-28 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Encoding device and decoding device |
EP1427252A1 (en) * | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
KR100546758B1 (ko) * | 2003-06-30 | 2006-01-26 | 한국전자통신연구원 | 음성의 상호부호화시 전송률 결정 장치 및 방법 |
GB0326263D0 (en) * | 2003-11-11 | 2003-12-17 | Nokia Corp | Speech codecs |
WO2006025819A1 (en) * | 2004-08-25 | 2006-03-09 | Thomson Licensing | Reducing channel changing time for digital video inputs |
JP4575129B2 (ja) * | 2004-12-02 | 2010-11-04 | ソニー株式会社 | データ処理装置およびデータ処理方法、並びにプログラムおよびプログラム記録媒体 |
KR101215615B1 (ko) * | 2006-01-10 | 2012-12-26 | 삼성전자주식회사 | 동일 채널 내에서 서로 다른 코덱을 이용하여 부호화된 비디오 및 오디오 데이터 스트림의 재생을 위한 코덱 변경 방법 및 장치 |
US7697537B2 (en) * | 2006-03-21 | 2010-04-13 | Broadcom Corporation | System and method for using generic comparators with firmware interface to assist video/audio decoders in achieving frame sync |
EP2054876B1 (en) * | 2006-08-15 | 2011-10-26 | Broadcom Corporation | Packet loss concealment for sub-band predictive coding based on extrapolation of full-band audio waveform |
WO2009063467A2 (en) * | 2007-11-14 | 2009-05-22 | Ubstream Ltd. | System and method for adaptive rate shifting of video/audio streaming |
US8223682B2 (en) * | 2008-07-08 | 2012-07-17 | Lg Electronics Inc. | Transmitting/receiving system and method of processing data in the transmitting/receiving system |
US8117039B2 (en) * | 2008-12-15 | 2012-02-14 | Ericsson Television, Inc. | Multi-staging recursive audio frame-based resampling and time mapping |
KR101616054B1 (ko) * | 2009-04-17 | 2016-04-28 | 삼성전자주식회사 | 음성 검출 장치 및 방법 |
US8948241B2 (en) | 2009-08-07 | 2015-02-03 | Qualcomm Incorporated | Signaling characteristics of an MVC operation point |
AR077680A1 (es) * | 2009-08-07 | 2011-09-14 | Dolby Int Ab | Autenticacion de flujos de datos |
PL2491553T3 (pl) * | 2009-10-20 | 2017-05-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Koder audio, dekoder audio, sposób kodowania informacji audio, sposób dekodowania informacji audio i program komputerowy wykorzystujący iteracyjne zmniejszania rozmiaru przedziału |
SI2510515T1 (sl) * | 2009-12-07 | 2014-06-30 | Dolby Laboratories Licensing Corporation | Dekodiranje večkanalnih avdio kodiranih bitnih prenosov s pomočjo adaptivne hibridne transformacije |
TWI443646B (zh) * | 2010-02-18 | 2014-07-01 | Dolby Lab Licensing Corp | 音訊解碼器及使用有效降混之解碼方法 |
US8428936B2 (en) * | 2010-03-05 | 2013-04-23 | Motorola Mobility Llc | Decoder for audio signal including generic audio and speech frames |
EP2610865B1 (en) * | 2010-08-23 | 2014-07-23 | Panasonic Corporation | Audio signal processing device and audio signal processing method |
US8711736B2 (en) * | 2010-09-16 | 2014-04-29 | Apple Inc. | Audio processing in a multi-participant conference |
US8613038B2 (en) * | 2010-10-22 | 2013-12-17 | Stmicroelectronics International N.V. | Methods and apparatus for decoding multiple independent audio streams using a single audio decoder |
PL2676264T3 (pl) * | 2011-02-14 | 2015-06-30 | Fraunhofer Ges Forschung | Koder audio estymujący szum tła podczas faz aktywnych |
KR101742136B1 (ko) | 2011-03-18 | 2017-05-31 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 콘텐츠를 표현하는 비트스트림의 프레임들 내의 프레임 요소 배치 |
US8982942B2 (en) * | 2011-06-17 | 2015-03-17 | Microsoft Technology Licensing, Llc | Adaptive codec selection |
EP2727369B1 (en) * | 2011-07-01 | 2016-10-05 | Dolby Laboratories Licensing Corporation | Synchronization and switchover methods and systems for an adaptive audio system |
WO2013058626A2 (ko) * | 2011-10-20 | 2013-04-25 | 엘지전자 주식회사 | 지터 버퍼 관리 방법 및 이를 이용하는 지터 버퍼 |
US9183842B2 (en) * | 2011-11-08 | 2015-11-10 | Vixs Systems Inc. | Transcoder with dynamic audio channel changing |
JP6126006B2 (ja) * | 2012-05-11 | 2017-05-10 | パナソニック株式会社 | 音信号ハイブリッドエンコーダ、音信号ハイブリッドデコーダ、音信号符号化方法、及び音信号復号方法 |
WO2013175736A1 (ja) * | 2012-05-25 | 2013-11-28 | パナソニック株式会社 | 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置、および、動画像符号化復号装置 |
US10171540B2 (en) * | 2012-09-07 | 2019-01-01 | High Sec Labs Ltd | Method and apparatus for streaming video security |
EP2720222A1 (en) * | 2012-10-10 | 2014-04-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for efficient synthesis of sinusoids and sweeps by employing spectral patterns |
TR201802631T4 (tr) | 2013-01-21 | 2018-03-21 | Dolby Laboratories Licensing Corp | Program Ses Şiddeti ve Sınır Meta Verilere Sahip Sesli Enkoder ve Dekoder |
TWM487509U (zh) | 2013-06-19 | 2014-10-01 | 杜比實驗室特許公司 | 音訊處理設備及電子裝置 |
US10021419B2 (en) * | 2013-07-12 | 2018-07-10 | Qualcomm Incorported | Rice parameter initialization for coefficient level coding in video coding process |
EP2863386A1 (en) * | 2013-10-18 | 2015-04-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder |
GB2526128A (en) * | 2014-05-15 | 2015-11-18 | Nokia Technologies Oy | Audio codec mode selector |
WO2015180866A1 (en) | 2014-05-28 | 2015-12-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Data processor and transport of user control data to audio decoders and renderers |
WO2015194187A1 (en) * | 2014-06-20 | 2015-12-23 | Sharp Kabushiki Kaisha | Harmonized palette coding |
US10049684B2 (en) * | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
US10008214B2 (en) * | 2015-09-11 | 2018-06-26 | Electronics And Telecommunications Research Institute | USAC audio signal encoding/decoding apparatus and method for digital radio services |
-
2018
- 2018-01-10 ES ES18700161T patent/ES2853936T3/es active Active
- 2018-01-10 KR KR1020237028751A patent/KR20230129569A/ko not_active Application Discontinuation
- 2018-01-10 CN CN202310552014.3A patent/CN116631417A/zh active Pending
- 2018-01-10 CN CN202310551672.0A patent/CN116631414A/zh active Pending
- 2018-01-10 AU AU2018208522A patent/AU2018208522B2/en active Active
- 2018-01-10 SG SG11201906367PA patent/SG11201906367PA/en unknown
- 2018-01-10 EP EP20206797.1A patent/EP3822969B1/en active Active
- 2018-01-10 CN CN202310551668.4A patent/CN116631413A/zh active Pending
- 2018-01-10 SG SG10202100336WA patent/SG10202100336WA/en unknown
- 2018-01-10 CN CN202310863326.6A patent/CN117037807A/zh active Pending
- 2018-01-10 CN CN202310858584.5A patent/CN117037804A/zh active Pending
- 2018-01-10 WO PCT/EP2018/050575 patent/WO2018130577A1/en active Application Filing
- 2018-01-10 CN CN202310552620.5A patent/CN116631416A/zh active Pending
- 2018-01-10 EP EP18700161.5A patent/EP3568853B1/en active Active
- 2018-01-10 BR BR112019014283-5A patent/BR112019014283A2/pt active Search and Examination
- 2018-01-10 ES ES20206797T patent/ES2953832T3/es active Active
- 2018-01-10 PL PL18700161T patent/PL3568853T3/pl unknown
- 2018-01-10 EP EP23180164.8A patent/EP4235662A3/en active Pending
- 2018-01-10 CA CA3049729A patent/CA3049729C/en active Active
- 2018-01-10 JP JP2019557682A patent/JP6955029B2/ja active Active
- 2018-01-10 CN CN202310552328.3A patent/CN116631415A/zh active Pending
- 2018-01-10 CN CN202310861353.XA patent/CN117037805A/zh active Pending
- 2018-01-10 KR KR1020197023563A patent/KR102315774B1/ko active IP Right Grant
- 2018-01-10 TW TW107100917A patent/TWI673708B/zh active
- 2018-01-10 CN CN201880017357.7A patent/CN110476207B/zh active Active
- 2018-01-10 CA CA3206050A patent/CA3206050A1/en active Pending
- 2018-01-10 MX MX2019008250A patent/MX2019008250A/es unknown
- 2018-01-10 CN CN202310861784.6A patent/CN117037806A/zh active Pending
- 2018-01-10 PL PL20206797.1T patent/PL3822969T3/pl unknown
- 2018-01-10 KR KR1020217033386A patent/KR102572557B1/ko active IP Right Grant
-
2019
- 2019-07-09 MX MX2022015783A patent/MX2022015783A/es unknown
- 2019-07-09 MX MX2022015786A patent/MX2022015786A/es unknown
- 2019-07-09 MX MX2022015785A patent/MX2022015785A/es unknown
- 2019-07-09 US US16/506,863 patent/US11217260B2/en active Active
- 2019-07-09 MX MX2022015782A patent/MX2022015782A/es unknown
- 2019-07-09 MX MX2022015787A patent/MX2022015787A/es unknown
- 2019-08-05 ZA ZA2019/05161A patent/ZA201905161B/en unknown
-
2020
- 2020-10-03 AU AU2020244609A patent/AU2020244609B2/en active Active
-
2021
- 2021-09-30 JP JP2021161136A patent/JP7295190B2/ja active Active
- 2021-11-30 US US17/538,847 patent/US11837247B2/en active Active
-
2022
- 2022-03-02 AU AU2022201458A patent/AU2022201458B2/en active Active
-
2023
- 2023-06-08 JP JP2023094876A patent/JP2023126775A/ja active Pending
- 2023-10-23 US US18/492,623 patent/US20240062768A1/en active Pending
-
2024
- 2024-03-07 AU AU2024201519A patent/AU2024201519A1/en active Pending
- 2024-03-07 AU AU2024201516A patent/AU2024201516A1/en active Pending
- 2024-03-07 AU AU2024201507A patent/AU2024201507A1/en active Pending
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
BR112019014283A2 (pt) | Decodificador de áudio, codificador de áudio, método para fornecer um sinal de áudio decodificado, método para fornecer um sinal de áudio codificado, fluxo de áudio, provedor de fluxo de áudio e programa de computador que usa um identificador de fluxo. | |
WO2015055683A1 (en) | Audio decoder, apparatus for generating encoded audio output data and methods permitting initializing a decoder | |
RU2783228C2 (ru) | Декодер звукового сигнала, кодер звукового сигнала, способ выдачи декодированного звукового сигнала, способ выдачи кодированного звукового сигнала, звуковой поток, поставщик звукового потока и компьютерная программа, использующие идентификатор потока |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B350 | Update of information on the portal [chapter 15.35 patent gazette] | ||
B06W | Patent application suspended after preliminary examination (for patents with searches from other patent authorities) chapter 6.23 patent gazette] | ||
B15K | Others concerning applications: alteration of classification |
Free format text: AS CLASSIFICACOES ANTERIORES ERAM: G10L 19/16 , G10L 19/22 Ipc: G10L 19/16 (2013.01), G10L 19/22 (2013.01), G10L 1 |
|
B06A | Patent application procedure suspended [chapter 6.1 patent gazette] |