BR112015030102A2 - compressão de representações decompostas de campo sonoro - Google Patents

compressão de representações decompostas de campo sonoro Download PDF

Info

Publication number
BR112015030102A2
BR112015030102A2 BR112015030102-9A BR112015030102A BR112015030102A2 BR 112015030102 A2 BR112015030102 A2 BR 112015030102A2 BR 112015030102 A BR112015030102 A BR 112015030102A BR 112015030102 A2 BR112015030102 A2 BR 112015030102A2
Authority
BR
Brazil
Prior art keywords
vectors
coefficients
audio
matrix
spherical harmonic
Prior art date
Application number
BR112015030102-9A
Other languages
English (en)
Other versions
BR112015030102B1 (pt
Inventor
Nils Günther Peters
Dipanjan Sen
Original Assignee
Qualcomm Incorporated
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Qualcomm Incorporated filed Critical Qualcomm Incorporated
Publication of BR112015030102A2 publication Critical patent/BR112015030102A2/pt
Publication of BR112015030102B1 publication Critical patent/BR112015030102B1/pt

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S5/00Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation 
    • H04S5/005Pseudo-stereo systems, e.g. in which additional channel signals are derived from monophonic signals by means of phase shifting, time delay or reverberation  of the pseudo five- or more-channel type, e.g. virtual surround
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • G10L19/038Vector quantisation, e.g. TwinVQ audio
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R5/00Stereophonic arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/30Control circuits for electronic adaptation of the sound field
    • H04S7/302Electronic adaptation of stereophonic sound system to listener position or orientation
    • H04S7/303Tracking of listener position or orientation
    • H04S7/304For headphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S7/00Indicating arrangements; Control arrangements, e.g. balance control
    • H04S7/40Visual indication of stereophonic sound image
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L2019/0001Codebooks
    • G10L2019/0004Design or structure of the codebook
    • G10L2019/0005Multi-stage vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2205/00Details of stereophonic arrangements covered by H04R5/00 but not provided for in any of its subgroups
    • H04R2205/021Aspects relating to docking-station type assemblies to obtain an acoustical effect, e.g. the type of connection to external loudspeakers or housings, frequency improvement
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/01Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2400/00Details of stereophonic systems covered by H04S but not provided for in its groups
    • H04S2400/15Aspects of sound capture and related signal processing for recording or reproduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/01Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/03Application of parametric coding in stereophonic audio systems
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S2420/00Techniques used stereophonic systems covered by H04S but not provided for in its groups
    • H04S2420/11Application of ambisonics in stereophonic audio systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Software Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Computing Systems (AREA)
  • Stereophonic System (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Complex Calculations (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)

Abstract

1/1 resumo "compressão de representações decompostas de campo sonoro” trata-se, em geral, de técnicas para obter versões decompostas de coeficientes harmônicos esféricos. em conformidade com essas técnicas, um dispositivo que compreende um ou mais processadores pode ser configurado para determinar um primeiro conjunto diferente de zero de coeficientes de um vetor que representa um componente distinto de um campo sonoro, sendo que o vetor foi decomposto a partir de pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro.

Description

“COMPRESSÃO DE REPRESENTAÇÕES DECOMPOSTAS DE CAMPO SONORO”
[0001] Este pedido reivindica o benefício do Pedido Provisório nº U.S. 61/828.445 depositado em 29 de maio de 2013, Pedido Provisório nº U.S. 61/829.791 depositado em 31 de maio de 2013, Pedido Provisório nº U.S. 61/899.034 depositado em 01 de novembro de 2013, Pedido Provisório nº U.S. 61/899.041 depositado em 01 de novembro de 2013, Pedido Provisório nº U.S. 61/829.182 depositado em de maio de 2013, Pedido Provisório nº U.S. 61/829.174 depositado em 30 de maio de 2013, Pedido Provisório nº U.S. 61/829.155 depositado em 30 de maio de 2013, Pedido Provisório nº U.S. 61/933.706 depositado em 30 de janeiro de 2014, Pedido Provisório nº U.S. 61/829.846 depositado em 31 de maio de 2013, Pedido Provisório nº U.S. 61/886.605 depositado em 03 de outubro de 2013, Pedido Provisório nº U.S. 61/886.617 depositado em 03 de outubro de 2013, Pedido Provisório nº U.S. 61/925.158 depositado em 08 de janeiro de 2014, Pedido Provisório nº U.S. 61/933.721 depositado em 30 de janeiro de 2014, Pedido Provisório nº U.S. 61/925.074 depositado em 08 de janeiro de 2014, Pedido Provisório nº U.S. 61/925.112 depositado em 08 de janeiro de 2014, Pedido Provisório nº U.S. 61/925.126 depositado em 08 de janeiro de 2014, Pedido Provisório nº U.S. 62/003.515 depositado em 27 de maio de 2014 e Pedido Provisório nº U.S. 61/828.615 depositado em 29 de maio de 2013, cujo conteúdo completo de cada um é incorporado no presente documento a título de referência.
CAMPO DA TÉCNICA
[0002] Esta revelação refere-se a dados de áudio e, mais especificamente, a compressão de dados de áudio.
ANTECEDENTES
[0003] Um sinal de ambisonics de ordem superior (HOA) (frequentemente representado por uma pluralidade de coeficientes harmônicos esféricos (SHC) ou outros elementos hierárquicos) é uma representação tridimensional de um campo sonoro. Essa representação de HOA ou SHC pode representar esse campo sonoro de uma maneira que é independente da geometria de alto-falante usada para reproduzir um sinal de áudio de multicanal renderizados a partir desse sinal de SHC. Esse sinal de SHC também pode facilitar a compatibilidade com versões anteriores à medida que esse sinal de SHC pode ser renderizado para formatos de multicanal bem conhecidos e altamente adotados, como um formato de canal de áudio 5.1 ou um formato de canal de áudio 7.1. A representação de SHC pode habilitar, portanto, uma representação melhor de um campo sonoro que também acomoda a compatibilidade com versões anteriores.
SUMÁRIO
[0004] Em geral, as técnicas são descritas para a compressão e descompressão de dados de áudio ambisonic de ordem superior.
[0005] Em um aspecto, um método compreende obter um ou mais primeiros vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que descrevem os componentes de segundo plano do campo sonoro, tanto os um ou mais primeiros vetores quanto os um ou mais segundos vetores gerados pelo menos desempenhando-se uma transformação em relação à pluralidade de coeficientes harmônicos esféricos.
[0006] Em outro aspecto, um dispositivo compreende um ou mais processadores para determinar um ou mais primeiros vetores que descrevem vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que descrevem componentes de segundo plano do campo sono, sendo que tanto os um ou mais primeiros vetores quanto os um ou mais segundos vetores gerados pelo menos realizando-se uma transformação em relação à pluralidade de coeficientes harmônicos esféricos.
[0007] Em outro aspecto, um dispositivo compreende meios para obter um ou mais primeiros vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que descrevem componentes de segundo plano do campo sonoro, sendo que tanto os um ou mais primeiros vetores quanto os um ou mais segundos vetores gerados pelo menos realizando-se uma transformação em relação à pluralidade de coeficientes harmônicos esféricos,e meios para armazenar os um ou mais primeiros vetores.
[0008] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que os um ou mais processadores obtenham um ou mais primeiros vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que descrevem os componentes de segundo plano do campo sonoro, tanto os um ou mais primeiros vetores quanto os um ou mais segundos vetores gerados pelo menos desempenhando-se uma transformação em relação à pluralidade de coeficientes harmônicos esféricos.
[0009] Em outro aspecto, um meio de armazenamento legíveis por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que os um ou mais processadores obtenham um ou mais primeiros vetores que descrevem componentes distintos aquele esquema selecionado da pluralidade de esquemas de descompressão.
[0010] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para selecionar um dentre uma pluralidade de esquemas de descompressão baseada na indicação de se uma versão comprimida de coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético, e descomprimir a versão comprimida dos coeficientes harmônicos esféricos com o uso aquele esquema selecionado da pluralidade de esquemas de descompressão.
[0011] Em outro aspecto, um dispositivo compreende meios para selecionar um dentre uma pluralidade de esquemas de descompressão baseada na indicação de se uma versão comprimida de coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético, e meios para descomprimir a versão comprimida dos coeficientes harmônicos esféricos com o uso aquele esquema selecionado da pluralidade de esquemas de descompressão.
[0012] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado nele instruções que, quando executadas, fazem com que um ou mais processadores de um dispositivo de decodificação integrado para selecionar um dentre uma pluralidade de esquemas de descompressão baseada na indicação de se uma versão comprimida de coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético, e descomprimir a versão comprimida dos coeficientes harmônicos esféricos com o uso aquele esquema selecionado da pluralidade de esquemas de descompressão.
[0013] Em outro aspecto, um método compreende obter uma indicação de se os coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético.
[0014] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para obter uma indicação de se os coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético.
[0015] Em outro aspecto, um dispositivo compreende meios para armazenar coeficientes harmônicos esféricos representativos de um campo sonoro, e meios para obter uma indicação de se os coeficientes harmônicos esféricos são gerados a partir de um objeto de áudio sintético.
[0016] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores obtenham uma indicação de se os coeficientes harmônicos esféricos representativos de um campo sonoro são gerados a partir de um objeto de áudio sintético.
[0017] Em outro aspecto, um método compreende quantizar um ou mais primeiros vetores representativos de um ou mais componentes de um campo sonoro, e compensar o erro introduzido devido à quantização dos um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos dos mesmos um ou mais componentes do campo sonoro.
[0018] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para quantizar um ou mais primeiros vetores representativos de um ou mais componentes de um campo sonoro, e compensar erro introduzido devido à quantização dos um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos dos mesmos um ou mais componentes do campo sonoro.
[0019] Em outro aspecto, um dispositivo compreende meios para quantizar um ou mais primeiros vetores representativos de um ou mais componentes de um campo sonoro e meios para compensar o erro introduzido devido à quantização dos um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos dos mesmos um ou mais componentes do campo sonoro.
[0020] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores quantizem um ou mais primeiros vetores representativos de um ou mais componentes de um campo sonoro, e compensem erros introduzidos devido à quantização dos um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos dos mesmos um ou mais componentes do campo sonoro.
[0021] Em outro aspecto, um método compreende realizar, com base em uma taxa de bit alvo, a redução de ordem em relação a uma pluralidade de coeficientes harmônicos esféricos ou decomposições dos mesmos para gerar coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos, em que a pluralidade de coeficientes harmônicos esféricos representa um campo sonoro.
[0022] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para realizar, com base em uma taxa de bit alvo, a redução de ordem em relação a uma pluralidade de coeficientes harmônicos esféricos ou decomposições dos mesmos para gerar coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos, em que a pluralidade de coeficientes harmônicos esféricos representa um campo sonoro.
[0023] Em outro aspecto, um dispositivo compreende — meios para armazenar uma pluralidade de coeficientes harmônicos esféricos ou decomposições dos mesmos, e meios para realizar, com base em uma taxa de bit alvo, a redução de ordem em relação à pluralidade de coeficientes harmônicos esféricos ou as decomposições dos mesmos para gerar coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos, em que a pluralidade de coeficientes harmônicos esféricos representa um campo sonoro.
[0024] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores para realizar, com base em uma taxa de bit alvo, a redução de ordem em relação a uma pluralidade de coeficientes harmônicos esféricos ou decomposições dos mesmos para gerar coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos, em que a pluralidade de coeficientes harmônicos esféricos representa um campo sonoro.
[0025] Em outro aspecto, um método compreende obter um primeiro conjunto diferente de zero de coeficientes de um vetor que representa um componente distinto do campo sonoro, sendo que o vetor foi decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos que descrevem um campo sonoro.
[0026] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para obter um primeiro conjunto diferente de zero de coeficientes de um vetor que representa um componente distinto de um campo sonoro, sendo que o vetor foi decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos “que descrevem o campo sonoro.
[0027] Em outro aspecto, um dispositivo compreende meios para obter um primeiro conjunto diferente de zero de coeficientes de um vetor que representa um componente distinto de um campo sonoro, sendo que o vetor foi decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro e meios para armazenar o primeiro conjunto diferente de zero de coeficientes.
[0028] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores para determinar um primeiro conjunto diferente de zero de coeficientes de um vetor que representa um componente distinto de um campo sonoro, sendo que o vetor foi decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro.
[0029] Em outro aspecto, um método compreende obter, a partir de um fluxo de bits, pelo menos um dentre um ou mais vetores decompostos a partir dos coeficientes harmônicos esféricos que foram recombinados com coeficientes harmônicos esféricos de segundo plano, em que os coeficientes harmônicos esféricos descrevem um campo sonoro, e em que os coeficientes harmônicos esféricos de segundo plano descreveram um ou mais componentes de segundo plano do mesmo campo sonoro.
[0030] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para determinar, a partir de um fluxo de bits, pelo menos um dentre um ou mais vetores decompostos a partir dos coeficientes harmônicos esféricos que foram recombinados com coeficientes harmônicos esféricos de segundo plano, em que os coeficientes harmônicos esféricos descrevem um campo sonoro, e em que os coeficientes harmônicos esféricos de segundo plano descreveram um ou mais componentes de segundo plano do mesmo campo sonoro.
[0031] Em outro aspecto, um dispositivo compreende meios para obter, a partir de um fluxo de bits, pelo menos um dentre um ou mais vetores decompostos a partir dos coeficientes harmônicos esféricos que foram recombinados com coeficientes harmônicos esféricos de segundo plano, em que os coeficientes harmônicos esféricos descrevem um campo sonoro, e em que os coeficientes harmônicos esféricos de segundo plano descreveram um ou mais componentes de segundo plano do mesmo campo sonoro.
[0032] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores obtenham, a partir de um fluxo de bits, pelo menos um dentre um ou mais vetores decompostos a partir dos coeficientes harmônicos esféricos que foram recombinados com coeficientes harmônicos esféricos de segundo plano, em que os coeficientes harmônicos esféricos descrevem um campo sonoro, e em que os coeficientes harmônicos esféricos de segundo plano descreveram um ou mais componentes de segundo plano do mesmo campo sonoro.
[0033] Em outro aspecto, um método compreende identificar um ou mais objetos de áudio distintos a partir de um ou mais coeficientes harmônicos esféricos (SHC) associados aos objetos de áudio com base em uma direcionalidade determinada para um ou mais dos objetos de áudio.
[0034] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para identificar um ou mais objetos de áudio distintos a partir de um ou mais coeficientes harmônicos esféricos (SHC) associados aos objetos de áudio com base em uma direcionalidade determinada para um ou mais dos objetos de áudio.
[0035] Em outro aspecto, um dispositivo compreende meios para armazenar um ou mais coeficientes harmônicos esféricos (SHC) e meios para identificar um ou mais objetos de áudio distintos a partir do um ou mais coeficientes harmônicos esféricos (SHC) associados aos objetos de áudio com base em uma direcionalidade determinada para um ou mais dos objetos de áudio.
[0036] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores identifiquem um ou mais objetos de áudio distintos a partir de um ou mais coeficientes harmônicos esféricos (SHC) associados aos objetos de áudio com base em uma direcionalidade determinada para um ou mais dos objetos de áudio.
[0037] Em outro aspecto, um método compreende desempenhar uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar representações decompostas da pluralidade de coeficientes harmônicos esféricos representativos de um ou mais objetos de áudio e que correspondem informações direcionais, em que os coeficientes harmônicos esféricos são associados a uma ordem e descrevem um campo sonoro, determinar informações direcionais distintas e em segundo plano a partir das informações direcionais, reduzir uma ordem das informações direcionais associadas aos objetos de áudio de segundo plano para gerar informações direcionais de segundo plano transformadas, aplicar compensação para aumentar valores das informações direcionais transformadas para preservar uma energia geral do campo sonoro.
[0038] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para realizar uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar representações decompostas da pluralidade de coeficientes harmônicos esféricos representativos de um ou mais objetos de áudio e que correspondem informações direcionais, em que os coeficientes harmônicos esféricos são associados a uma ordem e descrevem um campo sonoro, determinar informações direcionais distintas e em segundo plano a partir das informações direcionais, reduzir uma ordem das informações direcionais associadas aos objetos de áudio de segundo plano para gerar informações direcionais de segundo plano transformadas, aplicar compensação para aumentar valores das informações direcionais transformadas para preservar uma energia geral do campo sonoro.
[0039] Em outro aspecto, um dispositivo compreende meios para desempenhar uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar representações decompostas da pluralidade de coeficientes harmônicos esféricos representativos de um ou mais objetos de áudio e que correspondem informações direcionais, em que os coeficientes harmônicos esféricos são associados a uma ordem e descrevem um campo sonoro, meios para determinar informações direcionais distintas e em segundo plano a partir das informações direcionais, meios para reduzir uma ordem das informações direcionais associadas aos objetos de áudio de segundo plano para gerar informações direcionais de segundo plano transformadas e meios para aplicar compensação para aumentar valores das informações direcionais transformadas para preservar uma energia geral do campo sonoro.
[0040] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores realizem uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar representações decompostas da pluralidade de coeficientes harmônicos esféricos representativos de um ou mais objetos de áudio e informações direcionais correspondentes, em que os coeficientes harmônicos esféricos são associados a uma ordem e descrevem um campo sonoro, determinem informações direcionais distintas e de segundo plano a partir das informações direcionais, reduzem uma ordem das informações direcionais associadas aos objetos de áudio de segundo plano para gerar informações direcionais de segundo plano transformadas, e aplicam compensação para aumentar os valores das informações direcionais transformadas para preservar uma energia geral do campo sonoro.
[0041] Em outro aspecto, um método compreende obter coeficientes harmônicos esféricos interpolados decompostos por um segmento de tempo, pelo menos em parte, desempenhando-se uma interpolação em relação a uma primeira decomposição de uma primeira pluralidade de coeficientes harmônicos esféricos e uma segunda decomposição de uma segunda pluralidade de coeficientes harmônicos esféricos.
[0042] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para obter coeficientes harmônicos esféricos interpolados decompostos por um segmento de tempo, pelo menos em parte, desempenhando-se uma interpolação em relação a uma primeira decomposição de uma primeira pluralidade de coeficientes harmônicos esféricos e uma segunda decomposição de uma segunda pluralidade de coeficientes harmônicos esféricos.
[0043] Em outro aspecto, um dispositivo compreende meios para armazenar uma primeira de coeficientes harmônicos esféricos e uma segunda pluralidade de coeficientes harmônicos esféricos e meios para obter coeficientes harmônicos esféricos interpolados decompostos por um segmento de tempo, pelo menos em parte, desempenhando-se uma interpolação em relação a uma primeira decomposição da primeira pluralidade de coeficientes harmônicos esféricos e a segunda decomposição de uma segunda pluralidade de coeficientes harmônicos esféricos.
[0044] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que compreende um ou mais processadores obtenham coeficientes harmônicos esféricos interpolados decompostos por um segmento de tempo, pelo menos em parte, desempenhando-se uma interpolação em relação a uma primeira decomposição de uma primeira pluralidade de coeficientes harmônicos esféricos e uma segunda decomposição de uma segunda pluralidade de coeficientes harmônicos esféricos.
[0045] Em outro aspecto, um método compreende obter um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0046] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para obter um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0047] Em outro aspecto, um dispositivo compreende meios para obter um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos e meios para armazenar o fluxo de bits.
[0048] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores obtenham um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0049] Em outro aspecto, um método compreende gerar um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0050] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para gerar um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0051] Em outro aspecto, um dispositivo compreende meios para gerar um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos e meios para armazenar o fluxo de bits.
[0052] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem instruções que, quando executadas, fazem com que um ou mais processadores gerem um fluxo de bits que compreende uma versão comprimida de um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0053] Em outro aspecto, um método compreende identificar um livro de códigos de Huffman para usar quando descomprimir uma versão comprimida de um componente espacial de uma pluralidade de componentes espaciais comprimidos com base em uma ordem da versão comprimida do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais comprimidos, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0054] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para identificar um livro de códigos de Huffman para usar quando descomprimir uma versão comprimida de um componente espacial de uma pluralidade de componentes espaciais comprimidos com base em uma ordem da versão comprimida do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais comprimidos, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0055] Em outro aspecto, um dispositivo compreende meios para identificar um livro de códigos de Huffman para usar quando descomprimir uma versão comprimida de um componente espacial de uma pluralidade de componentes espaciais comprimidos com base em uma ordem da versão comprimida do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais comprimidos, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos, e meios para encadear a pluralidade de componentes espaciais comprimidos.
[0056] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores identifiquem um livro de códigos de Huffman para usar quando se descomprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0057] Em outro aspecto, um método compreende identificar um livro de códigos de Huffman para usar quando se comprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais, os componentes espaciais gerados desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0058] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para identificar um livro de códigos de Huffman para usar quando se comprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais, os componentes espaciais gerados desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0059] Em outro aspecto, um dispositivo compreende meios para armazenar um livro de códigos de Huffman, e meios para identificar o livro de códigos de Huffman para usar quando se comprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais, os componentes espacial gerados desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0060] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores identifiquem um livro de códigos de Huffman para usar quando se comprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial em relação àqueles restantes da pluralidade de componentes espaciais, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0061] Em outro aspecto, um método compreende determinar um tamanho de etapa de quantização para ser usado quando se comprime um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0062] Em outro aspecto, um dispositivo compreende um ou mais processadores configurados para determinar um tamanho de etapa de quantização para ser usado quando se comprime um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0063] Em outro aspecto, um dispositivo compreende meios para determinar um tamanho de etapa de quantização para ser usado quando se comprime um componente espacial de um campo sonoro, o componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos, e meios para armazenar o tamanho de etapa de quantização.
[0064] Em outro aspecto, um meio de armazenamento legível por computador não transitório tem armazenado no mesmo, instruções que, quando executadas, fazem com que um ou mais processadores determinam um tamanho de etapa de quantização a ser usada quando se comprime um componente espacial de um campo sonoro, O componente espacial gerado desempenhando-se uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos.
[0065] Os detalhes da um ou mais aspectos das técnicas são estabelecidos nos desenhos anexos e na descrição abaixo. Outros recursos, objetos e vantagens dessas técnicas serão evidentes a partir da descrição e dos desenhos, e a partir das reivindicações.
BREVE DESCRIÇÃO DOS DESENHOS
[0066] As Figuras 1 e 2 são diagramas que ilustram funções de base harmônica esférica de várias ordens e subordens.
[0067] A Figura 3 é um diagrama que ilustra um sistema que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0068] A Figura 4 é um diagrama de blocos que ilustra, em mais detalhes, um exemplo do dispositivo de codificação de áudio mostrado no exemplo da Figura 3 que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0069] A Figura 5 é um diagrama de blocos que ilustra o dispositivo de decodificação de áudio da Figura 3 em mais detalhes.
[0070] A Figura 6 é um fluxograma que ilustra a operação exemplificativa de uma unidade de análise de conteúdo de um dispositivo de codificação de áudio no desempenho de vários aspectos das técnicas descritas nesta revelação.
[0071] A Figura 7 é um fluxograma que ilustra a operação exemplificativa de um dispositivo de codificação de áudio no desempenho de vários aspectos das técnicas de síntese com base em vetor descritas nesta revelação.
[0072] A Figura 8 é um fluxograma que ilustra a operação exemplificativa de um dispositivo de decodificação de áudio no desempenho de vários aspectos das técnicas descritas nesta revelação.
[0073] As Figuras 9A a 9L são diagramas de bloco que ilustram vários aspectos do dispositivo de codificação de áudio do exemplo da Figura 4 em mais detalhes.
[0074] As Figuras 10A a 100(ii) são diagramas que ilustram uma porção do fluxo de bits ou informações de canal auxiliar que podem especificar os componentes espaciais comprimidos em mais detalhes.
[0075] As Figuras 11A a 11G são diagramas de blocos que ilustram, em mais detalhes, várias unidades do dispositivo de decodificação de áudio mostrado no exemplo da Figura 5.
[0076] A Figura 12 é um diagrama que ilustra um ecossistema de áudio exemplificativo que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0077] A Figura 13 é um diagrama que ilustra um exemplo do ecossistema de áudio da Figura 12 em mais detalhes.
[0078] A Figura 14 é um diagrama que ilustra um exemplo do ecossistema de áudio da Figura 12 em mais detalhes.
[0079] As Figuras 15A e 15B são diagramas que ilustram outros exemplos do ecossistema de áudio da Figura 12 em mais detalhes.
[0080] A Figura 16 é um diagrama que ilustra um dispositivo de codificação de áudio exemplificativo que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0081] A Figura 17 é um diagrama que ilustra um exemplo do dispositivo de codificação de áudio da Figura 16 em mais detalhes.
[0082] A Figura 18 é um diagrama que ilustra um dispositivo de decodificação de áudio exemplificativo que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0083] A Figura 19 é um diagrama que ilustra um exemplo do dispositivo de decodificação de áudio da Figura 18 em mais detalhes.
[0084] As Figuras 20A a 20G são diagramas que ilustram dispositivos de aquisição de áudio exemplificativos que podem realizar vários aspectos das técnicas descritas nesta revelação.
[0085] As Figuras 21A a 21G são diagramas que ilustram dispositivos de reprodução de áudio exemplificativos que podem realizar vários aspectos das técnicas descritas nesta revelação.
[0086] As Figuras 22A a 22H são diagramas que ilustram ambientes de reprodução de áudio exemplificativos de acordo com uma ou mais técnicas descritas nesta revelação.
[0087] A Figura 23 é um diagrama que ilustra um caso de uso exemplificativo em que um usuário pode experimentar um campo sonoro em 3D de um jogo de esporte enquanto usa fones de ouvido de acordo com uma ou mais técnicas descritas nesta revelação.
[0088] A Figura 24 é um diagrama que ilustra um estádio de esportes em que um campo sonoro em 3D pode ser gravado de acordo com uma ou mais técnicas descritas nesta revelação.
[0089] A Figura 25 é um diagrama de fluxo que ilustra uma técnica para renderizar um campo sonoro em 3D com base em uma paisagem de áudio local de acordo com uma ou mais técnicas descritas nesta revelação.
[0090] A Figura 26 é um diagrama que ilustra um estúdio de jogos exemplificativo de acordo com uma ou mais técnicas descritas nesta revelação.
[0091] A Figura 27 é um diagrama que ilustra uma pluralidade de sistemas de jogo que inclui renderizar mecanismos de acordo com uma ou mais técnicas descritas nesta revelação.
[0092] A Figura 28 é um diagrama que ilustra uma configuração de alto-falante que pode ser simulada através de fones de ouvido de acordo com uma ou mais técnicas descritas nesta revelação.
[0093] A Figura 29 é um diagrama que ilustra uma pluralidade de dispositivos móveis que podem ser usados para adquirir e/ou editar um campo sonoro em 3D de acordo com uma ou mais técnicas descritas nesta revelação.
[0094] A Figura 30 é um diagrama que ilustra um quadro de vídeo associado a um campo sonoro em 3D que pode ser processado de acordo com uma ou mais técnicas descritas nesta revelação.
[0095] As Figuras 31A a 31M são diagramas que ilustram gráficos que mostram vários resultados de simulação de desempenhar a categorização sintética ou gravada do campo sonoro de acordo com vários aspectos das técnicas descritas nesta revelação.
[0096] A Figura 32 é um diagrama que ilustra um gráfico de valores únicos a partir de uma matriz S decomposta a partir de coeficientes ambisonic de ordem superior de acordo com as técnicas descritas nesta revelação.
[0097] As Figuras 33A e 33B são diagramas que ilustram os respectivos gráficos que mostram um impacto potencial que a reordenação tem quando codifica os vetores que descrevem componentes de primeiro plano do campo sonoro de acordo com as técnicas descritas nesta revelação.
[0098] As Figuras 34 e 35 são diagramas conceituais que ilustram diferenças entre identificação somente com base em energia e com base em direcionalidade de objetos de áudio distintos, de acordo com esta revelação.
[0099] As Figuras 36A a 36G são diagramas que ilustram projeções de pelo menos uma porção da versão decomposta de coeficientes harmônicos esféricos para oO domínio espacial de modo a desempenhar a interpolação de acordo com vários aspectos das técnicas descritas nesta revelação.
[0100] A Figura 37 ilustra uma representação de técnicas para obter uma interpolação espaço-temporal conforme descrito no presente documento.
[0101] A Figura 38 é um diagrama de blocos que ilustra matrizes U.S. artificiais, US* e Us?, para blocos de SVD sequenciais para um sinal multidimensional de acordo com técnicas descritas no presente documento.
[0102] A Figura 39 é um diagrama de blocos que ilustra a decomposição de quadros subsequentes de um sinal de ambisonics de ordem superior (HOA) com o uso de Decomposição de Valor Único e suavização dos componentes espaço-temporais de acordo com as técnicas descritas nesta revelação.
[0103] As Figuras 40A a 40J7 são, cada uma, um diagrama de blocos que ilustra os dispositivos de codificação de áudio que podem realizar vários aspectos das técnicas descritas nesta revelação para comprimir coeficientes harmônicos esféricos que descrevem campos sonoros bi ou tridimensionais.
[0104] A Figura 41A a 41D são diagramas de blocos que ilustram, cada um, um dispositivo de decodificação de áudio exemplificativo que pode realizar vários aspectos das técnicas descritas nesta revelação para decodificar coeficientes harmônicos esféricos que descrevem campos sonoros bi ou tridimensionais.
[0105] As Figuras 42A a 42C são, cada uma, diagramas de blocos que ilustram a unidade de redução de ordem mostrada nos exemplos das Figuras 40B a 40J em mais detalhes.
[0106] A Figura 43 é um diagrama que ilustra a unidade de compressão V mostrada na Figura 401 em mais detalhes.
[0107] A Figura 44 é um diagrama que ilustra operações exemplificativas realizadas pelo dispositivo de codificação de áudio para compensar o erro de quantização de acordo com vários aspectos das técnicas descritas nesta revelação.
[0108] As Figuras 45A e 45B são diagramas que ilustram a interpolação de subquadros a partir de porções de dois quadros de acordo com vários aspectos das técnicas descritas nesta revelação.
[0109] As Figuras 46A a 46E são diagramas que ilustram um corte transversal de uma projeção de um ou mais vetores de uma versão decomposta de uma pluralidade de coeficientes harmônicos esféricos que foram interpolados de acordo com as técnicas descritas nesta revelação.
[0110] A Figura 47 é um diagrama de blocos que ilustra, em mais detalhes, a unidade de extração dos dispositivos de decodificação de áudio mostrados nos exemplos das Figuras 41A a 41D.
[0111] A Figura 48 é um diagrama de blocos que ilustra a unidade de renderização de áudio do dispositivo de decodificação de áudio mostrado nos exemplos das Figuras 41A a 41D em mais detalhes.
[0112] As Figuras 49A a 49E(ii) são diagramas que ilustram os respectivos sistemas de codificação de áudio que podem implantar vários aspectos das técnicas descritas nesta revelação.
[0113] As Figuras 50A e 50B são diagramas de blocos que ilustram, cada uma, uma das duas abordagens diferentes para reduzir potencialmente a ordem do conteúdo de segundo plano de acordo com as técnicas descritas nesta revelação.
[0114] A Figura 51 é um diagrama de blocos que ilustra os exemplos de um caminho de compressão de componente distinto de um dispositivo de codificação de áudio que pode implantar vários aspectos das técnicas descritas nesta revelação para comprimir os coeficientes harmônicos esféricos.
[0115] As Figuras 52 são um diagrama de blocos que ilustra outro exemplo de um dispositivo de decodificação de áudio que pode implantar vários aspectos das técnicas descritas nesta revelação para reconstruir ou praticamente reconstruir coeficientes harmônicos esféricos (SHC) .
[0116] A Figura 53 é um diagrama de bloco que ilustra um outro exemplo de um dispositivo de codificação de áudio que pode realizar vários aspectos das técnicas descritas nesta revelação.
[0117] A Figura 54 é um diagrama de blocos que ilustra, em mais detalhes, uma implantação exemplificativa do dispositivo de codificação de áudio mostrado no exemplo da Figura 53.
[0118] As Figuras 55A e 55B são diagramas que ilustram um exemplo de realizar vários aspectos das técnicas descritas nesta revelação para girar um campo sonoro.
[0119] A Figura 56 é um diagrama que ilustra um campo sonoro exemplificativo capturado de acordo com um primeiro quadro de referência que é, então, girado de acordo com as técnicas descritas nesta revelação para expressar o campo sonoro em termos de um segundo quadro de referência.
[0120] As Figuras 57A a 57E são, cada uma, um diagrama que ilustra fluxos de bits formados de acordo com as técnicas descritas nesta revelação.
[0121] A Figura 58 é um fluxograma que ilustra a operação exemplificativa do dispositivo de codificação de áudio mostrado no exemplo da Figura 53 na implantação dos aspectos de rotação das técnicas descritas nesta revelação.
[0122] A Figura 59 é um fluxograma que ilustra a operação exemplificativa do dispositivo de codificação de áudio mostrado no exemplo da Figura 53 na realização dos aspectos de transformação das técnicas descritas nesta revelação.
DESCRIÇÃO DETALHADA
[0123] A evolução do som surround disponibilizou muitos formatos de saída para o entretenimento hoje em dia. Os exemplos de tais formatos de som surround do consumidor são, principalmente, "canal" com base no fato de que os mesmos especificam implicitamente alimentações para os alto-falantes em determinadas coordenadas geométricas. Esses incluem o formato popular
5.1 (que inclui os seis canais a seguir: esquerda frontal (FL), direita frontal (FR), centro ou centro frontal, esquerda posterior ou esquerda surround, direita posterior ou direita surround, e efeitos de baixa frequência (LFE)), o crescente formato 7.1, vários formatos que incluem alto falantes de altura como o formato 7.1.4 e o formato 22.2 (por exemplo, para uso com o padrão de Televisão de Definição Ultra Alta). Os formatos para não consumidor podem abranger qualquer quantidade de alto-falantes (em geometrias simétricas e não simétricas) frequentemente designados "arranjos surround". Um exemplo de tal arranjo inclui 32 alto-falantes posicionados em coordenadas dos cantos de um icosaedro truncado.
[0124] A entrada em um codificador de MPEG futuro é opcionalmente um dos três formatos possíveis: (1) áudio com base em canal tradicional (conforme discutido acima), que é destinado a ser reproduzido através de alto-
falantes em posições pré-especificadas; (ii) áudio com base em objeto, que envolve dados de modulação de código de pulso discreto (PCM) para únicos objetos de áudio com metadados associados que contêm suas coordenadas de local (dentre outras informações); e (iii) áudio com base em cena, que envolve representar o campo sonoro com uso de coeficientes de funções de base harmônica esférica (também chamados de “coeficientes harmônicos esféricos” ou SHC, “ambisonics de ordem superior” ou HOA, e “coeficientes de HOA”). Esse codificador de MPEG futuro pode ser descrito em mais detalhes em um documento intitulado “Call for Proposals for 3D Audio”, pela Organização Internacional para Padronização/Comissão Internacional de Eletrotécnica (ISO) /(IEC) JTC1/SC29/WG11/N13411, liberado em janeiro de 2013 em Genebra, Suíça, e disponível em http://mpeg.chiariglione.org/sites/default/files/files/stan dards/parts/docs/wl13411.zip
[0125] Há vários formatos com base em canal de "som surround" no mercado. Eles variam, por exemplo, de sistema de home theatre 5.1 (que foi o mais bem-sucedido em termos de fazer avanços nas salas de estar além do estéreo) ao sistema 22.2 desenvolvido por NHK (Nippon Hoso Kyokai ou Japan Broadcasting Corporation). Os criadores de conteúdo (por exemplo, estúdios de Hollywood) gostariam de produzir a trilha sonora para um filme uma vez e sem gastar esforços para remixar a mesma para cada configuração de alto- falante. Recentemente, as Organizações de Desenvolvimento de Padrões têm considerado modos nos quais deve-se fornecer uma codificação para um fluxo de bits padronizado e uma decodificação subsequente que é adaptável e agnóstica à geometria do alto-falante (e número) e condições acústicas no local da reprodução (que envolve um renderizador).
[0126] Para fornecer tal flexibilidade para os criadores de conteúdo, um conjunto hierárquico de elementos podem ser usados para representar um campo sonoro. O conjunto hierárquico de elementos pode se referir a um conjunto de elementos em que os elementos são ordenados de tal modo que um conjunto básico de elementos ordenados inferiores fornece uma representação completa do campo sonoro modelado. Conforme o conjunto é estendido para incluir elementos de ordem superior, a representação se torna mais detalhada, aumentando a resolução.
[0127] Um exemplo de um conjunto hierárquico de elementos é um conjunto de coeficientes harmônicos esféricos (SHC). A expressão a seguir demonstra uma descrição ou representação de um campo sonoro com o uso de SHC: & co n pltro dn) = >Yy [x 9" ne) > arco ve, efe, oo não me-n
[0128] Essa expressão mostra que a pressão Pp; em qualquer ponto (r,, 9r, Çr) do campo sonoro, no tempo t, pode ser representada unicamente pelo SHC, A",(k). No z2 presente, k =c", c a velocidade do som (-343 m/s), (rr, Or, qr) é um ponto de referência (ou ponto de observação) ,jn(*) é a função de Bessel esférica da ordem n, e Y(8Pr) são as funções de base harmônica esférica da ordem n e subordem m. Pode-se reconhecer que o termo em parênteses quadrados é uma representação de domínio de frequência do sinal (isto é, S(w, rr, Or, Qr)) que pode ser aproximada por várias transformações de tempo e frequência, como a transformação de Fourier discreta (DFT), a transformada de cosseno discreto (DCT) ou uma transformada de ondeleta. Outros exemplos de conjuntos hierárquicos incluem conjuntos de coeficientes de transformada de ondeleta e outros conjuntos de coeficientes de funções com base de multirresolução.
[0129] A Figura 1 é um diagrama que ilustra funções de base harmônica esférica da ordem zero (n = O) até a quarta ordem (n = 4). Conforme pode ser visto, para cada ordem, há uma expressão de subordens m que são mostrados, mas não explicitamente notados no exemplo da Figura 1 para facilitar os fins de ilustração.
[0130] A Figura 2 é outro diagrama que ilustra funções de base harmônica esférica da ordem zero (n = O) até a quarta ordem (n = 4). Na Figura 2, as funções de base harmônica esférica são mostradas no espaço de coordenada tridimensional tanto com a ordem quanto com a subordem mostradas.
[0131] O SHC An (k) pode ou ser fisicamente adquirido (por exemplo, gravado) através de várias configurações de arranjo de microfone ou, alternativamente, pode ser derivado de descrições com base em canal ou com base em objeto do campo sonoro. O SHC representa o áudio com base em cena, em que o SHC pode ser inserido em um codificador de áudio para obter o SHC codificado que pode promover a transmissão ou armazenamento mais eficaz. Por exemplo, uma representação de quarta ordem que envolve (1+4)? (25, e, por isso, quarta ordem) os coeficientes podem ser usados.
[0132] Conforme notado acima, o SHC pode ser derivado de uma gravação por microfone com o uso de um microfone. Vários exemplos de como o SHC pode ser derivado dos arranjos de microfone são descritos em Poletti, M., “Three-Dimensional Surround Sound Systems Based on Spherical Harmonics”, J. Audio Eng. Soc, Volume 53, nº 11, novembro de 2005, páginas 1.004 a 1.025.
[0133] Para ilustrar como esses SHCs podem ser derivados de uma descrição com base em objeto, considere a equação a seguir. Os coeficientes An (k) para o campo sonoro que corresponde a um objeto de áudio individual podem ser expressos como: AF(k) = glow) (Amik)h2 (kr) YZ (05,95),
[0134] em que i é VI, hr O é a função de Hankel esférica (do segundo tipo) da ordem n, e (rs, Os, Es) é o local do objeto. Conhecendo a energia da fonte do objeto g(w) como uma função da frequência (por exemplo, com o uso das técnicas de análise de tempo e frequência, como realizar uma transformação rápida de Fourier no fluxo de PCM) permite converter cada objeto de PCM e seu local para o SHC An (k) Ademais, pode ser mostrado (uma vez que o exposto acima é uma decomposição linear e ortogonal) que os coeficientes de An (k) para cada objeto são aditivos. Dessa maneira, uma multiplicidade dos objetos de PCM podem ser representados pelos coeficientes de An (k) (por exemplo, como uma soma dos vetores de coeficiente para os objetos individuais). Essencialmente, esses coeficientes contêm informações sobre o campo sonoro (a pressão como uma fu não de coordenadas em 3D), e o exposto acima representa a transformação a partir de objetos individuais em uma representação do campo sonoro geral, nas redondezas do ponto de observação (rr, 8x, Qr). As Figuras restantes são descritas abaixo no contexto da codificação de áudio com base em objeto e com base em SHC.
[0135] A Figura 3 é um diagrama que ilustra um sistema 10 que pode realizar vários aspectos das técnicas descritas nesta revelação. Conforme mostrado no exemplo da Figura 3, o sistema 10 inclui um criador de conteúdo 12 e um consumidor de conteúdo 14. Embora descrito no contexto do criador de conteúdo 12 e do consumidor de conteúdo 14 as técnicas podem ser implantadas em qualquer contexto em que os SHCs (que podem ser referidos como coeficientes de HOA) ou qualquer outra representação hierárquica de um campo sonoro são codificadas para formar um fluxo de bits representativo dos dados de áudio. Além do mais, o criador de conteúdo 12 pode representar qualquer forma de dispositivo de computação com capacidade de implantar as técnicas descritas nesta revelação, que inclui um fone (ou telefone celular), um computador do tipo tablet, um telefone inteligente ou um computador do tipo desktop para fornecer alguns exemplos. Igualmente, o consumidor de conteúdo 14 pode representar qualquer forma de dispositivo de computação com capacidade de implantar as técnicas descritas nesta revelação, que inclui um fone (ou telefone celular), um computador do tipo tablet, um telefone inteligente, um decodificador ou um computador do tipo desktop para fornecer alguns exemplos.
[0136] o criador de conteúdo 12 pode representar um estúdio de filme ou outra entidade que possa gerar conteúdo de áudio de multicanal para o consumo por consumidores de conteúdo, como o consumidor de conteúdo 14. Em alguns exemplos, o criador de conteúdo 12 pode representar um usuário individual que gostaria de comprimir os coeficientes de HOA 11. Frequentemente, esse criador de conteúdo gera conteúdo de áudio em conjunto com o conteúdo de vídeo. O consumidor de conteúdo 14 representa um indivíduo que possui ou tem acesso a um sistema de reprodução de áudio, que pode se referir a qualquer forma de sistema de reprodução de áudio com capacidade de renderizar o SHC para reproduzir como conteúdo de áudio de multicanal. No exemplo da Figura 3, o consumidor de conteúdo 14 inclui um sistema de reprodução de áudio 16
[0137] O criador de conteúdo 12 inclui um sistema de edição de áudio 18. O criador de conteúdo 12 obtém gravações ao vivo 7 em vários formatos (inclusive diretamente como coeficientes de HOA) e objetos de áudio 9, que o criador de conteúdo 12 pode editar com o uso de sistema de edição de áudio 18. O criador de conteúdo pode, durante o processo de edição, renderizar coeficientes de HOA 11 a partir de objetos de áudio 9, ouvir às alimentações do alto-falante renderizadas em uma tentativa de identificar vários aspectos do campo sonoro que exigem edição adicional. O criador de conteúdo 12 pode, então, editar os coeficientes de HOA 11 (potencialmente de modo indireto através da manipulação de diferentes objetos dos objetos de áudio 9 a partir dos quais os coeficientes de HOA de fonte podem ser derivados da maneira descrita acima). O criador de conteúdo 12 pode empregar o sistema de edição de áudio 18 para os coeficientes de HOA 11. O sistema de edição de áudio 18 representa qualquer sistema com capacidade de editar dados de áudio e emitir esses dados de áudio como um ou mais coeficientes harmônicos esféricos de fonte.
[0138] Quando o processo de edição estiver completo, o criador de conteúdo 12 pode gerar um fluxo de bits 21 com base nos coeficientes de HOA 11. Ou seja, o criador de conteúdo 12 inclui um dispositivo de codificação de áudio 20 que representa um dispositivo configurado para codificar ou de outro modo comprimir coeficientes de HOA 11 de acordo com vários aspectos das técnicas descritas nesta revelação para gerar o fluxo de bits 21. O dispositivo de codificação de áudio 20 pode gerar o fluxo de bits 21 para a transmissão, como um exemplo, através de um canal de transmissão, que pode ser um canal com fio ou sem fio, um dispositivo de armazenamento de dados, ou semelhantes. O fluxo de bits 21 pode representar uma versão codificada dos coeficientes de HOA 11 e pode incluir um fluxo de bits primário e um outro fluxo de bits auxiliar, que pode ser referido como informações de canal auxiliar.
[0139] Embora descrito em mais detalhes abaixo, o dispositivo de codificação de áudio 20 pode ser configurado para codificar os coeficientes de HOA 11 com base em uma síntese com base em vetor ou uma síntese com base direcional. Para determinar se deve-se realizar a metodologia de síntese com base em vetor ou uma metodologia de síntese com base direcional, o dispositivo de codificação de áudio 20 pode determinar, com base pelo menos em parte nos coeficientes de HOA 11, independente do fato de os coeficientes de HOA 11 serem gerados por meio de uma gravação natural de um campo sonoro (por exemplo, gravação ao vivo 7) ou artificialmente produzido (isto é, de modo sintético) a partir, como um exemplo, de objetos de áudio 9, como um objeto de PCM. Quando os coeficientes de HOA 11 foram gerados a partir dos objetos de áudio 9, o dispositivo de codificação de áudio 20 pode codificar os coeficientes de HOA 11 com o uso da metodologia de síntese com base direcional. Quando os coeficientes de HOA 11 foram capturados ao vivo com o uso, por exemplo, de um eigenmike, o dispositivo de codificação de áudio 20 pode codificar os coeficientes de HOA 11 com base na metodologia de síntese com base em vetor. A distinção acima representa um exemplo de onde a metodologia de síntese com base em vetor ou com base direcional pode ser instalada. Pode haver outros casos em que qualquer um ou ambos podem ser úteis para gravações naturais, conteúdo artificialmente gerado ou uma mistura dos dois (conteúdo híbrido). Ademais, também é possível usar ambas as metodologias simultaneamente para codificar um único quadro de tempo de coeficientes de HOA.
[0140] Supondo-se que, para fins de ilustração, o dispositivo de codificação de áudio 20 determina que os coeficientes de HOA 11 foram capturados ao vivo ou de outro modo representam gravações ao vivo, como a gravação ao vivo 7, o dispositivo de codificação de áudio podem ser configurados para codificar os coeficientes de HOA 11 com o uso de uma metodologia de síntese com base em vetor que envolve a aplicação de uma transformada inversível linear (LIT). Um exemplo da transformada inversível linear é referida como uma “decomposição de valor único” (ou “SVD”). Nesse exemplo, o dispositivo de codificação de áudio 20 pode aplicar a SVD aos coeficientes de HOA 11 para determinar uma versão decomposta dos coeficientes de HOA 11. O dispositivo de codificação de áudio 20 pode, então, analisar a versão decomposta dos coeficientes de HOA 11 para identificar vários parâmetros, que podem facilitar a reordenação da versão decomposta dos coeficientes de HOA 11. O dispositivo de codificação de áudio 20 pode, então, reordenar a versão decomposta dos coeficientes de HOA 11 com base nos parâmetros identificados, em que tal reordenação, conforme descrito em mais detalhes abaixo, pode aprimorar a eficiência de codificação dado que a transformação pode reordenar os coeficientes de HOA através dos quadros dos coeficientes de HOA (em que um quadro inclui comumente M amostras dos coeficientes de HOA 11 e M é, em alguns exemplos, definido em 1.024). Após a reordenação da versão decomposta dos coeficientes de HOA 11, o dispositivo de codificação de áudio 20 pode selecionar aqueles da versão decomposta dos coeficientes de HOA 11 representativos de componentes do campo sonoro de primeiro plano (ou, em outras palavras, distintos, predominantes ou salientes). O dispositivo de codificação de áudio 20 pode especificar a versão decomposta dos coeficientes de HOA 11 representativos dos componentes de primeiro plano como um objeto de áudio e informações direcionais associadas.
[0141] O dispositivo de codificação de áudio também pode realizar uma análise de campo sonoro em relação aos coeficientes de HOA 11 a fim de, pelo menos em parte, identificar aqueles dos coeficientes de HOA 11 representativos de um ou mais componentes do campo sonoro de segundo plano (ou, em outras palavras, ambiente). O dispositivo de codificação de áudio 20 pode realizar a compensação de energia em relação aos componentes de segundo plano dado que, em alguns exemplos, os componentes de segundo plano podem incluir apenas um subconjunto de qualquer dada amostra dos coeficientes de HOA 11 (por exemplo, como aqueles que correspondem a zero e funções de base esférica de primeira ordem e não aqueles que correspondem às funções de base esférica de segunda ordem ou de ordem superior). Quando a redução de ordem for realizada, em outras palavras, o dispositivo de codificação de áudio 20 pode aumentar (por exemplo, somar/subtrair energia a/de) os coeficientes de HOA de segundo plano restantes dos coeficientes de HOA 11 para compensar a alteração na energia geral que resulta da realização da redução de ordem.
[0142] O dispositivo de codificação de áudio 20 pode realizar, em seguida, uma forma de codificação psicoacústica (como formas de surround MPEG, MPEG-AAC, MPEG-USAC ou outras formas conhecidas de codificação psicoacústica) em relação a cada um dos coeficientes de HOA 11 representativos dos componentes de segundo plano e cada um dos objetos de áudio de primeiro plano. O dispositivo de codificação de áudio 20 pode realizar uma forma de interpolação em relação às informações direcionais de primeiro plano e, então, pode realizar uma redução de ordem em relação às informações direcionais de primeiro plano interpoladas para gerar informações direcionais de primeiro plano de ordem reduzida. O dispositivo de codificação de áudio 20 pode realizar adicionalmente, em alguns exemplos, uma quantização em relação às informações direcionais de primeiro plano de ordem reduzida, que emitem informações direcionais de primeiro plano codificadas. Em algumas ocasiões, essa quantização pode compreender uma quantização escalar/por entropia. O dispositivo de codificação de áudio pode, então, formar o fluxo de bits 21 para incluir os componentes de segundo plano codificados, os objetos de áudio de primeiro plano codificados, e as informações direcionais quantizadas. O dispositivo de codificação de áudio 20 pode então transmitir ou de outro modo enviar o fluxo de bits 21 para o consumidor de conteúdo 14.
[0143] Embora mostrado na Figura 3 como sendo diretamente transmitido para o consumidor de conteúdo 14, o criador de conteúdo 12 pode emitir o fluxo de bits 21 para um dispositivo intermediário posicionado entre o criador de conteúdo 12 e o consumidor de conteúdo 14. Esse dispositivo intermediário pode armazenar o fluxo de bits 21 para a entrega posterior para o consumidor de conteúdo 14, que pode solicitar esse fluxo de bits. O dispositivo intermediário pode compreender um servidor de arquivo, um servidor de rede, um computador do tipo desktop, um computador do tipo laptop, um computador do tipo tablet, um telefone móvel, um telefone inteligente ou qualquer outro dispositivo com capacidade de armazenar o fluxo de bits 21 para posterior recuperação através de um decodificador de áudio. Esse dispositivo intermediário pode residir em uma rede de entrega de conteúdo com capacidade de transmitir de modo contínuo o fluxo de bits 21 (e possivelmente em conjunto com a transmissão de um fluxo de bits de dados de vídeo correspondente) para assinantes, como o consumidor de conteúdo 14, que solicita o fluxo de bits 21.
[0144] Alternativamente, o criador de conteúdo 12 pode armazenar o fluxo de bits 21 em um meio de armazenamento, como um disco compacto, um disco de vídeo digital, um disco de vídeo em alta definição ou outras mídias de armazenamento, cuja maioria tem capacidade de ser lida por um computador e, portanto, pode ser referida como mídias de armazenamento legíveis por computador ou mídias de armazenamento legíveis por computador não transitórias. Nesse contexto, o canal de transmissão pode se referir àqueles canais através dos quais o conteúdo armazenado nesses meios são transmitidos (e podem incluir lojas de varejo e outro mecanismo de entrega baseado em loja). Em qualquer evento, as técnicas desta revelação não devem ser, portanto, limitadas nesse sentido ao exemplo da Figura 3.
[0145] Conforme adicionalmente mostrado no exemplo da Figura 3, o consumidor de conteúdo 14 inclui o sistema de reprodução de áudio 16. O sistema de reprodução de áudio 16 pode representar qualquer sistema de reprodução de áudio com capacidade de reproduzir dados de áudio de multicanal. O sistema de reprodução de áudio 16 pode incluir inúmeros Concorrentes diferentes 22. os Concorrentes 22 podem, cada um, fornecer “uma forma diferente de renderização, em que as formas diferentes de renderização podem incluir um ou mais dentre os vários modos de realizar variação gradual de amplitude com base em vetor (VBAP) e/ou um ou mais dentre os vários modos de realizar a síntese de campo sonoro. Conforme usado no presente documento, “A e/ou B” significa “A ou B” ou tanto “A quanto B”.
[0146] O sistema de reprodução de áudio 16 pode incluir adicionalmente um dispositivo de decodificação de áudio 24. O dispositivo de decodificação de áudio 24 pode representar um dispositivo configurado para decodificar os coeficientes de HOA 11º a partir do fluxo de bits 21, em que os coeficientes de HOA 11' podem ser semelhantes aos coeficientes de HOA 11, mas diferem devido às operações de perda (por exemplo, quantização) e/ou transmissão por meio do canal de transmissão. Ou seja, o dispositivo de decodificação de áudio 24 pode desquantizar as informações direcionais de primeiro plano especificadas no fluxo de bits 21, enquanto também realiza a decodificação psicoacústica em relação aos objetos de áudio de primeiro plano especificados no fluxo de bits 21 e nos coeficientes de HOA codificados representativos de componentes de segundo plano. o dispositivo de decodificação de áudio 24 pode realizar adicionalmente a interpolação em relação às informações direcionais de primeiro plano decodificadas e, então, determinar os coeficientes de HOA representativos dos componentes de primeiro plano com base nos objetos de áudio de primeiro plano decodificados e nas informações direcionais de primeiro plano interpoladas. O dispositivo de decodificação de áudio 24 pode então determinar os coeficientes de HOA 11 com base nos coeficientes de HOA determinados representativos dos componentes de primeiro plano e dos coeficientes de HOA decodificados representativos dos componentes de segundo plano.
[0147] O sistema de reprodução de áudio 16 pode, após a decodificação do fluxo de bits 21, obter os coeficientes de HOA 11º e renderizar os coeficientes de HOA 11º para emitir alimentações de alto-falante 25. As alimentações de alto-falante 25 pode acionar um ou mais alto-falantes (que não são mostrados no exemplo da Figura 3 para facilidade de fins de ilustração).
[0148] Para selecionar o renderizador adequado ou, em algumas ocasiões, gerar um renderizador adequado, o sistema de reprodução de áudio 16 pode obter informações de alto-falante 13 indicativas de um número de alto-falantes e/ou uma geometria espacial dos alto-falantes. Em algumas ocasiões, o sistema de reprodução de áudio 16 pode obter as informações de alto-falante 13 com o uso de um microfone de referência e que aciona os alto-falantes de tal maneira a determinar dinamicamente as informações de alto-falante 13. Em outras ocasiões ou em conjunto com a determinação dinâmica das informações de alto-falante 13, o sistema de reprodução de áudio 16 pode estimular um usuário a fazer interface com o sistema de reprodução de áudio 16 e introduzir as informações de alto-falante 16.
[0149] O sistema de reprodução de áudio 16 pode, então, selecionar um dos Concorrentes de áudio 22 com base nas informações de alto-falante 13. Em algumas ocasiões, o sistema de reprodução de áudio 16 pode, quando nenhum dos Concorrentes de áudio 22 estiver dentro de alguma medida de similaridade limite (no sentido da geometria do alto-falante) àquela especificada nas informações de alto-falante 13, gerar o um dentre os Concorrentes de áudio 22 com base nas informações de alto- falante 13. O sistema de reprodução de áudio 16 pode, em algumas ocasiões, gerar o um dos Concorrentes de áudio 22 com base nas informações de alto-falante 13 sem tentar primeiro selecionar um Concorrente existente dentre os Concorrentes de áudio 22.
[0150] A Figura 4 é um diagrama de blocos que ilustra, em mais detalhes, um exemplo do dispositivo de codificação de áudio 20 mostrado no exemplo da Figura 3 que pode realizar vários aspectos das técnicas descritas nesta revelação. O dispositivo de codificação de áudio 20 inclui uma unidade de análise de conteúdo 26, uma unidade de metodologia de síntese com base em vetor 27 e uma unidade de metodologia de síntese com base direcional 28.
[0151] A unidade de análise de conteúdo 26 representa uma unidade configurada para analisar o conteúdo dos coeficientes de HOA 11 para identificar se os coeficientes de HOA 11 representa o conteúdo gerado a partir de uma gravação ao vivo ou um objeto de áudio. A unidade de análise de conteúdo 26 pode determinar se os coeficientes de HOA 11 foram gerados a partir de uma gravação de um campo sonoro real ou de um objeto de áudio artificial. A unidade de análise de conteúdo 26 pode fazer essa determinação de vários modos. Por exemplo, a unidade de análise de conteúdo 26 pode codificar (N+1) ?-1 os canais e predizer o último canal restante (que pode ser representado como um vetor). A unidade de análise de conteúdo 26 pode aplicar escalares a pelo menos alguns dos canais (N+1)?-1 e somar os valores resultantes para determinar o último canal restante. Ademais, nesse exemplo, a unidade de análise de conteúdo 26 pode determinar uma precisão do canal predito. Nesse exemplo, se a precisão do canal predito é relativamente alta (por exemplo, a precisão excede um limite específico), os coeficientes de HOA 11 são provavelmente gerados a partir de um objeto de áudio sintético. Em contrapartida, se a precisão do canal predito é relativamente baixa (por exemplo, a precisão está abaixo do limite específico), os coeficientes de HOA 11 são mais prováveis de representar um campo sonoro gravado. Poe exemplo, nesse exemplo, se uma razão entre sinal e ruído (SNR) do canal predito estiver acima de 100 decibéis (dbs), os coeficientes de HOA 11 são mais prováveis de representar um campo sonoro gerado a partir de um objeto de áudio sintético. Em contrapartida, a SNR de um campo Sonoro gravado com o uso de um microfone próprio pode ser de 5 a dbs. Assim, pode haver uma demarcação evidente em razões SNR entre o campo sonoro representado pelos coeficientes de HOA 11 gerados a partir de uma gravação direta real e de um objeto de áudio sintético.
[0152] Mais especificamente, a unidade de análise de conteúdo 26 pode, quando se determinar se os coeficientes de HOA 11 representativos de um campo sonoro forem gerados a partir de um objeto de áudio sintético, obter uns coeficientes com quadro de coeficientes de HOA, que pode ser de tamanho de 25 por 1.024 para uma representação de quarta ordem (isto é, N = 4). Após obter os coeficientes de HOA com quadro (que podem ser denotados no presente documento como uma matriz de SHC com quadro 11 e matrizes de SHC com quadro subsequentes podem ser denotadas como matrizes de SHC com quadro 27B, 27C, etc.). A unidade de análise de conteúdo 26 pode então excluir o primeiro vetor dos coeficientes de HOA com quadro 11 para gerar coeficientes de HOA com quadro reduzidos. Em alguns exemplos, esse primeiro vetor excluído dos coeficientes de HOA com quadro 11 pode corresponder àqueles dos coeficientes de HOA 11 associados à função de base harmônica esférica de ordem zero, de subordem zero.
[0153] A unidade de análise de conteúdo 26 pode, então, predizer o primeiro vetor diferente de zero dos coeficientes de HOA reduzidos com quadro a partir de vetores restantes dos coeficientes de HOA reduzidos com quadro. O primeiro vetor diferente de zero pode se referir a um primeiro vetor que vai da primeira ordem (e que considera cada uma das subordens dependentes de ordem) a quarta ordem (e que considera cada uma das subordens dependentes de ordem) que tem valores além de zero. Em alguns exemplos, o primeiro vetor diferente de zero dos coeficientes de HOA reduzidos com quadro se refere àqueles dos coeficientes de HOA 11 associados à função de base harmônica esférica de primeira ordem, de subordem zero. Embora descrito em relação ao primeiro vetor diferente de zero, as técnicas podem predizer outros vetores dos coeficientes de HOA reduzidos com quadro a partir de vetores restantes dos coeficientes de HOA reduzidos com quadro. Por exemplo, a unidade de análise de conteúdo 26 pode predizer aqueles dentre os coeficientes de HOA reduzidos com quadro associados a uma função de base harmônica esférica de primeira ordem, de primeira subordem ou uma função de base harmônica esférica de primeira ordem, de primeira subordem negativa. Como ainda outros exemplos a unidade de análise de conteúdo 26 pode predizer aqueles dentre os coeficientes de HOA reduzidos com quadro associados a uma função de base harmônica esférica de segunda ordem, de ordem zero.
[0154] Para predizer o primeiro vetor diferente de zero, a unidade de análise de conteúdo 26 pode operar de acordo com a equação a seguir: Var),
[0155] em que z é de l a (N+1)?-1, que é 23 para uma representação de quarta ordem, a; denota alguma constante para o z'"-ésimo vetor, e V, se refere ao 2'-ésimo vetor. Após predizer o primeiro vetor diferente de zero, a unidade de análise de conteúdo 26 pode obter um erro com base no primeiro vetor diferente de zero predito e no vetor diferente de zero real. Em alguns exemplos, a unidade de análise de conteúdo 26 subtrai o primeiro vetor diferente de zero predito do primeiro vetor diferente de zero real para derivar o erro. A unidade de análise de conteúdo 26 pode computar o erro como uma soma do valor absoluto das diferenças entre cada entrada no primeiro vetor diferente de zero predito e o primeiro vetor diferente de zero real.
[0156] Uma vez que o erro é obtido, a unidade de análise de conteúdo 26 pode computar uma razão com base em uma energia do primeiro vetor diferente de zero real e do erro. A unidade de análise de conteúdo 26 pode determinar essa energia calculando-se o quadrado de cada entrada do primeiro vetor diferente de zero adicionando-se as entradas quadradas entre si. A unidade de análise de conteúdo 26 pode, então, comparar essa razão a um limite. Quando a razão não exceder o limite, a unidade de análise de conteúdo 26 pode determinar que os coeficientes de HOA com quadro 11 são gerados a partir de uma gravação e indicam no fluxo de bits que a representação codificada correspondente dos coeficientes de HOA 11 foi gerada a partir de uma gravação. Quando a razão exceder o limite, a unidade de análise de conteúdo 26 pode determinar que os coeficientes de HOA com quadro 11 são gerados a partir de um objeto de áudio sintético e indicam no fluxo de bits que a representação codificada correspondente dos coeficientes de HOA 11 com quadro foi gerada a partir de um objeto de áudio sintético.
[0157] A indicação de se os coeficientes de HOA com quadro 11 foi gerada a partir de uma gravação ou de um objeto de áudio sintético pode compreender um único bit para cada quadro. O único bit pode indicar que diferentes codificações foram usadas para cada quadro efetivamente comutando entre diferentes modos pelos quais deve-se codificar os quadros correspondentes. Em algumas ocasiões, quando os coeficientes de HOA com quadro 11 foram gerados a partir de uma gravação, a unidade de análise de conteúdo 26 passa os coeficientes de HOA 11 para a unidade de síntese com base em vetor 27. Em algumas ocasiões, quando os coeficientes de HOA com quadro 11 foram gerados a partir de um objeto de áudio sintético, a unidade de análise de conteúdo 26 passa os coeficientes de HOA 11 para a unidade de síntese com base direcional 28. A unidade de síntese com base direcional 28 pode representar uma unidade configurada para realizar uma síntese com base direcional dos coeficientes de HOA 11 para gerar um fluxo de bits com base direcional 21.
[0158] Em outras palavras, as técnicas se baseiam na codificação dos coeficientes de HOA com ou uso de um classificador de front-end. O classificador pode funcionar conforme segue:
[0159] Começar com uma matriz de SH com quadro (diga-se 4º ordem, tamanho de quadro de 1.024, que também pode ser referida como coeficientes de HOA com quadro ou como coeficientes de HOA) - em que uma matriz de tamanho 25 x 1.024 é obtida.
[0160] Excluir o 1º vetor (SH de ordem zero) - para que haja uma matriz de tamanho 24 x 1.024.
[0161] Predizer o primeiro vetor diferente de zero na matriz (um vetor de tamanho 1 x 1.024) - a partir do resto dos vetores na matriz (23 vetores de tamanho 1 x
1.024).
[0162] A predição é conforme segue: vetor predito = soma-sobre-i [alfa-i x vetor-I] (em que a soma sobre I é feita em 23 índices, i=1...23)
[0163] Então, verificar o erro: vetor real - vetor predito = erro.
[0164] Se a razão da energia do vetor/erro for grande (isto é, O erro for menor), então o campo Sonoro subjacente (nesse quadro) é esparso/sintético. Ou, o campo sonoro subjacente é um campo sonoro gravado (com o uso, diga-se, de um arranjo de microfone).
[0165] Dependendo da decisão de gravado contra sintético, realizar a codificação/decodificação (que pode se referir à compressão de largura de banda) de modos diferentes. A decisão é uma decisão de 1 bit, que é enviada através do fluxo de bits para cada quadro.
[0166] Conforme mostrado no exemplo da Figura 4, a unidade de síntese com base em vetor 27 pode incluir uma unidade de transformada inversível linear (LIT) 30, uma unidade de cálculo de parâmetro 32, uma unidade de reordenação 34, uma unidade de seleção de primeiro plano 36, uma unidade de compensação de energia 38, uma unidade psicoacústica codificadora de áudio 40, uma unidade de geração de fluxo de bits 42, uma unidade de análise de campo sonoro 44, uma unidade de redução de coeficiente 46, uma unidade de seleção de segundo plano (BG) 48, uma unidade de interpolação espaço-temporal 50 e uma unidade de quantização 52.
[0167] A unidade de transformada inversível linear (LIT) 30 recebe os coeficientes de HOA 11 na forma de canais HOA, cada canal é representativo de um bloco ou quadro de um coeficiente associado a uma dada ordem, subordem das funções de base esféricas (que podem ser denotadas como HOA[k], em que k pode denotar o quadro ou bloco de amostras atual). A matriz de coeficientes de HOA 11 pode ter dimensões D: Mx (N+1)?.
[0168] Ou seja, a unidade de LIT 30 pode representar uma unidade configurada para realizar uma forma de análise referida como decomposição de valor único. Embora descrito em relação à SVD, as técnicas descritas nesta revelação podem ser realizadas em relação a qualquer transformação ou decomposição semelhante que forneça conjuntos de saída compactada de energia linearmente não corrigida. Também, a referência a “conjuntos” nesta revelação é geralmente destinada a se referir aos conjuntos diferentes de zero a menos que seja especificamente estabelecido o contrário e não seja destinado a se referir à definição matemática clássica de conjuntos que incluem o denominado “conjunto vazio”.
[0169] Uma transformação alternativa pode compreender uma análise de componente principal, que é frequentemente referida como “PCA.” PCA se refere a um procedimento matemático que emprega uma transformação ortogonal para converter um conjunto de observações de variáveis possivelmente correlacionadas em um conjunto de variáveis linearmente não corrigidas referidas como componentes “principais. As variáveis linearmente não corrigidas representam variáveis que não têm relação estatística (ou dependência) entre si. Esses componentes principais podem ser descritos como tendo um grau pequeno de correção estatística entre si. Em qualquer evento, o número de componentes principais denominados é menor ou igual ao número de variáveis originais. Em alguns exemplos a transformação é definida de tal modo que o primeiro componente principal tem a maior variância possível (ou, em outras palavras, é responsável por tanto quanto a variabilidade nos dados conforme possível), e cada componente seguinte, por sua vez, tem a mais elevada variância possível sob a restrição de que esse componente sucessivo é ortogonal aos componentes precedentes (que podem ser reiniciados como não corrigidos com os mesmos). A PCA pode realizar uma forma de redução de ordem, que em termos dos coeficientes de HOA 11 pode resultar na compressão dos coeficientes de HOA 11. Dependendo do contexto, a PCA pode ser referida por inúmeros nomes diferentes, como transformada de Karhunen-Loeve discreta, a transformada de Hotellmg, decomposição ortogonal apropriada
(POD) e decomposição de valor próprio (EVD) para citar alguns exemplos. As propriedades de tais operações que são propícias ao objetivo subjacente de compressão de dados de áudio são a "compactação de energia" e "descorrelação" dos dados de áudio de multicanal.
[0170] Em qualquer evento, a unidade de LIT 30 realiza uma decomposição de valor único (que, novamente, pode ser referida como “SVD”) para transformar os coeficientes de HOA 11 em dois ou mais conjuntos de coeficientes de HOA transformados. Esses “conjuntos” de coeficientes de HOA transformados podem incluir vetores de coeficientes de HOA transformados. No exemplo da Figura 4, a unidade de LIT 30 pode realizar a SVD em relação aos coeficientes de HOA 11 para gerar uma denominada matriz V, uma matriz S e uma matriz U. SVD, em álgebra linear, pode representar uma fatorização de uma matriz X real ou complexa de y-por-z (em que X pode representar dados de áudio de multicanal, como os coeficientes de HOA 11) na forma a seguir: X=USV*
[0171] U pode representar uma matriz unitária real ou complexa de y-por-y, em que as colunas y de U são comumente conhecidas como os vetores únicos esquerdos dos dados de áudio de multicanal. S pode representar uma matriz diagonal retangular de y-por-z com números reais não negativos na diagonal, em que os valores diagonais de S são comumente conhecidos como os valores únicos dos dados de áudio de multicanal. V* (que pode denotar uma transposta conjugada de V) pode representar uma matriz unitária real ou complexa de z-por-z, em que as colunas z de V* são comumente conhecidas como os vetores únicos direitos dos dados de áudio de multicanal.
[0172] Embora descrito nesta revelação como sendo aplicadas aos dados de áudio de multicanal que compreendem coeficientes de HOA 11, as técnicas podem ser aplicadas a qualquer forma de dados de áudio de multicanal. Desse modo, o dispositivo de codificação de áudio 20 pode realizar uma decomposição de valor único em relação aos dados de áudio de multicanal representativos de pelo menos uma porção de campo sonoro para gerar uma matriz U representativa de vetores únicos esquerdos dos dados de áudio de multicanal, uma matriz S representativa de valores únicos dos dados de áudio de multicanal e uma matriz V representativa de vetores únicos direitos dos dados de áudio de multicanal, e que representa os dados de áudio de multicanal como uma função de pelo menos uma porção de um ou mais dentre a matriz U, a matriz S e a matriz V.
[0173] Em alguns exemplos, a matriz V* na expressão matemática referida acima é denotada como a transposta conjugada da matriz V para refletir que SVD pode ser aplicada às matrizes que compreendem números complexos. Quando aplicadas às matrizes que compreendem apenas números reais, o conjugado complexo da matriz V (ou, em outras palavras, a matriz V*) pode ser considerado para ser a transposta da matriz V. Abaixo, supõe-se que, para facilidade de fins de ilustração, os coeficientes de HOA 11 compreendem números reais com o resultado de que a matriz V é emitida através de SVD em vez da matriz V*. Além do mais embora denotado como a matriz V nesta revelação, a referência à matriz V deve ser compreendida para se referir à transposta da matriz V onde adequado. Embora supõe-se que seja a matriz V, as técnicas podem ser aplicadas de uma maneira semelhante aos coeficientes de HOA 11 que têm coeficientes complexos, em que a saída da SVD é a matriz V*. Dessa maneira, as técnicas não devem ser limitadas nesse sentido para fornecer apenas a aplicação de SVD para gerar uma matriz V, mas podem incluir a aplicação de SVD nos coeficientes de HOA 11 que têm componentes complexos para gerar uma matriz V*.
[0174] Em qualquer ocasião a unidade de LIT 30 pode realizar uma forma em blocos de SVD em relação a cada bloco (que pode se referir a um quadro) de dados de áudio ambisonics de ordem superior (HOA) (em que esses dados de áudio ambisonics incluem blocos ou amostras dos coeficientes de HOA 11 ou qualquer outra forma de dados de áudio de múltiplos canais). Conforme notado acima, uma variável M pode ser usada para denotar o comprimento de um quadro de áudio em amostras. Por exemplo, quando um quadro de áudio incluir 1.024 amostras de áudio, M é igual a
1.024. Embora descrito em relação a esse típico valor para M, as técnicas desta revelação não devem ser limitadas a esse típico valor para M. A unidade de LIT 30 pode realizar, portanto, uma SVD em blocos em relação a um bloco dos coeficientes de HOA 11 que têm coeficientes de HOA de M-por- (N+1)?, em que N, novamente, denota a ordem dos dados de áudio de HOA. A unidade de LIT 30 pode gerar, através da realização dessa SVD, uma matriz V, uma matriz S e uma matriz U, em que cada uma das matrizes pode representar as respectivas matrizes V, S e U descritas acima. Desse modo, a unidade de transformada inversível linear 30 pode realizar a SVD em relação aos coeficientes de HOA 11 para emitir vetores XJIS[k] 33 (que podem representar uma versão combinada dos vetores S e dos vetores U) que têm dimensões D: M x (N+1)º, e vetores V[k] 35 que têm dimensões D: (N+1)? x (N+1)?. Os elementos de vetor individual na matriz U.S.[k] também podem ser designados XPS(k) enquanto os vetores individuais da matriz V[k] também podem ser designados v(k).
[0175] Uma análise das matrizes U, S e V podem revelar que essas matrizes carregam ou representam características espaciais e temporais do campo Sonoro subjacente representado acima por X. Cada um dos vetores N em U (de comprimento de amostras M) pode representar sinais de áudio separados normalizados como uma função de tempo (para o período de tempo representado por amostras M), que são ortogonais entre si e que foram desacoplados de quaisquer características espaciais (que também podem ser referidas como informações direcionais). As características espaciais, que representam o formato espacial e largura de posição (r, theta, phi) podem ser em vez disso representadas por vetores individuais iº*"”%, v() (k), na matriz V (cada um do comprimento (N+1)º). Ambos os vetores na matriz U e na matriz V são normalizados de tal modo que suas energias com o quadrado da média da raiz são iguais à unidade. A energia dos sinais de áudio em U são, então representadas pelos elementos diagonais em Ss. A multiplicação de U e S para formar Xrs[k] (com elementos de vetor individuais XPS (k)), representa, então, o sinal de áudio com energias verdadeiras. A habilidade da decomposição SVD para desacoplar os sinais por tempo de áudio (em U), suas energias (em S) e suas características espaciais (em V) pode sustentar vários aspectos das técnicas descritas nesta revelação. Ademais, esse modelo de sintetização dos coeficientes de HOA[k] subjacentes, X, por uma multiplicação de vetor de XJIS[k] e V[k] origina o termo “metodologia de síntese com base em vetor”, que é usado por todo este documento.
[0176] Embora descrito como sendo realizada diretamente em relação aos coeficientes de HOA 11, a unidade de LIT 30 pode aplicar a transformada inversível linear aos derivados dos coeficientes de HOA 11. Por exemplo, a unidade de LIT 30 pode aplicar a SVD em relação a uma matriz de densidade espectral de potência derivada dos coeficientes de HOA 11. A matriz de densidade espectral de potência pode ser denotada como PSD e obtida através da multiplicação de matriz da transposta da hoaFrame para a hoaFrame, conforme esboçado no pseudocódigo que segue abaixo. A notação hoaFrame se refere a um quadro dos coeficientes de HOA 11.
[0177] A unidade de LIT 30 pode, após aplicar a SVD (svd) à PSD, obter uma matriz S[k]º (S quadrada) e uma matriz V[k]. A matriz S[k]? pode denotar uma matriz S[k] quadrada, onde a unidade de LIT 30 pode aplicar uma operação de raiz quadrada à matriz S[k]? para obter a matriz S[k]. A unidade de LIT 30 pode, em algumas ocasiões, realizar a quantização em relação à matriz V[k] para obter uma matriz V[k] quantizada (que pode ser denotada como matriz V[k]'). A unidade de LIT 30 pode obter a matriz U[k] multiplicando-se primeiro a matriz S[k] pela matriz V[k] quantizada para obter uma matriz SV[k]'. A unidade de LIT pode, em seguida, obter a pseudoinversa (pinv) da matriz SV[k]"” e, então, multiplicar os coeficientes de HOA 11 pela pseudoinversa da matriz SV[k]"” para obter a matriz U[k]. O que foi exposto anteriormente pode ser representado pelo pseudocódigo a seguir: PSD = hoaFrame' *hoaFrame; [V, S squared] = svd(PSD,'econ'); S = sart(S squared); U = hoaFrame * pinv(S*V);
[0178] Através da realização de SVD em relação à densidade espectral de potência (PSD) dos coeficientes de HOA em vez dos próprios coeficientes, a unidade de LIT 30 pode reduzir potencialmente a complexidade computacional de realizar a SVD em termos de um ou mais dentre os ciclos de processador e espaço de armazenamento, enquanto alcança a mesma eficiência de codificação de áudio de fonte que se a SVD fosse aplicada diretamente aos coeficientes de HOA. Ou seja, a SVD do tipo PSD descrita acima pode demandar potencialmente menos em termos de computação devido à SVD ser feita em uma matriz F*F (com F sendo o número de coeficientes de HOA). Em comparação com uma matriz M * F com M sendo o comprimento de quadro, isto é, 1.024 ou mais amostras. A complexidade de uma SVD pode agora, através da aplicação à PSD em vez dos coeficientes de HOA 11, ser cerca de O(Lº3) em comparação com O (M*LA2) quando aplicado aos coeficientes de HOA 11 (em que O (*) denota a notação denotes a notação big-O de complexidade computacional comum às técnicas de ciência de computador).
[0179] A unidade de cálculo de parâmetro 32 representa a unidade configurada para calcular vários parâmetros, como um parâmetro de correlação (R), parâmetros de propriedades direcionais (9, Q, r) e uma propriedade de energia (e). Cada um desses parâmetros para o quadro atual pode ser denotado como R[Ik], 6[kl, o [k], elk] e elk]l. A unidade de cálculo de parâmetro 32 pode realizar uma análise de energia e/ou correlação (ou denominada correlação cruzada) em relação aos vetores U.S.[k] 33 para identificar esses parâmetros. A unidade de cálculo de parâmetro 32 também pode determinar esses parâmetros para o quadro anterior, em que os parâmetros de quadro anterior podem ser denotados R[k-1], O[k-1], E[k-l1], r[k-1] e elk- 1], com base no quadro anterior do vetor U.S.[k-1] e vetores V[k-l1]. A unidade de cálculo de parâmetro 32 pode emitir os parâmetros atuais 37 e os parâmetros anteriores 39 para a unidade de reordenação 34.
[0180] Ou seja, a unidade de cálculo de parâmetro 32 pode realizar uma análise de energia em relação a cada um dentre os primeiros vetores U.S.[k] 33 que correspondem a um primeiro tempo e cada um dos segundos vetores U.S.[k] 33 que correspondem a um segundo tempo, que computa uma energia com quadrado da média da raiz para pelo menos uma porção de (mas frequentemente todo) o primeiro quadro de áudio e uma porção de (mas frequentemente todo) o segundo quadro de áudio e, desse modo, pode gerar energias 2L, uma para cada um dentre os primeiros L vetores U.S.[k] 33 do primeiro quadro de áudio e um para cada um dentre os segundos vetores U.S.[k -1] 33 do segundo quadro de áudio.
[0181] Em outros exemplos, a unidade de cálculo de parâmetro 32 pode realizar uma correlação cruzada entre alguma porção do conjunto de amostras (se não todo o mesmo) para cada um dentre os primeiros vetores XJIS[k] 33 e cada um dentre os segundos vetores U.S.[k-1]
33. A correlação cruzada pode se referir à correlação cruzada conforme compreendido nas técnicas de processamento de sinal. Em outras palavras, a correlação cruzada pode se referir a uma medida de similaridade entre duas formas de onda (que nesse caso é definida como um conjunto discreto de amostras M) como uma função de um retardamento aplicada a um deles. Em alguns exemplos, para realizar a correlação cruzada, a unidade de cálculo de parâmetro 32 compara a última amostra L de cada um dos primeiros vetores XJS[k] 27, em termos de vez, para as primeiras amostras L de cada um dos restantes dos segundos vetores U.S.[k-1] 33 para determinar um parâmetro de correlação. Conforme usado no presente documento, uma operação “em termos de vez” se refere a um elemento através da operação de elemento feita em relação a um primeiro conjunto de elementos e um segundo conjunto de elementos, em que a operação extrai um elemento de cada um dentre o primeiro e o segundo conjuntos de elementos “por vez” de acordo com uma ordenação dos conjuntos.
[0182] A unidade de cálculo de parâmetro 32 também pode analisar os vetores V[k] e/ou V[k-1] 35 para determinar parâmetros de propriedade direcional. Esses parâmetros de propriedade direcional podem fornecer uma indicação de movimento e local do objeto de áudio representado pelos vetores XJS[k] e/ou U.S.[k-1] 33 correspondentes. A unidade de cálculo de parâmetro 32 pode fornecer qualquer combinação de parâmetros atuais de primeiro plano 37 (determinados em relação aos vetores XJIS[k] 33 e/ou aos vetores V[k] 35) e qualquer combinação dos parâmetros anteriores 39 (determinados em relação aos vetores U.S.[k-1] 33 e/ou aos vetores V[k-1] 35) para a unidade de reordenação 34.
[0183] A decomposição de SVD não garante que o sinal de áudio/objeto representado pelo p-ésimo vetor em vetores U.S.[k-1] 33, que podem ser denotados como o vetor U.S.[£-1] [p] (ou, alternativamente, como Xes Pk), será o mesmo sinal de áudio/objeto (avançado no tempo) representado pelo p-ésimo vetor nos vetores XJIS[k] 33, que também podem ser denotados como vetores U.S.[k][p] 33 (ou, alternativamente como XpsPAR)) Os parâmetros calculados pela unidade de cálculo de parâmetro 32 podem ser usados pela unidade de reordenação 34 para reordenar os objetos de áudio para representar sua avaliação natural ou continuidade com o tempo.
[0184] Ou seja, a unidade de reordenação 34 pode então comparar cada um dos parâmetros 37 a partir dos primeiros vetores U.S.[k] 33 em termos de vez contra cada um dos parâmetros 39 para os segundos vetores U.S.[k-1] 33. A unidade de reordenação 34 pode reordenar (com o uso, como um exemplo, de um algoritmo húngaro) os vários vetores dentro da matriz U.S.[k] 33 e da matriz V[k] 35 com base nos parâmetros atuais 37 e nos parâmetros anteriores 39 para emitir uma matriz reordenada U.S.[k] 33" (que pode ser denotada matematicamente como U.S.[Kk]) e uma matriz reordenada V[k] 35" (que pode ser denotada matematicamente como V[k]) para uma unidade de seleção de som em primeiro plano (ou som predominante - PS) 36 (“unidade de seleção de primeiro plano 36”) e uma unidade de compensação de energia
38.
[0185] Em outras palavras, a unidade de reordenação 34 pode representar uma unidade configurada para reordenar os vetores dentro da matriz U.S.[k] 33 para gerar a matriz reordenada U.S.[k] 33". A unidade de reordenação 34 pode ordenar a matriz XIS[k] 33 por causa da ordem dos vetores XJS[k] 33 (em que, novamente, cada vetor dos vetores U.S.[k] 33, que novamente podem ser alternativamente denotados como Xps PO), pode representar um ou mais objetos distintos (ou, em outras palavras predominantes) de monoáudio presentes no campo sonoro) pode variar a partir de porções dos dados de áudio. Ou seja, dado que o dispositivo de codificação de áudio 12, em alguns exemplos, opera nessas porções dos dados de áudio geralmente referidos como quadros de áudio, a posição de vetores que correspondem a esses objetos de monoáudio distintos conforme representados na matriz U.S.[k] 33 como derivados, pode variar de quadro de áudio para quadro de áudio devido à aplicação de SVD aos quadros e a saliência variante de cada objeto de áudio de quadro para quadro.
[0186] Passar os vetores dentro da matriz XJ S[k] 33 diretamente para a unidade psicoacústica codificadora de áudio 40 sem reordenar os vetores dentro da matriz U.S.[k] 33 de quadro de áudio para quadro de áudio pode reduzir a extensão da compressão alcançável por alguns esquemas de compressão, como esquemas de compressão de herança que se desempenham melhor quando os objetos de monoáudio são contínuos (em termos de canal, que é definido nesse exemplo pela ordem de posição dos vetores dentro da matriz U.S.[k] 33 relacionados entre si) através de quadros de áudio. Além do mais, quando não reordenada, a codificação dos vetores dentro da matriz U.S.[k] 33 pode reduzir a qualidade dos dados de áudio quando decodificado. Por exemplo, os codificadores de AAC, que podem ser representados no exemplo da Figura 3 pela unidade psicoacústica codificadora de áudio 40, podem comprimir mais eficientemente um ou mais vetores reordenados dentro da matriz U.S.[k] 33' de quadro a quadro na comparação à compressão alcançada quando se codifica diretamente os vetores dentro da matriz U.S.[k] 33 de quadro a quadro. Embora descrito acima em relação aos codificadores de AAC, as técnicas podem ser realizadas em relação a qualquer codificador que forneça melhor compressão quando os objetos de moncáudio forem especificados através de quadros em uma ordem ou posição específica (em termos de canal).
[0187] Vários aspectos das técnicas podem, desse modo, possibilitar que o dispositivo de codificação de áudio 12 para reordenar um ou mais vetores (por exemplo, os vetores dentro da matriz U.S.[k] 33 para gerar um ou mais vetores reordenados dentro da matriz U.S.[k] 33 reordenada e, desse modo, facilitam a compressão dos vetores dentro da matriz U.S.[k] 33 por um codificador de áudio de herança, como a unidade psicoacústica codificadora de áudio 40).
[0188] Por exemplo, a unidade de reordenação 34 pode reordenar uma ou mais vetores dentro da matriz U.S.[k] 33 de um primeiro quadro de áudio subsequente em tempo ao segundo quadro ao qual um ou mais segundos vetores dentro da matriz U.S.[Kk-1] 33 corresponde com base nos parâmetros atuais 37 e parâmetros anteriores 39. Embora descrito no contexto de um de um primeiro quadro de áudio que é subsequente em tempo ao segundo quadro de áudio, o primeiro quadro de áudio pode preceder em tempo o segundo quadro de áudio. Dessa maneira, as técnicas não devem ser limitadas ao exemplo descrito nesta revelação.
[0189] Por questão de ilustração, considera-se a Tabela 1 a seguir em que cada um dos vetores p dentro da matriz U.S.[k] 33 é denotado como U.S. [Kk][p], em que k denota se o vetor correspondente é do -ésimo quadro ou do quadro anterior (k-l1) e p denota a fileira do vetor em relação aos vetores do mesmo quadro de áudio (em que a matriz U.S.[k] tem (N+1)? como vetores). Conforme notado acima, supondo-se que N seja determinado para ser um, Pp pode denotar vetores um (1) a (4).
TABELA 1 Energia Sob Consideração Em comparação com
[0190] Na Tabela 1 acima, a unidade de reordenação 34 compara a energia computada para U.S.[£- 1)[1] à energia computada para cada um dentre U.S.[k] [1], U.S.[k] [2], U.S.[k][3], U.S.[Kk][4], a energia computada para U.S.[k-1] [2] à energia computada para cada um dentre U.S.[k] [1], U.S.[k][2], U.S.[K][3], U.S.[k][4], etc. A unidade de reordenação 34 pode então descartar um ou mais dos segundos vetores U.S.[k-1] 33 do segundo quadro de áudio precedente (em termos de tempo). Por questão de ilustração, considera-se a Tabela 2 a seguir que mostra os restantes segundos vetores U.S.[k-1] 33: TABELA 2
[0191] Na Tabela 2 acima, a unidade de reordenação 34 pode determinar, com base na comparação de energia que a energia computada para U.S.[k-1][1] é semelhante à energia computada para cada uma dentre U.S.[k] [1] e U.S.[k] [2], a energia computada para U.S.[k- 1)[2] é semelhante à energia computada para cada uma dentre U.S.[k] [1] e U.S.[k] [2], a energia computada para XJS[k- 1)[3] é semelhante à energia computada para cada uma dentre U.S.[Kk] [3] e U.S.[k] [4], e a energia computada para U.S.[k- 1][4] é semelhante à energia computada para cada uma dentre U.S.[kK] [3] e U.S.[k] [4]. Em alguns exemplos, a unidade de reordenação 34 pode realizar a análise de energia adicional para identificar uma similaridade entre cada um dos primeiros vetores da matriz U.S.[k] 33 e cada um dos segundos vetores da matriz U.S.[k-1] 33.
[0192] Em outros exemplos, a unidade de reordenação 32 pode reordenar os vetores com base nos parâmetros atuais 37 e os parâmetros anteriores 39 que se referem à correlação cruzada. Nesses exemplos, com referência novamente à Tabela 2 acima, a unidade de reordenação 34 pode determinar a correlação exemplificativa a seguir expressa na Tabela 3 com base nesses parâmetros de correlação cruzada: TABELA 3
[0193] A partir da Tabela 3 acima, a unidade de reordenação 34 determina, como um exemplo, que o vetor U.S.[k-1] [1] se correlaciona ao vetor U.S.[k] [2] diferentemente posicionado, o vetor XJIS[k-11] [2] se correlaciona ao vetor U.S.[Kk] [1] diferentemente posicionado, o vetor U.S.[k-1] [3] se correlaciona ao vetor U.S.[k] [3] semelhantemente posicionado e o vetor U.S.[k- 1]1[4] se correlaciona ao vetor U.S.[k][4] semelhantemente posicionado. Em outras palavras, a unidade de reordenação 34 determina o que pode ser referido como informações reordenadas que descrevem como reordenar os primeiros vetores da matriz XJ S[k] 33 de tal modo que o vetor U.S.[k] [2] seja reposicionado na primeira fileira dos primeiros vetores da matriz U.S.[k] 33 e o vetor U.S.[k] [1] é reposicionado na segunda fileira dos primeiros vetores XIS[k] 33. A unidade de reordenação 34 pode, então, reordenar os primeiros vetores da matriz U.S.[k] 33 com base nessas informações de reordenação para gerar a matriz U.S.[k] 33" reordenada.
[0194] Adicionalmente, a unidade de reordenação 34 pode, embora não mostrado no exemplo da Figura 4, fornecer essas informações de reordenação para o dispositivo de geração de fluxo de bits 42, que pode gerar o fluxo de bits 21 para incluir essas informações de reordenação de modo que o dispositivo de decodificação de áudio, como o dispositivo de decodificação de áudio 24 mostrado no exemplo das Figuras 3 e 5, possam determinar como reordenar os vetores reordenados da matriz U.S.[k] 33' de modo a recuperar os vetores da matriz U.S.[k] 33.
[0195] Embora descrito acima como realizando um processo de duas etapas que envolve uma análise com base, primeiro, em parâmetros específicos à energia e, então, em parâmetros de correlação cruzada, a unidade de reordenação 32 pode apenas realizar essa análise apenas em relação aos parâmetros de energia para determinar as informações de reordenação, realizar essa análise apenas em relação aos parâmetros de correlação cruzada para determinar as informações de reordenação ou realizar a análise em relação a ambos os parâmetros de energia e os parâmetros de correlação cruzada da maneira descrita acima. Adicionalmente, as técnicas podem empregar outros tipos de processos para determinar a correlação que não envolver realizar um ou ambos dentre uma comparação de energia e/ou uma correlação cruzada. Dessa maneira, as técnicas não devem ser limitadas nesse sentido aos exemplos estabelecidos acima. Além do mais, outros parâmetros obtidos a partir da unidade de cálculo de parâmetro 32 (como os parâmetros de posição espacial derivados dos vetores V ou correlação dos vetores na V[k] e V[k-1] também podem ser usados (ou concorrente/junta ou sequencialmente) com os parâmetros de energia e de correlação cruzada obtidos a partir de U.S.[k] e U.S.[k-1] para determinar a ordenação correta dos vetores em U.S..
[0196] Como um exemplo de usar a correlação dos vetores na matriz V, a unidade de cálculo de parâmetro
34 pode determinar que os vetores da matriz Y[k] 35 sejam correlacionados conforme especificado na Tabela 4 a seguir: TABELA 4
[0197] A partir da Tabela 4 acima, a unidade de reordenação 34 determina, como um exemplo, que o vetor V[k-1][1] se correlaciona ao vetor V[k][2] diferentemente posicionado, o vetor V[k-1][2] se correlaciona ao vetor VIK]J [1] diferentemente posicionado, o vetor V[k-1][3] se correlaciona ao vetor V[k] [3] semelhantemente posicionado e o vetor V[&-1][4] se correlaciona ao vetor V[&][4] semelhantemente posicionado. A unidade de reordenação 34 pode produzir a versão reordenada dos vetores da matriz Y[k] 35 como uma matriz Y[k] 35' reordenada.
[0198] Em alguns exemplos, a mesma reordenação que é aplicada aos vetores na matriz U.S. também é aplicada aos vetores na matriz V. Em outras palavras, qualquer análise usada na reordenação dos vetores V pode ser usada em conjunto com qualquer análise usada para reordenar os vetores U.S.. Para ilustrar um exemplo em que as informações de reordenação não são somente determinadas em relação aos parâmetros de energia e/ou aos parâmetros de correlação cruzada em relação aos vetores U.S.[&] 35, a unidade de reordenação 34 também pode realizar essa análise em relação aos vetores Y[k] 35 com base nos parâmetros de correlação cruzada e nos parâmetros de energia de uma maneira semelhante àquela descrita acima em relação aos vetores Y[k] 35. Além do mais, embora os vetores XJS[k] 33 não tenham quaisquer propriedades direcionais, os vetores YIk] 35 podem fornecer informações relacionadas à direcionalidade dos vetores XJIS[k] 33 correspondente. Nesse sentido, a unidade de reordenação 34 pode identificar correlações entre os vetores V[k] 35 e vetores V[k-1] 35 com base em uma análise de parâmetros de propriedades direcionais correspondentes. Ou seja, em alguns exemplos, o objeto de áudio se move dentro de um campo sonoro de uma maneira contínua quando em movimento ou que fica em um local relativamente estável. Como tal, a unidade de reordenação 34 pode identificar esses vetores da matriz VIK] 35 e da matriz V[k-1] 35 que exibe algum movimento fisicamente realístico conhecido ou que fica estacionário dentro do campo sonoro conforme relacionado, reordenando os vetores XJIS[k] 33 e os vetores V[k] 35 com base na correlação de propriedades direcionais. Em qualquer evento, a unidade de reordenação 34 pode emitir os vetores reordenados U.S.[k] 33" e os vetores reordenados V[k] 35 para a unidade de seleção de primeiro plano 36.
[0199] Adicionalmente, as técnicas podem empregar outros tipos de processos para determinar a ordem correta que não envolve realizar um ou ambos dentre uma comparação de energia e/ou uma correlação cruzada. Dessa maneira, as técnicas não devem ser limitadas nesse sentido aos exemplos estabelecidos acima.
[0200] Embora descrito acima como a reordenação dos vetores da matriz V para espelhar a reordenação dos vetores da matriz U.S., em determinadas ocasiões, os vetores V podem ser reordenados diferentemente dos vetores U.S., onde os elementos de sintaxe separados podem ser gerados para indicar a reordenação dos vetores
U.S. e a reordenação dos vetores V. Em algumas ocasiões, os vetores V podem não ser reordenados e apenas os vetores U.S. podem ser reordenados dado que os vetores V podem não ser codificados de modo psicoacústico.
[0201] Uma modalidade em que a reordenação dos vetores da matriz V e dos vetores da matriz U.S. é diferente quando a intenção for trocar os objetos de áudio no espaço - isto é, mover os mesmos para longe da posição gravada original (quando o campo sonoro subjacente for uma gravação natural) ou a posição artisticamente destinada (quando o campo sonoro subjacente for uma mistura artificial de objetos). Como um exemplo, supõe-se que hajam duas fontes de áudio A e B, A pode ser o som de um gato “miau” que emana da parte “esquerda” do campo sonoro e B pode ser o som de um cachorro “au-au" que emana da parte “direita” do campo sonoro. Quando a reordenação do V e U.S. forem diferentes, a posição das duas fontes de som é trocada. Após a troca, A (o “miauú”) emana da parte direita do campo sonoro e B (o "au-rau") emana da parte esquerda do campo sonoro.
[0202] A unidade de análise de campo sonoro 44 pode representar uma unidade configurada para realizar uma análise de campo sonoro em relação aos coeficientes de HOA 11, de modo a alcançar, potencialmente, uma taxa-alvo de bits 41. A unidade de análise de campo sonoro 44 pode, com base em tal análise e/ou em uma taxa-alvo de bits recebida 41, determinar a quantidade total de formações de instâncias de codificador psicoacústico (que pode ser uma função da quantidade total de canais ambientes ou de segundo plano (BGTOT) e a quantidade de canais de primeiro plano ou, em outras palavras, canais predominantes. A quantidade total de formações de instâncias de codificador psicoacústico pode ser denotada como numHOATransportChannels. A unidade de análise de campo sonoro 44 também pode determinar, novamente para alcançar potencialmente a taxa-alvo de bits 41, a quantidade total de canais de primeiro plano (nFG) 45, a ordem mínima do campo sonoro (Nxg ou, alternativamente, MmAmbHoaOrder) de segundo plano (ou, em outras palavras, ambiente), a quantidade correspondente de canais reais representativos da ordem mínima de campo sonoro de segundo plano (Nxça = (MinambHoaOrder+1)?) e índices (i) de canais de HOA de BG adicionais para enviar (que podem ser denotados, coletivamente, como informações de canal de segundo plano 43 no exemplo da Figura 4). As informações de canal de segundo plano 42 também podem ser denominadas informações de canal ambiente 43. Cada um dos canais que permanece a partir de numHOATransportChannels - Nxça, pode tanto ser um “canal de segundo plano/ambiente adicional”, um “canal predominante com base em vetor ativo”, um “sinal predominante com base direcional ativa” ou “completamente inativo”. Em uma modalidade, tais tipos de canal podem ser indicados (como um “ChannelType”) elemento de sintaxe através de dois bits (por exemplo, 00:canal de segundo plano adicional; Ol:sinal predominando com base em vetor; 10: sinal inativo; 11: sinal com base direcional). A quantidade total de sinais de segundo plano ou ambientes, Nexça, pode ser determinada através de (MmAmbHoaOrder +1)? + a quantidade de vezes em que o índice 00 (no exemplo acima) aparece como um tipo de canal no fluxo de bits para tal quadro.
[0203] De qualquer forma, a unidade de análise de campo sonoro 44 pode selecionar a quantidade de canais de segundo plano (ou, em outras palavras, ambientes) e a quantidade de canais de primeiro plano (ou, em outras palavras, predominantes) com base na taxa-alvo de bits 41,
de modo a selecionar mais canais de segundo plano e/ou de primeiro plano quando a taxa-alvo de bits 41 é relativamente superior (por exemplo, quando a taxa-alvo de bits 41 é igual ou maior do que 512 Kbps). Em uma modalidade, os numHOATransportChannels podem ser estabelecidos como 8 enquanto a MmAmbHoaOrder pode ser estabelecida como 1 na seção de cabeçalho do fluxo de bits (que é descrito em maiores detalhes em relação às Figuras a 100(ii)). Nesse cenário, em todos os quadros, quatro canais podem ser dedicados a representar a porção de segundo plano ou ambiente do campo sonoro enquanto os outros 4 canais podem, à base de quadro por quadro, variar no tipo de canal - por exemplo, tanto usado como um canal de segundo plano/ambiente adicional quanto um canal de primeiro plano/predominante. os sinais de primeiro plano/predominantes podem ser tanto um sinal com base em vetor quanto um sinal com base direcional, conforme descrito acima.
[0204] Em algumas ocorrências, a quantidade total de sinais predominantes com base em vetor para um quadro, pode ser determinada através da quantidade de vezes que o índice de ChannelType for 01, no fluxo de bits de tal quadro no exemplo acima. Na modalidade acima, para todos os canais de segundo plano/ambientes adicionais (por exemplo, correspondentes a um ChannelType de 00), informações correspondentes de quais dentre os possíveis coeficientes de HOA (além dos quatro primeiros) pode ser representado no canal. Essas informações, para um conteúdo de HOA de quarta ordem, podem ser um índice para indicar entre 5 a 25 (os quatro primeiros 1 a 4 podem ser enviados todo o tempo quando minAmbHoaOrder é estabelecida como 1, por isso, precisa indicar apenas um dentre 5 a 25). Tais informações podem, portanto, ser enviadas com o uso de um elemento de sintaxe de 5 bits (para conteúdo de 4º ordem), que pode ser denotado como “CodedAmbCoeffldx”.
[0205] Em uma segunda modalidade, todos os sinais de primeiro plano/predominantes são sinais com base em vetor. Em tal segunda modalidade, a quantidade total de sinais de primeiro plano/predominantes pode ser determinada através de nFG = numHOATransportChannels - [ (MinAmbHoaOrder +1)? + a quantidade de vezes que o índice 00].
[0206] A unidade de análise de campo sonoro 44 emite as informações de canal de segundo plano 43 e os coeficientes de HOA 11 para a unidade de seleção de segundo plano (BG) 46, as informações de canal de segundo plano 43 para a unidade de redução de coeficiente 46 e a unidade de geração de fluxo de bits 42 e a nFG 45 para uma unidade de seleção de primeiro plano 36.
[0207] Em alguns exemplos, a unidade de análise de campo sonoro 44 pode selecionar, com base em uma análise dos vetores da matriz 33 U.S.[k] e na taxa-alvo de bits 41, uma quantidade de variável de tais componentes que tenha o maior valor. Em outras palavras, a unidade de análise de campo sonoro 44 pode determinar um valor para uma variável A (que pode ser similar ou substancialmente similar a Nx), que separa dois subespaços, através da análise do declive da curva criada através dos valores diagonais descendentes dos vetores da matriz 33 S[k], em que os grandes valores singulares representam sons de primeiro plano ou distintos e os baixos valores singulares representam componentes de segundo plano do campo sonoro. Ou seja, a variável A pode segmentar o campo sonoro geral para formar um subespaço de primeiro plano e um subespaço de segundo plano.
[0208] Em alguns exemplos, a unidade de análise de campo sonoro 44 pode usar um primeiro e um segundo derivativo da curva de valor singular. A unidade de análise de campo sonoro 44 também pode limitar o valor para que a variável A seja entre um e cinco. Como outro exemplo, a unidade de análise de campo sonoro 44 pode limitar o valor da variável A para que seja entre um e (N+1)?. Alternativamente, a unidade de análise de campo sonoro 44 pode predefinir o valor para a variável A, tal como para um valor de quatro. De qualquer forma, com base no valor de A, a unidade de análise de campo sonoro 44 determina a quantidade total de canais de primeiro plano (nFG) 45, a ordem do campo sonoro de segundo plano (Nxg) e a quantidade (Nzça) e os índices (i) de canais de HOA de BG adicionais a serem enviados.
[0209] Ademais, a unidade de análise de campo sonoro 44 pode determinar a energia dos vetores na matriz V[k] a uma base por vetor. A unidade de análise de campo sonoro 44 pode determinar a energia para cada um dos vetores na matriz 35 V[k] e identificar os que têm uma alta energia como componentes de primeiro plano.
[0210] Ademais, a unidade de análise de campo sonoro 44 pode realizar várias outras análises em relação aos coeficientes de HOA 11, inclusive uma análise de energia espacial, uma análise de mascaramento espacial, uma análise de difusão ou outras formas de análises auditivas. A unidade de análise de campo sonoro 44 pode realizar a análise de energia espacial através da transformação dos coeficientes de HOA 11 em áreas de identificação e domínio espacial de alta energia representativas de componentes direcionais do campo sonoro que devem ser preservadas. A unidade de análise de campo sonoro 44 pode realizar a análise de mascaramento espacial perceptiva de uma maneira similar à da análise de energia espacial, com a exceção de que a unidade de análise de campo sonoro 44 pode identificar áreas espaciais que são mascaradas através de sons de energia superior espacialmente próximos. A unidade de análise de campo sonoro 44 pode, em seguida, com base nas áreas perceptivamente mascaradas, identificar menos componentes de primeiro plano em alguns casos. A unidade de análise de campo sonoro 44 pode realizar adicionalmente uma análise de difusão em relação aos coeficientes de HOA 11 para identificar áreas de energia difusa que podem representar componentes de segundo plano do campo sonoro.
[0211] A unidade de análise de campo sonoro 44 também pode representar uma unidade configurada para determinar saliência, distinção ou predominância de dados de áudio que representam um campo sonoro, com o uso de informações com base em direcionalidade associadas aos dados de áudio. Embora as determinações com base em energia possam aprimorar a rederização de um campo sonoro decomposto através de SVD para identificar componentes de áudio distintos do campo sonoro, as determinações com base em energia também podem fazer com que um dispositivo identifique erroneamente componentes de áudio de segundo plano como componentes de áudio distintos, em casos em que Os componentes de áudio de segundo plano exibem um alto nível de energia. Ou seja, uma separação somente com base em energia de componentes de áudio distintos e de segundo plano pode não ser robusta, enquanto os componentes de áudio de segundo plano energéticos (por exemplo, mais altos) podem ser incorretamente identificados como componentes de áudio distintos. Distinguir de modo mais robusto entre componentes de áudio distintos e de segundo plano do campo sonoro, Vários aspectos das técnicas descritas na presente revelação possibilitam que a unidade de análise de campo sonoro 44 realize uma análise com base em direcionalidade dos coeficientes de HOA 11 para separar os componentes de primeiro plano e ambientes a partir das versões decompostas dos coeficientes de HOA 11.
[0212] Nesse aspecto, a unidade de análise de campo sonoro 44 podem representar uma unidade configurada ou, de outro modo, operável para identificar elementos distintos (ou de primeiro plano) de elementos de segundo plano incluído em um ou mais dos vetores na matriz 33 U.S.[kK] e os vetores na matriz 35 V[k]. De acordo com algumas técnicas com base em SVD, os componentes mais energéticos (por exemplo, os poucos primeiros vetores de uma ou mais dentre a matriz 33 U.S.[k] e a matriz 35 V[k] ou vetores derivados das mesmas) podem ser tratados como componentes distintos. Entretanto, os componentes mais energéticos (que são representados por vetores) de um ou mais dos vetores na matriz 33 U.S.[k] e os vetores na matriz 35 V[k] podem, em todos os cenários, não representar os componentes/sinais que são os mais direcionais.
[0213] A unidade de análise de campo sonoro 44 pode implantar um ou mais aspectos das técnicas descritas no presente documento para identificar elementos de primeiro plano/direto/predominante com base na direcionalidade dos vetores de um ou mais dos vetores na matriz 33 U.S.[k] e os vetores na matriz 35 V[k] ou vetores derivados das mesmas. Em alguns exemplos, a unidade de análise de campo sonoro 44 pode identificar ou selecionar como componentes de áudio distintos (em que os componentes também podem ser denominados como “objetos”), um ou mais vetores tanto com base na energia quanto na direcionalidade dos vetores. Por exemplo, a unidade de análise de campo sonoro 44 pode identificar os vetores de um ou mais dos vetores na matriz 33 U.S.[k] e os vetores na matriz 35 V[k] (ou vetores derivados das mesmas) que exibem tanto alta energia quanto alta direcionalidade (por exemplo,
representado como um quociente de direcionalidade) como componentes de áudio distintos. Como um resultado, se a unidade de análise de campo sonoro 44 determina que um vetor particular é relativamente menos direcional quando comparado com outros vetores de um ou mais dos vetores na matriz 33 U.S.[k] e os vetores na matriz 35 V[k] (ou vetores derivados a partir das mesmas), então independentemente do nível de energia associado ao vetor particular, a unidade de análise de campo sonoro 44 pode determinar que o vetor particular representa componentes de áudio de segundo plano (ou ambiente) do campo Sonoro representado através dos coeficientes de HOA 11.
[0214] Em alguns exemplos, a unidade de análise de campo sonoro 44 pode identificar objetos de áudio distintos (que, conforme observado acima, também podem ser denominados como “componentes”) com base na direcionalidade, realizando-se as seguintes operações. A unidade de análise de campo sonoro 44 pode multiplicar (por exemplo, com o uso de um ou mais processos de multiplicação de matriz) vetores na matriz S[k] (que podem ser derivados dos vetores 33 U.S.[k] ou, embora não seja mostrado no exemplo da Figura 4, separadamente emitidos pela unidade de LIT 30) através dos vetores na matriz 35 VIk]. Multiplicando-se a matriz 35 V[k] e os vetores S[k], a unidade de análise de campo sonoro 44 pode obter matriz VS[K]. Adicionalmente, a unidade de análise de campo sonoro 44 pode elevar ao quadrado (isso é, exponenciar a uma potência de dois) pelo menos uma parte das entradas de cada um dos vetores na matriz VS[K]. Em algumas ocorrências, a unidade de análise de campo sonoro 44 pode somar as entradas elevadas ao quadrado de cada vetor que são associadas a uma ordem maior do que 1.
[0215] Como um exemplo, se cada vetor da matriz VS[K], que inclui 25 entradas, a unidade de análise de campo sonoro 44 pode, em relação a cada vetor, elevar ao quadrado as entradas de cada vetor, a começar na quinta entrada e terminando na décima quinta entrada, de modo a somar as entradas elevadas ao quadrado para determinar um quociente de direcionalidade (ou um indicador de direcionalidade). Cada operação de soma pode resultar em um quociente de direcionalidade para um vetor correspondente. Nesse exemplo, a unidade de análise de campo sonoro 44 pode determinar que as entradas de cada fileira que estão associadas a uma ordem menor ou igual a l, designadamente, da primeira até a quarta entradas, são mais genericamente direcionadas à quantidade de energia e menos à direcionalidade de tais entradas. Ou seja, a menor ordem ambissônica associada a uma ordem de zero ou um corresponde às funções de base esférica que, conforme ilustrado na Figura 1 e na Figura 2, não fornece muitos termos da direção da onda de pressão, mas em vez disso, fornece volume (que é representativo de energia).
[0216] As operações descritas no exemplo acima também podem ser expressadas de acordo com o seguinte pseudocódigo. O pseudocódigo abaixo inclui anotações, sob a forma de instruções de comentário que estão incluídas nos casos consecutivos das cadeias de caracteres “/*” e “*/"” (sem aspas).
[U,S,V] = svd(quadro de áudio,'ecom'); VS = V*S;
[0217] /* A próxima linha é direcionada à análise de cada fileira independentemente e a soma dos valores na primeira fileira (como um exemplo) a partir da quinta entrada até a décima quinta entrada para determinar um quociente de direcionalidade ou métrica de direcionalidade para um vetor correspondente. Elevar ao quadrado as entradas antes da soma. As entradas em cada fileira que está associada a uma ordem maior do que 1 são associadas a uma ordem ambissônica mais alta e têm, portanto, uma maior probabilidade de serem direcionais. */ sumVS = sum(VS(5:end,:).02,1);
[0218] /* A próxima linha é direcionada ao sortimento da soma de quadrados para a matriz VS gerada e a seleção de um conjunto dos maiores valores (por exemplo, três ou quatro dos maiores valores) */ [-, idxVS] = sort (sumVS,'descend'); U = U(:,idxVS); V = V(:,idxVS); S = S(idxVS,idxVS);
[0219] Em outras palavras, de acordo com o pseudocódigo acima, a unidade de análise de campo sonoro 44 pode selecionar entradas de cada vetor da matriz VS[K] decompostas a partir dos coeficientes de HOA 11 que correspondem a uma função de base esférica que tem uma ordem maior do que um. A unidade de análise de campo sonoro 44 pode, em seguida, elevar ao quadrado essas entradas para cada vetor da Wmatriz S[k], de modo a somar as entradas elevadas ao quadrado para identificar, computar ou, de outro modo, determinar uma métrica de direcionalidade ou quociente para cada vetor da matriz VS[K]. Em seguida, a unidade de análise de campo sonoro 44 pode sortir os vetores da matriz VS[K] com base nas respectivas métricas de direcionalidade de cada um dos vetores. A unidade de análise de campo sonoro 44 pode sortir tais vetores em uma ordem descendente de métricas de direcionalidade, de modo que os vetores com a mais alta direcionalidade correspondente sejam os primeiros e os vetores com a mais baixa direcionalidade correspondente sejam os últimos. A unidade de análise de campo sonoro 44 pode, em seguida,
selecionar o subconjunto diferente de zero dos vetores que têm a maior métrica de direcionalidade relativa.
[0220] A unidade de análise de campo sonoro 44 pode realizar qualquer combinação das análises de primeiro plano para determinar a quantidade total de formações de instâncias de codificador psicoacústico (que podem ser uma função da quantidade total de canais ambientes ou de segundo plano (BGTOT) e a quantidade de canais de primeiro plano. A unidade de análise de campo sonoro 44 pode, com base em qualquer combinação das análises de primeiro plano, determinar a quantidade total de canais de primeiro plano (NnFG) 45, a ordem do campo sonoro de segundo plano (Nx) e a quantidade (Nxça) e índices (i) de canais de HOA de BG adicionais para enviar (que podem, coletivamente, ser denotados como informações de canal de segundo plano 43 no exemplo da Figura 4).
[0221] Em alguns exemplos, a unidade de análise de campo sonoro 44 pode realizar tal análise a cada M-amostras, que podem ser reprocessadas como em uma base de quadro por quadro. Nesse aspecto, o valor para A pode variar de quadro para quadro. Um caso de um fluxo de bits em que a decisão é realizada a cada M-amostras é mostrado nas Figuras 10 a 100(ii). Em outros exemplos, a unidade de análise de campo sonoro 44 pode realizar essa análise mais do que uma vez por quadro, de modo a analisar duas ou mais porções do quadro. Consequentemente, as técnicas não devem ser limitadas, nesse sentido, aos exemplos descritos na presente revelação.
[0222] A unidade de seleção de segundo plano 48 pode representar uma unidade configurada para determinar coeficientes de HOA de segundo plano ou ambientes 47 com base nas informações de canal de segundo plano (por exemplo, o campo sonoro de segundo plano (Nec) e.
quantidade (Nxça) e os índices (1) de canais de HOA de BG adicionais a serem enviados). Por exemplo, quando Nm É igual a um, a unidade de seleção de segundo plano 48 pode selecionar os coeficientes de HOA 11 para cada amostra do quadro de áudio que tem uma ordem igual ou menor do que um. A unidade de seleção de segundo plano 48 pode, nesse exemplo, então, selecionar os coeficientes de HOA 11 que têm um índice identificado através de um dos índices (i) como coeficientes de HOA de BG adicionais, e que a Nxça é fornecida à unidade de geração de fluxo de bits 42 para ser especificada no fluxo de bits 21 de modo a habilitar o dispositivo de decodificação de áudio, tal como Oo dispositivo de decodificação de áudio 24 mostrado no exemplo da Figura 3, para analisar os coeficientes de HOA de BG 47 a partir do fluxo de bits 21. A unidade de seleção de segundo plano 48 pode, em seguida, emitir os coeficientes de HOA ambientes 47 para a unidade de compensação de energia 38. Os coeficientes de HOA ambientes 47 podem ter dimensões D: Mx [ (Nact+1)? + Neal.
[0223] A unidade de seleção de primeiro plano 36 pode representar uma unidade configurada para selecionar aquelas dentre a matriz 33 U.S.[k]” reordenada e a matriz V[k]" reordenada que representa os componentes de primeiro plano ou distintos do campo sonoro com base em nFG 45 (que pode representar um ou mais índices que identificam tais vetores de primeiro plano). A unidade de seleção de primeiro plano 36 pode emitir sinais de nFG 49 (que podem ser denotados como uma U.S.[Kk];, reorganizada, nWEG 49, FG1, xX-nFO), , ee neclk] 49, ou “Ps (k) 49) para a unidade de codificador de áudio psicoacústico 40, em que os sinais de nFG 49 podem ter as dimensões D: M x nFG e cada um representa objetos de monoáudio. A unidade de seleção de primeiro plano 36 também pode emitir a matriz 35 V[Kk]” reordenada (ou y (1nF6) (k) 35") que corresponde aos componentes de primeiro plano do campo sonoro para a unidade de interpolação espaço-temporal 50, em que aquelas das matrizes 35 V[Kk]"” reordenadas correspondentes aos componentes de primeiro plano podem ser denotadas como matriz 511 V[k] de primeiro plano (que podem ser matematicamente denotadas como v arelk), que têm dimensões D: (N+1)? x nFG.
A unidade de compensação de energia 38 pode representar uma unidade configurada para realizar compensação de energia em relação aos coeficientes de HOA ambientes 47 para compensar pela perda de energia devido à remoção de vários dentre os canais de HOA através da unidade de seleção de segundo plano 48. A unidade de compensação de energia 38 pode realizar uma análise de energia em relação a uma ou mais dentre a matriz 33 U.S.[k] * reordenada, a matriz 35 V[k]'” reordenada, os sinais de nFG 49, os vetores 511, V[IKk] reordenados e os coeficientes de HOA ambientes 47 e, em seguida, realizar a compensação de energia com base em tal análise de energia para gerar os coeficientes de HOA ambientes 47' de energia compensada. A unidade de compensação de energia 38 pode emitir os coeficientes de HOA ambientes 47' de energia compensada para a unidade de codificador de áudio psicoacústico 40.
[0224] Efetivamente, a unidade de compensação de energia 38 pode ser usada para compensar por possíveis reduções na energia geral dos componentes de som de segundo plano do campo sonoro geradas pela redução da ordem dos ambiente componentes do campo sonoro descritos através de coeficientes de HOA 11 para gerar os coeficientes de HOA ambientes 47 de ordem reduzida (que, em alguns exemplos, têm uma ordem menor do que N em termos de apenas coeficientes incluídos correspondentes às funções de base esférica que têm as seguintes ordens/subordens: [ (Neet+1)? + Neal). Em alguns exemplos, a unidade de compensação de energia 38 compensa por essa perda de energia determinando- se um ganho de compensação sob a forma de valores de amplificação para aplicar a cada uma das colunas [ (Neet1)? + Nega] dos coeficientes de HOA ambientes 47 a fim de aumentar a energia de quadrado de média de raiz (RMS) dos coeficientes de HOA ambientes 47 para que seja igual ou pelo menos mais aproximada à RMS dos coeficientes de HOA 11 (conforme “determinado através da análise de energia agregada de uma ou mais dentre a matriz 33 U.S.[k]' reordenada, a matriz 35 V[k]'” reordenada, os sinais de nFG 49, os vetores 511 V[k] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida), antes de emitir os coeficientes de HOA ambientes 47 para a unidade de codificador de áudio psicoacústico 40.
[0225] Em algumas ocorrências, a unidade de compensação de energia 38 pode identificar a RMS para cada fileira e/ou coluna de uma ou mais dentre a matriz 33 U.S.[k]”" reordenada e a matriz 35 V[k]” reordenada. A unidade de compensação de energia 38 também pode identificar a RMS para cada fileira e/ou coluna de um ou mais dentre os canais de primeiro plano selecionados, que podem incluir os sinais de nFG 49 e os vetores 511 V[k] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida. A RMS para cada fileira e/ou coluna da uma ou mais dentre a matriz 33 U.S.[k]" reordenada e a matriz V[kKk]'! reordenada pode ser armazenada para um vetor denotado RMSruirr, enquanto a RMS para cada fileira e/ou coluna de um ou mais dentre os sinais de nFG 49, o vetores 511 V[k] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida podem ser armazenadas para um vetor denotado RMSgrreDuceD” A unidade de compensação de energia 38 pode, em seguida, computar um vetor de valor de amplificação Z, de acordo com a equação a seguir: 2 = RMSruri/RMSgeDucen- A unidade de compensação de energia 38 pode, em seguida, aplicar esse vetor de valor de amplificação Z ou várias porções do mesmo a um ou mais dos sinais de nFG 49, os vetores 511 V[k] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida. Em algumas ocorrências, o vetor de valor de amplificação Z2 é aplicado apenas aos coeficientes de HOA ambientes 47 de ordem reduzida pela equação a seguir HOAgc-reD *P HOAgc REDZ em que HOAgc-gep denota os coeficientes de HOA ambientes 47 de ordem reduzida, HOAzc-rgep' denota a energia compensada, os coeficientes de HOA ambientes 47' reduzidos e ZT denota a transposta do vetor Z.
[0226] [0214]. Em alguns exemplos, para determinar cada RMS de respectivas fileiras e/ou colunas de uma ou mais dentre a matriz 33 U.S.[k]”" reordenada, a matriz 35 V[k]” reordenada, os sinais de nFG 49, os vetores 51kK VIK] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida, a unidade de compensação de energia 38 podem, primeiramente, aplicar um renderizador de coeficientes harmônicos esféricos de referência (SHC) às colunas. A aplicação do renderizador de SHC de referência através da unidade de compensação de energia 38 permite a determinação de RMS no domínio de SHC para determinar a energia do campo sonoro geral descrita através de cada fileira e/ou coluna do quadro representado através de fileiras e/ou colunas de uma ou mais dentre a matriz 33' XJIS[k] reordenada, a matriz 35 V[k]” reordenada, os sinais de nFG 49, os vetores 511 V[k] de primeiro plano e os coeficientes de HOA ambientes 47 de ordem reduzida conforme descrito em maiores detalhes abaixo.
[0227] A unidade de interpolação espaço temporal 50 pode representar uma unidade configurada para receber os vetores 5 V[k] de primeiro plano para o k'-ésimo quadro e os vetores 51, V[k-1] de primeiro plano para o quadro anterior (por isso a notação k-l1) e realizar uma interpolação espaço-temporal para gerar vetores V[k] de primeiro plano interpolados. A unidade de interpolação espaço-temporal 50 pode recombinar os sinais de nFG 49 com os vetores 51, V[k] de primeiro plano para recuperar os coeficientes de HOA de primeiro plano reordenados. A unidade de interpolação espaço-temporal 50 pode, em seguida, dividir os coeficientes de HOA de primeiro plano reordenados através dos vetores V[k] interpolados para gerar sinais de nFG 49' interpolados. A unidade de interpolação espaço-temporal 50 também pode emitir aqueles dentre os vetores 511 V[k] de primeiro plano que foram usados para gerar os vetores V[k] de primeiro plano interpolados, de modo que um dispositivo de decodificação de áudio, tal como o dispositivo de decodificação de áudio 24, possa gerar os vetores VÍ[k) de primeiro plano interpolados e, assim, recuperar os vetores 51, V[k] de primeiro plano. Aqueles dos vetores 51, VI[IKk] de primeiro plano usados para gerar os vetores V[k] de primeiro plano interpolados são denotados como o restante dos vetores 53 VIKk] de primeiro plano. A fim de assegurar que os mesmos VIK] e V[Kk-1] sejam usados no codificador e decodificador, (para criar os vetores V[k] interpolados) versões quantizadas/desquantizadas dos mesmos podem ser usadas no codificador e decodificador.
[0228] Nesse aspecto, a unidade de interpolação espaço-temporal 50 pode representar uma unidade que interpola uma primeira porção de um primeiro quadro de áudio a partir de algumas outras porções do primeiro quadro de áudio e um segundo quadro de áudio temporalmente subsequente ou anterior. Em alguns exemplos, as porções podem ser denotadas como subquadros, em que a interpolação conforme realizada em relação aos subquadros é descrita em maiores detalhes abaixo em relação às Figuras 45 a 46E. Em outros exemplos, a unidade de interpolação espaço-temporal 50 pode operar em relação a uma certa última quantidade de amostras do quadro anterior e uma certa primeira quantidade de amostras do quadro subsequente, conforme descrito em maiores detalhes em relação às Figuras 37 a 39. A unidade de interpolação espaço-temporal 50 pode, durante a realização de tal interpolação, reduzir a quantidade de amostras dos vetores VIKk] de primeiro plano que precisam ser especificadas no fluxo de bits 21, devido ao fato de que apenas aqueles dentre os vetores 51, V[Ik] de primeiro plano que são usados para gerar os vetores V[k] interpolados representam um subconjunto dos vetores 51, V[kKk] de primeiro plano. Ou seja, a fim de tornar a compressão dos coeficientes de HOA 11 potencialmente mais eficaz (reduzindo-se a quantidade dos vetores 51x V[k] de primeiro plano que são especificados no fluxo de bits 21), vários aspectos das técnicas descritas na presente revelação podem fornecer a interpolação de uma ou mais porções do primeiro quadro de áudio, em que cada uma das porções pode representar versões decompostas dos coeficientes de HOA 11.
[0229] A interpolação espaço-temporal pode resultar em diversos benefícios. Primeiro, os sinais de nFG 49 podem não ser contínuos de quadro para quadro devido à natureza de bloco em que a SVD ou outra LIT é realizada. Em outras palavras, visto que a unidade de LIT 30 aplica a SVD a uma base de quadro por quadro, determinadas descontinuidades podem existir nos coeficientes de HOA transformados resultantes como evidência, por exemplo, pela natureza não ordenada da matriz 33 U.S.[k] e da matriz 35 VIK]. Realizando-se essa interpolação, a descontinuidade pode ser reduzida, visto que a interpolação pode ter um efeito de suavização que reduz, potencialmente, quaisquer artefatos introduzidos devido aos limites de quadro (ou, em outras palavras, segmentação dos coeficientes de HOA 11 de modo a formar quadros). Usar os vetores 51º, VIk] de primeiro plano para realizar essa interpolação e, em seguida, gerar os sinais de nFG 49' interpolados com base nos vetores V[k] 51, de primeiro plano interpolados a partir dos coeficientes de HOA reordenados recuperados pode suavizar pelo menos alguns dos efeitos devido à operação de quadro por quadro, assim como devido à reordenação dos sinais de nFG 49.
[0230] Durante a operação, a unidade de interpolação espaço-temporal 50 pode interpolar um ou mais subquadros de um primeiro quadro de áudio a partir de uma primeira decomposição, por exemplo, os vetores 5 V[k] de primeiro plano, de uma porção de uma primeira pluralidade dos coeficientes de HOA 11 incluídos no primeiro quadro e uma segunda decomposição, por exemplo, vetores 51x: V[IKk] de primeiro plano, de uma porção de uma segunda pluralidade dos coeficientes de HOA 11 incluídos em um segundo quadro para gerar os coeficientes harmônicos esféricos interpolados decompostos para o um ou mais subquadros.
[0231] Em alguns exemplos, a primeira decomposição compreende os primeiros vetores 51, V[k] de primeiro plano representativos de vetores singulares à direita da porção dos coeficientes de HOA 11. De modo semelhante, a segunda decomposição compreende os segundos vetores 51, V[k] de primeiro plano representativos de vetores singulares à direita da porção dos coeficientes de
HOA 11.
[0232] Em outras palavras, o áudio em 3D com base harmônica esférica pode ser uma representação paramétrica do campo de pressão em 3D em termos de funções de base ortogonal em uma esfera. Quanto maior for a ordem N da representação, potencialmente maior será a resolução espacial e, frequentemente, maior será a quantidade de coeficientes harmônicos esféricos (SH) (para um total de (N+1)? coeficientes). Para muitas aplicações, uma compressão de largura de banda dos coeficientes pode ser necessária para que se possa transmitir e armazenar os coeficientes de modo eficaz. Essas técnicas direcionadas na presente revelação podem fornecer um processo de redução de dimensionalidade com base com quadro com o uso de Decomposição de Valor Singular (SVD). A análise de SVD pode decompor cada quadro de coeficientes em três matrizes U, S e V. Em alguns exemplos, as técnicas podem manipular alguns dos vetores na matriz U.S.[k], como os componentes de primeiro plano do campo sonoro subjacente. Entretanto, quando manipulados de tal maneira, esses vetores (na matriz S[k] U) são descontínuos de quadro para quadro - embora os mesmos representem o mesmo componente de áudio distinto. Tais descontinuidades podem levar a artefatos significativos quando os componentes são alimentados através de codificadores de áudio de transformada.
[0233] As técnicas descritas na presente revelação podem solucionar essa descontinuidade. Ou seja, as técnicas podem ter por base a observação de que a matriz V pode ser interpretada como eixos espaciais ortogonais no domínio Harmônico Espacial. A matriz U[k] pode representar uma projeção dos dados Harmônicos Esféricos (HOA) nos termos de tais funções de base, em que a descontinuidade pode ser atribuída a eixos geométricos espaciais ortogonais
(VIK]) que são alterados em todos os quadros - e são, portanto, descontínuos em si. Isso é diferente de uma decomposição similar, tal como a Transformada de Fourier, em que as funções de base são, em alguns exemplos, constantes de quadro para quadro. Nesses termos, a SVD pode ser considerada como um algoritmo de busca de compatibilidade. As técnicas descritas na presente revelação possibilitam que a unidade de interpolação espaço-temporal 50 mantenha a continuidade entre as funções de base (V[kK]) de quadro para quadro - através da interpolação entre os mesmos.
[0234] Conforme observado acima, a interpolação pode ser realizada em relação às amostras. Esse caso é generalizado na descrição acima quando os subquadros compreendem um único conjunto de amostras. Tanto no caso de interpolação sobre as amostras quanto sobre os subquadros, a operação de interpolação pode assumir a forma da equação a seguir: TVD = w(Dv(k) + (1 - w(D)v(k —-1).
[0235] Nessa equação acima, a interpolação pode ser realizada em relação ao único V-vetor v (k) a partir do único V-vetor ví(k- 1) que, em uma modalidade, poderia representar V-vetores dos quadros adjacentes k e k-
1. Na equação acima, /, representa a resolução através da qual a interpolação é executada, em que / pode indicar uma amostra de número inteiro e / = 1, T (em que T é o comprimento de amostras através das quais a interpolação é executada e através das quais os vetores interpolados emitidos, 7) são necessários e também indica que a saída de tal processo produz / de tais vetores). Alternativamente, / pode indicar subquadros que consistem em múltiplas amostras. Quando, por exemplo, um quadro é dividido em quatro subquadros, / pode compreender valores de 1, 2, 3 e 4, para cada um dos subquadros. O valor de / pode ser sinalizado como um campo denominado “CodedSpatiallnterpolationTime” através de um fluxo de bits - de modo que a operação de interpolação possa ser replicada no decodificador. A w(Z) pode compreender valores das ponderações de interpolação. Quando a interpolação é linear, w(7) pode variar linearmente e monotonicamente entre 0 e 1, como uma função de /. Em outros casos, w(Z) pode variar entre O e 1 de uma maneira não linear, porém, monotônica (tal como um quarto de ciclo de um cosseno elevado) como uma função de /. A função, w(Z), pode ser indexada entre algumas diferentes possibilidades de funções e sinalizada no fluxo de bits como um campo denominado “SpatiallnterpolationMethod” de modo que a operação de interpolação idêntica possa ser replicada pelo decodificador. Quando w(Z) é um valor próximo de O, a saída, 7O pode ser altamente ponderada ou influenciada por v(k- 1). Enquanto quando w(Z) é um valor próximo de 1, isso assegura que a saída, vO, seja altamente ponderada ou influenciada por v(k- 1).
[0236] A unidade de redução de coeficiente 46 pode representar uma unidade configurada para realizar redução de coeficiente em relação aos vetores 53 V[k] de primeiro plano restantes com base nas informações de canal de segundo plano 43 para emitir vetores 55 V[k] de primeiro plano reduzidos para a unidade de quantização 52. Os vetores 55 V[k] de primeiro plano reduzidos podem ter dimensões D: [(N+1)?º - (Nxctl)º-Nxca]l x nFG.
[0237] A unidade de redução de coeficiente 46 pode, nesse aspecto, representar uma unidade configurada para reduzir a quantidade de coeficientes dos vetores 53
VIK] de primeiro plano restantes. Em outras palavras, a unidade de redução de coeficiente 46 pode representar uma unidade configurada para eliminar os coeficientes dos vetores V[k] de primeiro plano(que formam os vetores 53 VIK] de primeiro plano restantes) que têm pouca ou nenhuma informação direcional. Conforme descrito acima, em alguns exemplos, os coeficientes dos vetores V[k] distintos ou, em outras palavras, vetores V[k] de primeiro plano correspondentes a funções de base de primeira ordem e ordem zero (que podem ser denotadas como Nxc) fornecem poucas informações direcionais e, portanto, podem ser removidos dos vetores V de primeiro plano (através de um processo que pode ser chamado de “redução de coeficiente”). Nesse exemplo, uma maior flexibilidade pode ser fornecida, não apenas para identificar tais coeficientes que correspondem a Nxg, Mas para identificar canais de HOA adicionais (que podem ser chamados de TotaloOfAddAmbHOAChan variável) a partir do conjunto de [ (Negetl)? +1, (N+1)?]. A unidade de análise de campo sonoro 44 pode analisar os coeficientes de HOA 11 para determinar BGTOT, o que pode identificar, não apenas a (Neget1)?, mas o TotaloOfAddaAmbHOAChan, que pode ser chamado, coletivamente, de as informações de canal de segundo plano 43. A unidade de redução de coeficiente 46 pode, em seguida, remover os coeficientes correspondentes a (Nget+1)? e o TotalOfAddambHOAChan dos vetores 53 V[k] de primeiro plano restantes para gerar uma matriz 55 dimensional V[k] menor de tamanho ((N+1)? - (BGror) x nFG, que também pode ser denominada como os vetores 55 V[k] de primeiro plano.
[0238] A unidade de quantização 52 pode representar uma unidade configurada para realizar qualquer forma de quantização para comprimir os vetores 55 V[k] de primeiro plano reduzidos para gerar vetores 57 V[k] de primeiro plano codificados, de modo a emitir tais vetores 57 VIK] de primeiro plano codificados para a unidade de geração de fluxo de bits 42. Durante a operação, a unidade de quantização 52 pode representar uma unidade configurada para comprimir um componente espacial do campo sonoro, isso é, um ou mais dos vetores 55 V[k] de primeiro plano reduzidos no presente exemplo. Com propósitos de exemplo, presume-se que os vetores 55 V[k] de primeiro plano reduzidos incluem duas fileiras de vetores que têm, como um resultado da redução de coeficiente, menos do que 25 elementos, cada, (o que implica uma representação de HOA de quarta ordem do campo sonoro). Embora esteja descrito em relação a vetores de duas fileiras, qualquer quantidade de vetores pode ser incluída nos vetores 55 V[k] de primeiro plano reduzidos até (N+1)?, em que n denota a ordem da representação de HOA do campo sonoro. Ademais, embora esteja descrito abaixo de modo a realizar uma quantização de escala e/ou de entropia, a unidade de quantização 52 pode realizar qualquer forma de quantização que resulte na compressão dos vetores 55 V[k] de primeiro plano reduzidos.
[0239] A unidade de quantização 52 pode receber os vetores 55 V[k] de primeiro plano reduzidos e realizar um esquema de compressão para gerar vetores 57 VIK] de primeiro plano codificados. Esse esquema de compressão pode envolver qualquer esquema de compressão concebível para comprimir elementos de um vetor ou dados genericamente e não deve ser limitado ao exemplo descrito abaixo em maiores detalhes. A unidade de quantização 52 pode realizar, como um exemplo, um esquema de compressão que inclui um ou mais dentre: transformar representações de ponto flutuante de cada elemento dos vetores 55 V[k] de primeiro plano reduzidos em representações de número inteiro de cada elemento dos vetores 55 V[k] de primeiro plano reduzidos, quantização uniforme das representações de número inteiro dos vetores 55 V[k] de primeiro plano reduzidos e categorização e codificação das representações de número inteiro quantizadas dos vetores 55 V[k] de primeiro plano restantes.
[0240] Em alguns exemplos, vários dentre o um ou mais processos do presente esquema de compressão podem ser dinamicamente controlados através de parâmetros para alcançar ou aproximadamente alcançar, como um exemplo, uma taxa-alvo de bits para o fluxo de bits 21 resultante. Visto que cada um dos vetores 55 V[k] de primeiro plano reduzidos é ortonormal em relação aos outros, cada um dentre os vetores 55 V[k] de primeiro plano reduzidos pode ser codificado independentemente. Em alguns exemplos, conforme descrito em maiores detalhes abaixo, cada elemento de cada um dos vetores 55 V[k] de primeiro plano reduzidos pode ser codificado com o uso do mesmo modo de codificação (definido através de vários submodos) .
[0241] De qualquer forma, conforme observado acima, esse esquema de codificação pode, primeiramente, envolver a transformação das representações de ponto flutuante de cada elemento (que é, em alguns exemplos, um número de ponto flutuante de 32 bits) de cada um dos vetores 55 V[k] de primeiro plano reduzidos para uma representação de número inteiro de 16 bits. A unidade de quantização 52 pode realizar essa transformação de ponto flutuante para número inteiro multiplicando-se cada elemento de um específico dentre os vetores 55 V[k] de primeiro plano reduzidos por 2”, que é, em alguns exemplos, realizado através de um deslocamento à direita por 15.
[0242] A unidade de quantização 52 pode, em seguida, realizar a quantização uniforme em relação a todos os elementos do específico dentre os vetores 55 V[k] de primeiro plano reduzidos. A unidade de quantização 52 pode identificar um tamanho de etapa de quantização com base em um valor, que pode ser denotado com um parâmetro de nbits. A unidade de quantização 52 pode determinar dinamicamente esse parâmetro de nbits com base na taxa-alvo de bits 41. A unidade de quantização 52 pode determinar o tamanho de etapa de quantização como uma função de tal parâmetro de nbits. Como um exemplo, a unidade de quantização 52 pode determinar o tamanho de etapa de quantização (denotado como “delta” ou “A” na presente revelação) como igual a 26 its, Nesse exemplo, se nbits for igual a seis, delta é igual a 210 e há 26 níveis de quantização. Nesse aspecto, para um elemento de vetor v, o elemento de vetor quantizado vq é igual a [V/A] e -2”* < vq < 27H,
[0243] A unidade de quantização 52 pode, em seguida, realizar a categorização e codificação residual dos elementos de vetor quantizados. Como um exemplo, a unidade de quantização 52 pode, para um determinado elemento de vetor quantizado vq, identificar uma categoria (determinando-se um cid identificador de categoria) à qual esse elemento corresponde com o uso da equação a seguir: 0, ifvç=0 tid= togutval + x ifvçF0
[0244] A unidade de quantização 52 pode, então, usar o código de Huffman nesse cid de índice de categoria, enquanto também identifica um bit de sinal que indica se vq é um valor positivo ou um valor negativo. A unidade de quantização 52 pode, em seguida, identificar um resíduo nessa categoria. Como um exemplo, a unidade de quantização 52 pode determinar esse resíduo de acordo com a equação a seguir:
resíduo = val — 2041
[0245] A unidade de quantização 52 pode, então, codificar em bloco esse resíduo com cid-l bits.
[0246] O exemplo a seguir ilustra um exemplo simplificado desse processo de categorização e codificação residual. Primeiramente, presume-se que nbits seja igual a seis, de modo que vq [-31,31]. Em seguida, presume-se o seguinte: Hu ffman có id digo para cid de A o -1, 1 1 | ES NE —7,-6,-5,- “o 4, 4,5,6,7 010" —-15,-15,.,= o 8, 8,.., 14,15 0110” —-31,-30,.,- o 16, 16,..,30,31 0111
[0247] Além disso, presume-se o seguinte: Código em Bloco para id Resíduo
O do tt de=
011.010.001.000, at 0111,0110..,0000,
PSA O01111,..,00000,
AZ
[0248] Assim, para um v, = [6, -17, O, O, 3], o seguinte pode ser determinado:
[0249] » cid = 3,5,0,0,2
[0250] » sinal = 1,0,x,Xx,1
[0251] » resíduo = 2,1,x,x, 1
[0252] » Bits para 6 = *0010” + 1 * + * 10º
[0253] » Bits para -17 = *00111 * + “O! + *0001*
[0254] » Bits para 0 = “0
[0255] » Bits para 0 = *“0'
[0256] » Bits para 3 = *000” + *1 *+ * 1
[0257] » Bits totais = 7 + 10+ 1 + 1 +5 = 24
[0258] » Bits médios = 24/5 = 4,8 Embora não mostrado no exemplo simplificado supracitado, a unidade de quantização 52 pode selecionar diferentes livros de códigos de Huffman para diferentes valores de nbits durante a codificação do cid. Em alguns exemplos, a unidade de quantização 52 pode fornecer uma tabela de codificação de Huffman diferente para valores de nbits 6,..., 15. Além disso, a unidade de quantização 52 pode incluir cinco livros de códigos de Huffman diferentes para cada um dos diferentes valores de nbits na faixa de 6,...15 para um total de 50 livros de códigos de Huffman. Nesse aspecto, a unidade de quantização 52 pode incluir uma pluralidade de diferentes livros de códigos de Huffman para acomodar a codificação do cid em diversos contextos estatísticos diferentes.
[0259] Para ilustrar, a unidade de quantização 52 pode, para cada um dos valores de nbits, incluir um primeiro livro de códigos de Huffman para codificar os elementos de vetor de um a quatro, um segundo livro de códigos de Huffman para codificar os elementos de vetor de cinco a nove, um terceiro livro de códigos de Huffman para codificar os elementos de vetor de nove em diante. Esses primeiros três livros de códigos de Hufífman podem ser usados quando um dentre os vetores 55 V[k] de primeiro plano reduzidos a serem comprimidos não for previsto a partir de um dos vetores 55 V[k] de primeiro plano reduzidos correspondentes temporalmente subsequentes e não for representativo de informações espaciais de um objeto de áudio sintético (um definido, por exemplo, originalmente por um objeto de áudio modulado por código de pulso (PCM)). A unidade de quantização 52 pode incluir adicionalmente, para cada um dos valores de nbits, um quarto livro de códigos de Huffman para codificar um dentre os vetores 55 VIKk] de primeiro plano reduzidos quando o mesmo dentre os vetores 55 V[k] de primeiro plano reduzidos for previsto a partir de um dos vetores 55 V[k] de primeiro plano reduzidos correspondente temporalmente subsequente. A unidade de quantização 52 também pode incluir, para cada um dos valores de nbits, um quinto livro de códigos de Huffman para codificar o um dentre os vetores 55 V[k] de primeiro plano reduzidos quando o mesmo dentre os vetores 55 V[k] de primeiro plano reduzidos for representativo de um objeto de áudio sintético. Os vários livros de códigos de Huffman podem ser desenvolvidos para cada um desses diferentes contextos estatísticos, isso é, o contexto não previsto e não sintético, o contexto previsto e o contexto sintético nesse exemplo.
[0260] A tabela a seguir ilustra a seleção de tabela de Huffman e os bits a serem especificados no fluxo de bits para permitir que a unidade de descompressão selecione a tabela de Huffman apropriada: Modo de tnfo. de Tabela de HT LS E penes Lo pq o | ns | Eee Fa a
[0261] Na tabela supracitada, o modo de previsão (“Modo de prev”) indica se a previsão foi realizada para o vetor atual, enquanto a Tabela de Huffman (“info de HT”) indica as informações de livro de códigos (ou tabela) de Huffman adicionais usadas para selecionar uma dentre as tabelas de Huffman de um a cinco.
[0262] A tabela a seguir ilustra adicionalmente esse processo de seleção de tabela de Huffman — considerando-se vários contextos ou cenários estatísticos.
[assisto [sintético]
[0263] Na tabela supracitada, a coluna “Registro” indica o contexto de codificação quando o vetor é representativo de um objeto de áudio que foi registrado enquanto a coluna “Sintético” indica um contexto de codificação para quando o vetor é representativo de um objeto de áudio sintético. A fileira “Sem Previsão” indica o contexto de codificação quando a previsão não é realizada em relação aos elementos de vetor, enquanto a fileira “Com previsão” indica o contexto de codificação quando a previsão é realizada em relação aos elementos de vetor. Conforme mostrado nessa tabela, a unidade de quantização 52 seleciona HT(1, 2, 3) quando o vetor é representativo de um objeto de áudio registrado e a previsão não é realizada em relação aos elementos de vetor. A unidade de quantização 52 seleciona HT5 quando o objeto de áudio é representativo de um objeto de áudio sintético e a previsão não é realizada em relação aos elementos de vetor. A unidade de quantização 52 seleciona HT4 quando o vetor é representante de um objeto de áudio registrado e a previsão é realizada em relação aos elementos de vetor. A unidade de quantização 52 seleciona HT5 quando o objeto de áudio é representativo de um objeto de áudio sintético e a previsão é realizada em relação aos elementos de vetor.
[0264] Nesse aspecto, a unidade de quantização 52 pode realizar a quantização de escala e/ou codificação de Huffman observadas acima para comprimir os vetores 55 VIK] de primeiro plano reduzidos, de modo a emitir os vetores 57 V[k] de primeiro plano codificados, que podem ser chamados de informações de canal auxiliar 57. Essas informações de canal auxiliar 57 podem incluir elementos de sintaxe usados para codificar os vetores 55 V[k] de primeiro plano restantes. A unidade de quantização 52 pode emitir as informações de canal auxiliar 57 de uma maneira similar à mostrada no exemplo de uma das Figuras 10B e 10c.
[0265] Conforme observado acima, a unidade de quantização 52 pode gerar elementos de sintaxe para as informações de canal auxiliar 57. Por exemplo, a unidade de quantização 52 pode especificar um elemento de sintaxe em um cabeçalho de uma unidade de acesso (que pode incluir um ou mais quadros) que denota qual dentre a pluralidade de modos de configuração foi selecionado. Embora seja descrito como especificado a uma base por unidade de acesso, a unidade de quantização 52 pode especificar esse elemento de sintaxe a uma base por quadro ou qualquer outra base periódica ou base não periódica (tal como uma vez para todo o fluxo de bits). De qualquer forma, esse elemento de sintaxe pode compreender dois bits que indicam qual dos modos de configuração de quadro foram selecionados para especificar o conjunto de coeficientes diferente de zero dos vetores 55 V[k] de primeiro plano reduzidos para representar os aspectos “direcionais desse componente distinto. O elemento de sintaxe pode ser denotado como “codedVVecLength”. Dessa maneira, a unidade de quantização 52 pode sinalizar ou, de outro modo, especificar no fluxo de bits quais dos modos de configuração de quadro foram usados para especificar os vetores 57 V[k] de primeiro plano codificados no fluxo de bits. Embora seja descrito em relação aos modos de configuração de quadro, as técnicas não devem ser limitadas a modos de configuração de quadro, mas a qualquer outra quantidade de modos de configuração, inclusive um único modo de configuração ou uma pluralidade de modos de configuração. A unidade de quantização de escala/de entropia 53 também pode especificar a sinalização 63 como outro elemento de sintaxe nas informações de canal auxiliar 57.
[0266] A unidade de codificador de áudio psicoacústico 40 incluída no dispositivo de codificação de áudio 20 pode representar múltiplos casos de um codificador de áudio psicoacústico, cada um dos quais é usado para codificar um objeto de áudio ou canal de HOA diferente de cada um dos coeficientes de HOA 47' ambientes de energia compensada e os sinais de nFG 49' interpolados para gerar coeficientes de HOA ambientes 59 codificados e sinais de nFG 61 codificados. A unidade de codificador de áudio psicoacústico 40 pode emitir os coeficientes de HOA ambientes 59 codificados e os sinais de nFG 61 codificados para a unidade de geração de fluxo de bits 42.
[0267] Em algumas ocorrências, essa unidade de codificador de áudio psicoacústico 40 pode representar um ou mais casos de uma unidade de criptografia de codificação de áudio (AAC) avançada. A unidade de codificador de áudio psicoacústico 40 pode codificar cada coluna ou fileira dos coeficientes de HOA ambientes 47' de energia compensada e os sinais de nFG 49' interpolados. Frequentemente, a unidade de codificador de áudio psicoacústico 40 pode invocar uma instância de uma unidade de criptografia de AAC para cada uma dentre as combinações de ordem/subordem restantes nos coeficientes de HOA ambientes 47' de energia compensada e os sinais de nFG 49" interpolados. Mais informações a respeito de como os coeficientes harmônicos esféricos de segundo plano 31 podem ser codificados com o uso de uma unidade de criptografia de AAC podem ser encontradas em um trabalho de convenção por Eric Hellerud, et al, intitulado “Encoding Higher Order Ambisonics with AAC”, apresentado na 124-ésima Convenção, em maio de 2008 17 a 20 e disponível em: http://ro.uow.edu.au/cgi/viewcontent.cgi?article=8025&conte xt=engpapers. Em algumas ocorrências, a unidade de criptografia de áudio 14 pode codificar o áudio dos coeficientes de HOA ambientes 47" de energia compensada com o uso de uma taxa-alvo de bits inferior à usada para codificar os sinais de nFG 49' interpolados, potencialmente comprimindo mais assim, os coeficientes de HOA ambientes 47" de energia compensada em comparação com os sinais de nFG 49" interpolados. [0240] A unidade de geração de fluxo de bits 42 incluída no dispositivo de codificação de áudio representa uma unidade que formata dados para estar em conformidade com um formato conhecido (que pode se referir a um formato conhecido por um dispositivo de decodificação), de modo a gerar, assim, o fluxo de bits 21 com base em vetor. A unidade de geração de fluxo de bits 42 pode representar um multiplexador em alguns exemplos, que pode receber os vetores 57 VÍ[k) de primeiro plano codificados, os coeficientes de HOA ambientes 59 codificados, os sinais de nFG 61 codificados e as informações de canal de segundo plano 43. A unidade de geração de fluxo de bits 42 pode, em seguida, gerar um fluxo de bits 21 com base nos vetores 57 V[k] de primeiro plano codificados, nos coeficientes de HOA ambientes 59 codificados, nos sinais de nFG 61 codificados e nas informações de canal de segundo plano 43. O fluxo de bits 21 pode incluir um fluxo de bits primário ou principal e um ou mais fluxos de bits de canal auxiliar.
[0268] Embora não seja mostrado no exemplo da Figura 4, o dispositivo de codificação de áudio 20 também pode incluir uma unidade de saída de fluxo de bits que comuta a saída de fluxo de bits do dispositivo de codificação de áudio 20 (por exemplo, entre o fluxo de bits com base direcional 21 e o fluxo de bits 21 com base em vetor) com base na possibilidade de um quadro atual precisar ser codificado com o uso de síntese com base direcional ou de síntese com base em vetor. Essa unidade de saída de fluxo de bits pode realizar essa comutação com base na saída de elemento de sintaxe através da unidade de análise de conteúdo 26 que indica se uma síntese com base direcional foi realizada (como um resultado da detecção de que os coeficientes de HOA 11 foram gerados a partir de um objeto de áudio sintético) ou uma síntese com base em vetor foi realizada (como um resultado da detecção de que os coeficientes de HOA foram registrados). A unidade de saída de fluxo de bits pode especificar a sintaxe de cabeçalho correta para indicar essa comutação ou codificação atual usada para o quadro atual juntamente com o respectivo dentre os fluxos de bits 21.
[0269] Em algumas ocorrências, vários aspectos das técnicas também possibilitam que o dispositivo de codificação de áudio 20 determine se os coeficientes de HOA 11 são gerados a partir de um objeto de áudio sintético. Tais aspectos das técnicas possibilitam que o dispositivo de codificação de áudio 20 seja configurado para obter uma indicação da possibilidade de os coeficientes harmônicos esféricos representativos de um campo sonoro serem gerados a partir de um objeto de áudio sintético.
[0270] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para determinar se os coeficientes harmônicos esféricos são gerados a partir do objeto de áudio sintético.
[0271] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para excluir um primeiro vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos representativos do campo sonoro para obter uma matriz de coeficiente harmônico esférico com quadro reduzida.
[0272] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para excluir um primeiro vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos representativos do campo sonoro para obter uma matriz de coeficiente harmônico esférico com quadro reduzida e prever um vetor da matriz de coeficiente harmônico esférico com quadro reduzida com base nos vetores restantes da matriz de coeficiente harmônico esférico com quadro reduzida.
[0273] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para excluir um primeiro vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos representativos do campo sonoro para obter uma matriz de coeficiente harmônico esférico com quadro reduzida e prever um vetor da matriz de coeficiente harmônico esférico com quadro reduzida com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro reduzida.
[0274] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para prever um vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro.
[0275] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para prever um vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro e computar um erro com base no vetor previsto.
[0276] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para prever um vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro e computar um erro com base no vetor previsto e o vetor correspondente da matriz de coeficiente harmônico esférico com quadro.
[0277] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para prever um vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro e computar um erro como um soma do valor absoluto da diferença do vetor previsto e o vetor correspondente da matriz de coeficiente harmônico esférico com quadro.
[0278] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para prever um vetor de uma matriz de coeficiente harmônico esférico com quadro que armazena pelo menos uma porção dos coeficientes harmônicos esféricos com base, pelo menos em parte, em uma soma dos vetores restantes da matriz de coeficiente harmônico esférico com quadro, computar um erro com base no vetor previsto e no vetor correspondente da matriz de coeficiente harmônico esférico com quadro, computar uma razão com base em uma energia do vetor correspondente da matriz de coeficiente harmônico esférico com quadro e o erro e comparar a razão com um limiar para determinar se os coeficientes harmônicos esféricos representativos do campo sonoro são gerados a partir do objeto de áudio sintético.
[0279] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para especificar a indicação em um fluxo de bits 21 que armazena uma versão comprimida dos coeficientes harmônicos esféricos.
[0280] Em algumas ocorrências, as várias técnicas possibilitam que o dispositivo de codificação de áudio 20 realize uma transformação em relação aos coeficientes de HOA 11. Nesses e em outros casos, o dispositivo de codificação de áudio 20 pode ser configurado para obter um ou mais primeiros vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que descrevem os componentes de segundo plano do campo sonoro, tanto os um ou mais primeiros vetores quanto os um ou mais segundos vetores gerados pelo menos desempenhando-se uma transformação em relação à pluralidade de coeficientes harmônicos esféricos 11.
[0281] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que a transformação compreende uma decomposição de valor singular que gera uma matriz U representativa dos vetores singulares à esquerda da pluralidade de coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos 11.
[0282] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que o um ou mais primeiros vetores compreendem um ou mais vetores VUprisrt * SprsT codificados por áudio que, antes da codificação de áudio, foram gerados multiplicando-se um ou mais vetores Sprst codificado por áudio de uma matriz U através de um ou mais vetores Spisr de uma matriz S e em que a matriz U e a matriz S são geradas pelo menos realizando-se a decomposição de valor singular em relação à pluralidade de coeficientes harmônicos esféricos.
[0283] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que o um ou mais primeiros vetores compreendem um ou mais vetores Uprst * SpisT codificado por áudio que, antes da codificação de áudio, foram gerados multiplicando-se um ou mais vetores Uprst codificado por áudio de uma matriz U através de um ou mais vetores Sprsr codificado por áudio de uma matriz S e um ou mais vetores V'p1sr de uma transformada de uma matriz V e em que a matriz U e a matriz S e a matriz V são geradas pelo menos realizando-se a decomposição de valor singular em relação à pluralidade de coeficientes harmônicos esféricos
11.
[0284] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que o um ou mais primeiros vetores compreendem um ou mais vetores Upnrst * Spist que, antes da codificação de áudio, foram gerados multiplicando- se um ou mais vetores Uprsr codificado por áudio de uma matriz U através de um ou mais vetores Spis,7 de uma matriz S e um ou mais vetores VTp1sT de uma transformada de uma matriz V, em que a matriz U, a matriz S e a matriz V foram geradas pelo menos realizando-se a decomposição de valor singular em relação à pluralidade de coeficientes harmônicos esféricos e em que o dispositivo de codificação de áudio 20 é adicionalmente configurado para obter um valor D que indica a quantidade de vetores a serem extraídos de um fluxo de bits para formar o um ou mais vetores Upisrt * Spist E O UM OU Mais vetores DIST.
[0285] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que o um ou mais primeiros vetores compreendem um ou mais vetores Upist * Sprst que, antes da codificação de áudio, foram gerados multiplicando- se um ou mais vetores Uprsr codificado por áudio de uma matriz U através de um ou mais vetores Spwist de uma matriz S e um ou mais vetores ViprsT de uma transformada de uma matriz V, em que a matriz U, a matriz S e a matriz V foram geradas pelo menos realizando-se a decomposição de valor singular em relação à pluralidade de coeficientes harmônicos esféricos e em que o dispositivo de codificação de áudio 20 é adicionalmente configurado para obter um valor D que indica, a uma base de quadro de áudio por quadro de áudio, a quantidade de vetores a serem extraídos de um fluxo de bits para formar o um ou mais vetores Upist * Spisr7 E O UM OU Mais vetores Viprst.
[0286] Nesses e em outros casos, o dispositivo de codificação de áudio 20, em que a transformação compreende uma análise de componente principal para identificar os componentes distintos do campo sonoro e os componentes de segundo plano do campo sonoro.
[0287] Vários aspectos das técnicas descritas na presente revelação podem fornecer o dispositivo de codificação de áudio 20 configurado para compensar pelo erro de quantização.
[0288] Em algumas ocorrências, o dispositivo de codificação de áudio 20 pode ser configurado para quantizar um ou mais primeiros vetores representativos de um ou mais componentes de um campo sonoro e compensar o erro introduzido devido à quantização dos um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos dos mesmos um ou mais componentes do campo sonoro.
[0289] Nesses e em outros casos, o dispositivo de codificação de áudio é configurado para quantizar um ou mais vetores a partir de uma transformada de uma matriz V gerada, pelo menos em parte, realizando-se uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro.
[0290] Nesses e em outros casos, o dispositivo de codificação de áudio é adicionalmente configurado para realizar uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos representativos de um campo sonoro para gerar uma matriz U representativa de vetores singulares à esquerda da pluralidade de coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos e configurado para quantizar um ou mais vetores a partir de uma transformada da matriz V.
[0291] Nesses e em outros casos, o dispositivo de codificação de áudio é adicionalmente configurado para realizar uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos representativos de um campo sonoro para gerar uma matriz U representativa de vetores singulares à esquerda da pluralidade de coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos, configurado para quantizar um ou mais vetores a partir da transformada da matriz V e configurado para compensar pelo erro introduzido devido à quantização em um ou mais vetores U * S computados multiplicando-se um ou mais vetores U da matriz U por um ou mais vetores S da matriz S.
[0292] Nesses e em outros casos, o dispositivo de codificação de áudio é adicionalmente configurado para realizar uma decomposição de valor singular em relação à pluralidade de coeficientes harmônicos esféricos representativos de um campo sonoro para gerar uma matriz U representativa de vetores singulares à esquerda da pluralidade de coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos, determinar um ou mais vetores Uprsr da matriz U, em que cada um dos mesmos corresponde a um componente distinto do campo sonoro, determinar um ou mais vetores Sprsr da matriz S, em que cada um dos mesmos corresponde ao mesmo componente distinto do campo sonoro e determinar um ou mais vetores V'prst de uma transformada da matriz V, em que cada um dos mesmos corresponde ao mesmo componente distinto do campo sonoro, configurado para quantizar o um ou mais vetores VT p1sT para gerar um ou mais vetores Vo vIsT e configurado para compensar pelo erro introduzido devido à quantização em um ou mais vetores Upist * Sprsr computados multiplicando- se o um ou mais vetores Ups da matriz U através de ou mais vetores Spisr da matriz S de modo a gerar um ou mais vetores Upist * Spis” de erro compensado.
[0293] Nesses e em outros casos, o dispositivo de codificação de áudio é configurado para determinar coeficientes harmônicos esféricos distintos com base no um ou mais vetores Uprst, em que o um ou mais vetores Spw1s7 € O um ou mais vetores V'p'sr e realizar pseudoinversão em relação aos vetores Vo pIsT para dividir os coeficientes harmônicos esféricos distintos pelo um ou mais vetores
Vo vIST €, assim, gerar um ou mais vetores Ucprist * Scopvist de erro compensado que compensam, pelo menos em parte, pelo erro introduzido através da quantização dos vetores ViprsT.
[0294] Nesses e em outros casos, o dispositivo de codificação de áudio é adicionalmente configurado para realizar uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos representativos de um campo sonoro para gerar uma matriz U representativa de vetores singulares à esquerda da pluralidade de coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos, determinar um ou mais vetores Uxzxg da matriz U que descrevem um ou mais componentes de segundo plano do campo sonoro e um ou mais vetores Uprsr da matriz U que descrevem um ou mais componentes distintos do campo sonoro, determinar um ou mais Sgg vetores da matriz S que descrevem o um ou mais componentes de segundo plano do campo sonoro e um ou mais vetores Spwrsr da matriz S que descrevem o um ou mais componentes distintos do campo sonoro e determinar um ou mais vetores Vi prsT e um ou mais vetores NARA de uma transformada da matriz V, em que os vetores Viprst descrevem o um ou mais componentes distintos do campo sonoro e os V'xc descrevem o um ou mais componentes de segundo plano do campo sonoro, configurado para quantizar o um ou mais vetores V'prsr para gerar um ou mais vetores V'oprst € configurado para compensar pelo erro introduzido devido à quantização em coeficientes harmônicos esféricos de segundo plano formados multiplicando-se o um ou mais vetores Ugrc pelo um ou mais vetores Sgç e, em seguida, pelo um ou mais vetores Vigor de modo a gerar coeficientes harmônicos esféricos de segundo plano de erro compensado.
[0295] Nesses e em outros casos, o dispositivo de codificação de áudio é configurado para determinar o erro com base nos vetores V'prst e um ou mais vetores Uprsr * Spi1st formados multiplicando-se os vetores VUprisr pelos vetores SprsT e adicionar o erro determinado aos coeficientes harmônicos esféricos de segundo plano para gerar os coeficientes harmônicos esféricos de segundo plano de erro compensado.
[0296] Nesses e em outros casos, o dispositivo de codificação de áudio é configurado para compensar pelo erro introduzido devido à quantização do um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos do mesmo um ou mais componentes do campo sonoro para gerar um ou mais segundos vetores de erro compensado e adicionalmente configurado para gerar um fluxo de bits para incluir o um ou mais segundos vetores de erro compensado e o um ou mais primeiros vetores quantizados.
[0297] Nesses e em outros casos, o dispositivo de codificação de áudio é configurado para compensar pelo erro introduzido devido à quantização do um ou mais primeiros vetores em um ou mais segundos vetores que também são representativos do mesmo um ou mais componentes do campo sonoro para gerar um ou mais segundos vetores de erro compensado e adicionalmente configurado para codificar por áudio o um ou mais segundos vetores de erro compensado e gerar um fluxo de bits para incluir o um ou mais segundos vetores de erro compensado codificados por áudio e o um ou mais primeiros vetores quantizados.
[0298] Os vários aspectos das técnicas podem possibilitar adicionalmente que o dispositivo de codificação de áudio 20 gere coeficientes harmônicos esféricos reduzidos ou decomposições dos mesmos. Em algumas ocorrências, o dispositivo de codificação de áudio 20 pode ser configurado para realizar, com base em uma taxa de bit alvo, a redução de ordem em relação a uma pluralidade de coeficientes harmônicos esféricos ou decomposições dos mesmos para gerar coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos, em que a pluralidade de coeficientes harmônicos esféricos representa um campo sonoro.
[0299] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para, antes da realização da redução de ordem, realizar uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos para identificar um ou mais primeiros vetores que descrevem componentes distintos do campo sonoro e um ou mais segundos vetores que identificam componentes de segundo plano do campo sonoro e configurado para realizar a redução de ordem em relação ao um ou mais primeiros vetores, o um ou mais segundos vetores ou o um ou mais primeiros vetores e o um ou mais segundos vetores.
[0300] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para realizar uma análise de conteúdo em relação à pluralidade de coeficientes harmônicos esféricos ou às decomposições dos mesmos e configurado para realizar, com base na taxa-alvo de bits e na análise de conteúdo, a redução de ordem em relação à pluralidade de coeficientes harmônicos esféricos ou às decomposições dos mesmos para gerar os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos.
[0301] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para realizar uma análise espacial em relação à pluralidade de coeficientes harmônicos esféricos ou às decomposições dos mesmos.
[0302] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para realizar uma análise de difusão em relação à pluralidade de coeficientes harmônicos esféricos ou às decomposições dos mesmos.
[0303] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é o um ou mais processadores que são configurados para realizar uma análise espacial e uma análise de difusão em relação à pluralidade de coeficientes harmônicos esféricos ou às decomposições dos mesmos.
[0304] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para especificar uma ou mais ordens e/ou uma ou mais subordens de funções de base esférica às quais aqueles dentre os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos correspondem em um fluxo de bits que inclui os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos.
[0305] Nesses e em outros casos, os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos têm menos valores do que a pluralidade de coeficientes harmônicos esféricos ou as decomposições dos mesmos.
[0306] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para remover aqueles dentre a pluralidade de coeficientes harmônicos esféricos ou vetores das decomposições dos mesmos que têm uma ordem e/ou subordem especificada para gerar os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos.
[0307] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para zerar aqueles dentre a pluralidade de coeficientes harmônicos esféricos ou aqueles vetores da decomposição dos mesmos que têm uma ordem e/ou subordem especificada para gerar os coeficientes harmônicos esféricos reduzidos ou as decomposições reduzidas dos mesmos.
[0308] Vários aspectos das técnicas também podem permitir que o dispositivo de codificação de áudio 20 seja configurado para representar componentes distintos do campo sonoro. Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para obter um primeiro conjunto de coeficientes diferente de zero de um vetor a ser usado para representar um componente distinto de um campo sonoro, em que o vetor é decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro.
[0309] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar o primeiro conjunto diferente de zero dos coeficientes do vetor para incluir todos os coeficientes.
[0310] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar o primeiro conjunto de coeficientes diferente de zero como aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base, à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0311] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar o primeiro conjunto de coeficientes diferente de zero para incluir aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde e excluir pelo menos um dentre os coeficientes que correspondem a uma ordem maior do que a ordem da função de base à qual o um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0312] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar o primeiro conjunto de coeficientes diferente de zero para incluir todos os coeficientes com a exceção de pelo menos um dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base, à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0313] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para especificar o primeiro conjunto diferente de zero dos coeficientes do vetor em informações de canal auxiliar.
[0314] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para especificar o primeiro conjunto diferente de zero dos coeficientes do vetor em informações de canal auxiliar sem codificação de áudio do primeiro conjunto diferente de zero dos coeficientes do vetor.
[0315] Nesses e em outros casos, o vetor compreende um vetor decomposto a partir da pluralidade de coeficientes harmônicos esféricos com o uso de síntese com base em vetor.
[0316] Nesses e em outros casos, a síntese à base de vetor compreende uma decomposição de valor singular.
[0317] Nesses e em outros casos, o vetor compreende um vetor V decomposto a partir da pluralidade de coeficientes harmônicos esféricos com o uso da decomposição de valor singular.
[0318] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para selecionar um dentre uma pluralidade de modos de configuração através do qual especificar o conjunto de coeficientes diferente de zero do vetor e especificar o conjunto diferente de zero dos coeficientes do vetor com base no selecionado dentre a pluralidade de modos de configuração.
[0319] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto diferente de zero dos coeficientes inclui todos os coeficientes.
[0320] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto de coeficientes diferente de zero inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0321] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto diferente de zero dos coeficientes inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde e excluir pelo menos um dentre os coeficientes que correspondem a uma ordem maior do que a ordem da função de base à qual o um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0322] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto de coeficientes diferente de zero inclui todos os coeficientes com a exceção de pelo menos um dos coeficientes.
[0323] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para especificar o selecionado dentre a pluralidade de modos de configuração em um fluxo de bits.
[0324] Vários aspectos das técnicas descritas na presente revelação também permitem que o dispositivo de codificação de áudio 20 seja configurado para representar tal componente distinto do campo sonoro de várias maneiras. Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para obter um primeiro conjunto de coeficientes diferente de zero de um vetor que representa um componente distinto de um campo sonoro, em que o vetor foi decomposto a partir de uma pluralidade de coeficientes harmônicos esféricos que descrevem o campo sonoro.
[0325] Nesses e em outros casos, o primeiro conjunto diferente de zero dos coeficientes inclui todos os coeficientes do vetor.
[0326] Nesses e em outros casos, o primeiro conjunto de coeficientes diferente de zero inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base, à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0327] Nesses e em outros casos, o primeiro conjunto diferente de zero dos coeficientes inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde e excluir pelo menos um dentre os coeficientes que correspondem a uma ordem maior do que a ordem da função de base à qual o um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0328] Nesses e em outros casos, o primeiro conjunto de coeficientes diferente de zero inclui todos os coeficientes com a exceção de pelo menos um dos coeficientes identificados por não ter informações direcionais suficientes.
[0329] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para extrair o primeiro conjunto diferente de zero dos coeficientes como uma primeira porção do vetor.
[0330] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para extrair o primeiro conjunto do vetor diferente de zero a partir de informações de canal auxiliar e obter uma versão recomposta da pluralidade de coeficientes harmônicos esféricos com base no primeiro conjunto diferente de zero dos coeficientes do vetor.
[0331] Nesses e em outros casos, o vetor compreende um vetor decomposto a partir da pluralidade de coeficientes harmônicos esféricos com o uso de síntese com base em vetor.
[0332] Nesses e em outros casos, a síntese à base de vetor compreende uma decomposição de valor singular.
[0333] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para determinar um dentre uma pluralidade de modos de configuração através do qual extrair o conjunto de coeficientes diferente de zero do vetor de acordo com aquele dentre a pluralidade de modos de configuração e extrair o conjunto diferente de zero dos coeficientes do vetor com base no obtido dentre a pluralidade de modos de configuração.
[0334] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto diferente de zero dos coeficientes inclui todos os coeficientes.
[0335] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto de coeficientes diferente de zero inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0336] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto diferente de zero dos coeficientes inclui aqueles dentre os coeficientes que correspondem a uma ordem maior do que uma ordem de uma função de base à qual um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde e excluir pelo menos um dentre os coeficientes que correspondem a uma ordem maior do que a ordem da função de base à qual o um ou mais dentre a pluralidade de coeficientes harmônicos esféricos corresponde.
[0337] Nesses e em outros casos, o um dentre a pluralidade de modos de configuração indica que o conjunto de coeficientes diferente de zero inclui todos os coeficientes com a exceção de pelo menos um dos coeficientes.
[0338] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar aquele dentre a pluralidade de modos de configuração com base em um valor sinalizado em um fluxo de bits.
[0339] Vários aspectos das técnicas também podem, em alguns casos, possibilitar que o dispositivo de codificação de áudio 20 identifique um ou mais objetos de áudio distintos (ou, em outras palavras, objetos de áudio predominantes). Em algumas ocorrências, o dispositivo de codificação de áudio 20 pode ser configurado para identificar um ou mais objetos de áudio distintos a partir de um ou mais coeficientes harmônicos esféricos (SHC) associados aos objetos de áudio com base em uma direcionalidade determinada para um ou mais dos objetos de áudio.
[0340] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para determinar a direcionalidade do um ou mais objetos de áudio com base nos coeficientes harmônicos esféricos associados com os objetos de áudio.
[0341] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para realizar uma decomposição de valor singular em relação aos coeficientes harmônicos esféricos para gerar uma matriz U representativa de vetores singulares à esquerda da pluralidade dos coeficientes harmônicos esféricos, uma matriz Ss representativa de valores singulares da pluralidade de coeficientes harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da pluralidade de coeficientes harmônicos esféricos e representar a pluralidade de coeficientes harmônicos esféricos como uma função de pelo menos uma porção de uma ou mais dentre a matriz Ur, a matriz S e a matriz V, em que o dispositivo de codificação de áudio 20 é configurado para determinar a respectiva direcionalidade do um ou mais objetos de áudio tem por base, pelo menos em parte, a matriz V.
[0342] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para reordenar um ou mais vetores da matriz V, de modo que os vetores que têm um quociente de direcionalidade maior sejam posicionados acima dos vetores que têm um menor quociente de direcionalidade na matriz V reordenda.
[0343] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para determinar que os vetores que têm o maior quociente de direcionalidade incluem maiores informações direcionais do que os vetores que têm menos quociente de direcionalidade.
[0344] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para multiplicar a matriz V pela matriz S para gerar uma matriz VS, em que a matriz VS inclui um ou mais vetores.
[0345] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para selecionar entradas de cada fileira da matriz VS que estão associadas a uma ordem maior do que 14, elevar ao quadrado cada uma das entradas selecionadas para formar entradas correspondentes elevadas ao quadrado e para cada fileira da matriz VS, somar todas as entradas elevadas ao quadrado para determinar um quociente de direcionalidade para um vetor correspondente.
[0346] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para selecionar as entradas de cada fileira da matriz VS associada à ordem maior do que 14, em que isso compreende selecionar todas as entradas que se iniciam na 18º entrada de cada fileira da matriz VS e que terminam na 38º entrada de cada fileira da matriz VS.
[0347] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para selecionar um subconjunto dos vetores da matriz VS para representar os objetos de áudio distintos. Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para selecionar quatro vetores da matriz VS e em que os quatro vetores selecionados têm os quatro maiores quocientes de direcionalidade dentre todos os vetores da matriz VS.
[0348] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar que o subconjunto selecionado dos vetores que representa os objetos de áudio distintos tem por base tanto a direcionalidade quanto uma energia de cada vetor.
[0349] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para realizar uma comparação de energia entre um ou mais primeiros vetores e um ou mais segundos vetores representativos dos objetos de áudio distintos para determinar o um ou mais primeiros vetores reordenados, em que o um ou mais primeiros vetores descrevem os objetos de áudio distintos em uma primeira porção dos dados de áudio e o um ou mais segundos vetores descrevem os objetos de áudio distintos em uma segunda porção dos dados de áudio.
[0350] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para realizar uma relação cruzada entre um ou mais primeiros vetores e um ou mais segundos vetores representativos dos objetos de áudio distintos para determinar o um ou mais primeiros vetores reordenados, em que o um ou mais primeiros vetores descrevem os objetos de áudio distintos em uma primeira porção dos dados de áudio e o um ou mais segundos vetores descrevem os objetos de áudio distintos em uma segunda porção dos dados de áudio.
[0351] Vários aspectos das técnicas também podem, em alguns casos, possibilitar que o dispositivo de codificação de áudio 20 seja configurado para realizar uma compensação de energia em relação às decomposições dos coeficientes de HOA 11. Nesses e em outros casos, oO dispositivo de codificação de áudio 20 pode ser configurado para realizar uma síntese com base em vetor em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar representações decompostas da pluralidade de coeficientes harmônicos esféricos representativos de um ou mais objetos de áudio e informações direcionais correspondentes, em que os coeficientes harmônicos esféricos estão associados a uma ordem e descrevem um campo sonoro, determinam informações direcionais distintas e de segundo plano a partir das informações direcionais, reduzem uma ordem das informações direcionais associadas aos objetos de áudio de segundo plano para gerar informações direcionais de segundo plano transformadas, aplicam compensação para aumentar os valores das informações direcionais transformadas para preservar uma energia geral do campo sonoro.
[0352] Nesses e em outros casos, o dispositivo de codificação de áudio 20 pode ser configurado para realizar uma decomposição de valor singular em relação a uma pluralidade de coeficientes harmônicos esféricos para gerar uma matriz U e uma matriz S representativas dos objetos de áudio e uma matriz V representativa das informações direcionais, determinar vetores de colunas distintas da matriz V e vetores de coluna de segundo plano da matriz V, reduzir uma ordem dos vetores de coluna de segundo plano da matriz V para gerar vetores de coluna de segundo plano transformados da matriz V e aplicar a compensação para aumentar os valores dos vetores de coluna de segundo plano transformados da matriz V para preservar uma energia geral do campo sonoro.
[0353] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para determinar a quantidade de valores singulares salientes da matriz S, em a quantidade de vetores de colunas distintas da matriz V é a quantidade de valores singulares salientes da matriz S.
[0354] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar uma ordem reduzida para os coeficientes harmônicos esféricos e zero valores para as fileiras dos vetores de coluna de segundo plano da matriz V associados a uma ordem que é maior do que a ordem reduzida.
[0355] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é adicionalmente configurado para combinar colunas de segundo plano da matriz U, colunas de segundo plano da matriz S e uma transposta das colunas de segundo plano transformadas da matriz V para gerar coeficientes harmônicos esféricos modificados.
[0356] Nesses e em outros casos, os coeficientes harmônicos esféricos modificados descrevem um ou mais componentes de segundo plano do campo sonoro.
[0357] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar uma primeira energia de um vetor dentre os vetores de coluna de segundo plano da matriz V e uma segunda energia de um vetor dentre os vetores de coluna de segundo plano transformados da matriz V e aplicar um valor de amplificação a cada elemento do vetor dentre os vetores de coluna de segundo plano transformados da matriz V, em que o valor de amplificação compreende uma razão da primeira energia para a segunda energia.
[0358] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar um primeiro quadrado de média de raiz de energia de um vetor dentre os vetores de coluna de segundo plano da matriz V e um segundo quadrado de média de raiz de energia de um vetor dentre os vetores de coluna de segundo plano transformados da matriz V e aplicar um valor de amplificação a cada elemento do vetor dentre os vetores de coluna de segundo plano transformados da matriz V, em que o valor de amplificação compreende uma razão da primeira energia para a segunda energia.
[0359] Vários aspectos das técnicas descritas na presente revelação também possibilitam que o dispositivo de codificação de áudio 20 realize uma interpolação em relação às versões decompostas dos coeficientes de HOA 11. Em algumas ocorrências, o dispositivo de codificação de áudio 20 pode ser configurado para obter coeficientes harmônicos —esféricos interpolados “decompostos por um segmento de tempo, pelo menos em parte, desempenhando-se uma interpolação em relação a uma primeira decomposição de uma primeira pluralidade de coeficientes harmônicos esféricos e uma segunda decomposição de uma segunda pluralidade de coeficientes harmônicos esféricos.
[0360] Nesses e em outros casos, a primeira decomposição compreende uma primeira matriz VvV representativa de vetores singulares à direita da primeira pluralidade de coeficientes harmônicos esféricos.
[0361] Nesses e em outros exemplos, a segunda decomposição compreende uma segunda matriz V representativa de vetores singulares à direita da segunda pluralidade de coeficientes harmônicos esféricos.
[0362] Nesses e em outros casos, a primeira decomposição compreende uma primeira matriz V representativa de vetores singulares à direita da primeira pluralidade de coeficientes harmônicos esféricos e a segunda decomposição compreende uma segunda matriz V representativa de vetores singulares à direita da segunda pluralidade de coeficientes harmônicos esféricos.
[0363] Nesses e em outros casos, o segmento de tempo compreende um subquadro de um quadro de áudio.
[0364] Nesses e em outros casos, o segmento de tempo compreende uma amostra de tempo de um quadro de áudio.
[0365] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para obter uma decomposição interpolada da primeira decomposição e a segunda decomposição para um coeficiente harmônico esférico da primeira pluralidade de coeficientes de harmônicos esféricos.
[0366] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para obter decomposições interpoladas da primeira decomposição para uma primeira porção da primeira pluralidade de coeficientes de harmônicos esféricos incluídos no primeiro quadro e a segunda decomposição para uma segunda porção da segunda pluralidade de coeficientes de harmônicos esféricos incluída no segundo quadro, e o dispositivo de codificação de áudio 20 é configurado adicionalmente para aplicar as decomposições interpoladas a um primeiro componente de tempo da primeira porção da primeira pluralidade de coeficientes de harmônicos esféricos incluída no primeiro quadro para gerar um primeiro componente de tempo artificial da primeira pluralidade de coeficientes de harmônicos esféricos, e aplicar as respectivas decomposições interpoladas a um segundo componente de tempo da segunda porção dentre a segunda pluralidade de coeficientes de harmônicos esféricos incluída no segundo quadro para gerar um segundo componente de tempo artificial da segunda pluralidade de coeficientes de harmônicos esféricos incluídos.
[0367] Nesses e em outros casos, o primeiro componente de tempo é gerado realizando-se uma síntese à base de vetor em relação à primeira pluralidade de coeficientes de harmônicos esféricos.
[0368] Nesses e em outros casos, o segundo componente de tempo é gerado realizando-se uma síntese à base de vetor em relação à segunda pluralidade de coeficientes de harmônicos esféricos.
[0369] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para receber o primeiro componente de tempo artificial e o segundo "componente de tempo artificial, computar as decomposições interpoladas da primeira decomposição para a primeira porção da primeira pluralidade de coeficientes de harmônicos esféricos e a segunda decomposição para a segunda porção da segunda pluralidade de coeficientes de harmônicos esféricos, e aplicar inversos das decomposições interpoladas ao primeiro componente de tempo artificial para recuperar o primeiro componente de tempo e ao segundo componente de tempo artificial para recuperar o segundo componente de tempo.
[0370] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para interpolar um primeiro componente espacial da primeira pluralidade de coeficientes de harmônicos esféricos e o segundo componente espacial da segunda pluralidade de coeficientes de harmônicos esféricos.
[0371] Nesses e em outros casos, o primeiro componente espacial compreende uma primeira matriz U representativa de vetores singulares à esquerda da primeira pluralidade de coeficientes de harmônicos esféricos.
[0372] Nesses e em outros casos, o segundo componente espacial compreende uma segunda matriz U representativa de vetores singulares à esquerda da segunda pluralidade de coeficientes de harmônicos esféricos.
[0373] Nesses e em outros casos, o primeiro componente espacial é representativo de M segmentos de tempo de coeficientes de harmônicos esféricos para a primeira pluralidade de coeficientes de harmônicos esféricos e o segundo componente espacial é representativo de M segmentos de tempo de coeficientes de harmônicos esféricos para a segunda pluralidade de coeficientes de harmônicos esféricos.
[0374] Nesses e em outros casos, o primeiro componente espacial é representativo de M segmentos de tempo de coeficientes de harmônicos esféricos para a primeira pluralidade de coeficientes de harmônicos esféricos e o segundo componente espacial é representativo de M segmentos de tempo de coeficientes de harmônicos esféricos para a segunda pluralidade de coeficientes de harmônicos esféricos, e o dispositivo de codificação de áudio 20 é configurado para interpolar os últimos N elementos do primeiro componente espacial e os primeiros N elementos do segundo componente espacial.
[0375] Nesses e em outros casos, a segunda pluralidade de coeficientes de harmônicos esféricos é subsequente à primeira pluralidade de coeficientes de harmônicos esféricos no domínio de tempo.
[0376] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para decompor a primeira pluralidade de coeficientes de harmônicos esféricos para gerar a primeira decomposição da primeira pluralidade de coeficientes de harmônicos esféricos.
[0377] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para decompor a segunda pluralidade de coeficientes de harmônicos esféricos para gerar a segunda decomposição da segunda pluralidade de coeficientes de harmônicos esféricos.
[0378] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para realizar uma decomposição de valor singular em relação à primeira pluralidade de coeficientes de harmônicos esféricos para gerar uma matriz U representativa de vetores singulares à esquerda da primeira pluralidade de coeficientes de harmônicos esféricos, uma matriz Ss representativa de valores singulares da primeira pluralidade de coeficientes de harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da primeira pluralidade de coeficientes de harmônicos esféricos.
[0379] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para realizar uma decomposição de valor singular em relação à segunda pluralidade de coeficientes de harmônicos esféricos para gerar uma matriz U representativa de vetores singulares à esquerda da segunda pluralidade de coeficientes de harmônicos esféricos, uma matriz Ss representativa de valores singulares da segunda pluralidade de coeficientes de harmônicos esféricos e uma matriz V representativa de vetores singulares à direita da segunda pluralidade de coeficientes de harmônicos esféricos.
[0380] Nesses e em outros casos, cada uma dentre a primeira e a segundas pluralidades de coeficientes de harmônicos esféricos representa uma representação de onda plana do campo sonoro.
[0381] Nesses e em outros casos, cada uma dentre a primeira e a segundas pluralidades de coeficientes de harmônicos esféricos representa um ou mais objetos de áudio mono misturados juntamente.
[0382] Nesses e em outros casos, cada uma dentre a primeira e a segundas pluralidades de coeficientes de harmônicos esféricos compreende respectivos primeiro e segundo coeficientes de harmônicos esféricos que representam um campo sonoro tridimensional.
[0383] Nesses e em outros casos, a primeira e a segunda pluralidades de coeficientes de harmônicos esféricos são, cada uma, associadas a pelo menos uma função de base esférica que tem uma ordem maior do que um(1).
[0384] Nesses e em outros casos, a primeira e a segunda pluralidades de coeficientes de harmônicos esféricos são, cada uma, associadas a pelo menos um função de base esférica que tem uma ordem igual a quatro.
[0385] Nesses e em outros casos, a interpolação é uma interpolação ponderada da primeira decomposição e da segunda decomposição, em que os pesos da interpolação ponderada aplicados à primeira decomposição são inversamente proporcionais a um tempo representado por vetores da primeira e segunda decomposições e em que os pesos da interpolação ponderada aplicados à segunda decomposição são proporcionais a um tempo representado por vetores da primeira e segunda decomposições.
[0386] Nesses e em outros casos, os coeficientes de harmônicos esféricos interpolados decompostos suavizam pelo menos um dentre os componentes espaciais e os componentes de tempo da primeira pluralidade de coeficientes de harmônicos esféricos e da segunda pluralidade de coeficientes de harmônicos esféricos.
[0387] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para computar Us[n] = HOA(n) * (V vec[n])-l para obter um escalar.
[0388] Nesses e em outros casos, a interpolação compreende uma interpolação linear. Nesses e em outros casos, a interpolação compreende uma interpolação não linear. Nesses e em outros casos, a interpolação compreende uma interpolação de cosseno. Nesses e em outros casos, a interpolação compreende uma interpolação de cosseno ponderada. Nesses e em outros casos, a interpolação compreende uma interpolação cúbica. Nesses e em outros casos, a interpolação compreende um Interpolação de Spline Adaptativa. Nesses e em outros casos, a interpolação compreende uma interpolação de curvatura mínima.
[0389] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para gerar um fluxo de bits que inclui uma representação dos coeficientes de harmônicos esféricos interpolados decompostos para o segmento de tempo, e uma indicação de um tipo da interpolação.
[0390] Nesses e em outros casos, a indicação compreende um ou mais bits que mapeiam para o tipo de interpolação.
[0391] Desta forma, vários aspectos dos conjuntos de procedimentos descritos nesta revelação podem habilitar o dispositivo de codificação de áudio 20 para ser configurado para obter um fluxo de bits que inclui uma representação dos coeficientes de harmônicos esféricos interpolados decompostos para o segmento de tempo, e uma indicação de um tipo da interpolação.
[0392] Nesses e em outros casos, a indicação compreende um ou mais bits que mapeiam para o tipo de interpolação.
[0393] Em relação a isso, o dispositivo de codificação de áudio 20 pode representar uma modalidade dos conjuntos de procedimentos em que o dispositivo de codificação de áudio 20 pode, em alguns casos, ser configurado para gerar um fluxo de bits que compreende uma versão compactada de um componente espacial de um campo sonoro, sendo que o componente espacial é gerado realizando-se uma síntese à base de vetor em relação a uma pluralidade de coeficientes de harmônicos esféricos.
[0394] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para gerar o fluxo de bits para incluir um campo que especifica um modo de predição usado quando se comprime o componente espacial.
[0395] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para gerar o fluxo de bits para incluir informações de tabela de Hufíman que especificam uma tabela de Huffman usada quando se comprime o componente espacial.
[0396] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para gerar o fluxo de bits para incluir um campo que indica um valor que expressa um tamanho de etapa de quantização ou uma variável do mesmo usada quando se comprime o componente espacial.
[0397] Nesses e em outros casos, o valor compreende um valor nbits.
[0398] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para gerar o fluxo de bits para incluir uma versão de uma pluralidade de componentes espaciais do campo sonoro cuja versão compactada do componente espacial é incluída, em que o valor expressa o tamanho de etapa de quantização ou uma variável da mesma usada quando se comprime a pluralidade de componentes espaciais.
[0399] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para gerar o fluxo de bits para incluir um código de Huffman para representar um identificador de categoria que identifica uma categoria de compactação à qual o componente espacial corresponde.
[0400] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para gerar o fluxo de bits para incluir um bit de sinal que identifica se o componente espacial é um valor positivo ou um valor negativo.
[0401] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para gerar o fluxo de bits para incluir um código de Huffman para representar um valor residual do componente espacial.
[0402] Nesses e em outros casos, a síntese à base de vetor compreende uma decomposição de valor singular.
[0403] Em relação a isso, o dispositivo de codificação de áudio 20 pode implantar adicionalmente vários aspectos dos conjuntos de procedimentos em que o dispositivo de codificação de áudio 20 pode, em alguns casos, ser configurado para identificar um livro de códigos de Huffman para usar quando se comprime um componente espacial de uma pluralidade de componentes espaciais com base em uma ordem do componente espacial relacionado aos componentes restantes dentre a pluralidade de componentes espaciais, sendo que o componente espacial é gerado realizando-se uma síntese à base de vetor em relação a uma pluralidade de coeficientes de harmônicos esféricos.
[0404] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para identificar o livro de códigos de Huffman com base em um modo de predição usado quando se comprime o componente espacial.
[0405] Nesses e em outros casos, uma versão compactada do componente espacial é representada em um fluxo de bits com o uso, pelo menos em parte, das informações de tabela de Huffman que identificam o livro de códigos de Huffman.
[0406] Nesses e em outros casos, uma versão compactada do componente espacial é representada em um fluxo de bits com o uso, pelo menos em parte, de um campo que indica um valor que expressa um tamanho de etapa de quantização ou uma variável da mesma usada quando se comprime o componente espacial.
[0407] Nesses e em outros casos, o valor compreende um valor nbits.
[0408] Nesses e em outros casos, o fluxo de bits compreende uma versão compactada de uma pluralidade de componentes espaciais do campo sonoro cuja versão compactada do componente espacial é incluída, e o valor expressa o tamanho de etapa de quantização ou uma variável da mesma usada quando se comprime a pluralidade de componentes espaciais.
[0409] Nesses e em outros casos, uma versão compactada do componente espacial é representada em um fluxo de bits com o uso, pelo menos em parte, de um código de Huffman selecionado a partir do livro de códigos de Huffman identificado para representar um identificador de categoria que identifica uma categoria de compactação à qual o componente espacial corresponde.
[0410] Nesses e em outros casos, uma versão compactada do componente espacial é representada em um fluxo de bits com o uso, pelo menos em parte, de um bit de sinal que identifica se o componente espacial é um valor positivo ou um valor negativo.
[0411] Nesses e em outros casos, uma versão compactada do componente espacial é representada em um fluxo de bits com o uso, pelo menos em parte, de um código de Huffman selecionado a partir do livro de códigos de
Huffman identificado para representar um valor residual do componente espacial.
[0412] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para comprimir o componente espacial com base no livro de códigos de Huffman identificado para gerar uma versão compactada do componente espacial, e gerar o fluxo de bits para incluir a versão compactada do componente espacial.
[0413] Ademais, o dispositivo de codificação de áudio 20 pode, em alguns casos, implantar vários aspectos dos conjuntos de procedimentos em que o dispositivo de codificação de áudio 20 pode ser configurado para determinar um tamanho de etapa de quantização a ser usado quando se comprime um componente espacial de um campo sonoro, sendo que o componente espacial é gerado realizando-se uma síntese à base de vetor em relação a uma pluralidade de coeficientes de harmônicos esféricos.
[0414] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar o tamanho de etapa de quantização com base em uma taxa de bits alvo.
[0415] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar uma estimativa de um número de usado para representar o componente espacial, e determinar o tamanho de etapa de quantização com base em uma diferença entre a estimativa e uma taxa de bits alvo.
[0416] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para determinar uma estimativa de um número de bits usado para representar o componente espacial, determinar uma diferença entre a estimativa e uma taxa de bits alvo, e determinar o tamanho de etapa de quantização adicionando-se a diferença à taxa de bits alvo.
[0417] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para calcular a estimativa do número de bits que deve ser gerado para o componente espacial dado um livro de códigos correspondente à taxa de bits alvo.
[0418] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para calcular a estimativa do número de bits que deve ser gerado para o componente espacial dado um modo de codificação usado quando se comprime o componente espacial.
[0419] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para calcular uma primeira estimativa do número de bits que deve ser gerado para o componente espacial dado um primeiro modo de codificação a ser usado quando se comprime o componente espacial, calcular uma segunda estimativa do número de bits que deve ser gerado para o componente espacial dado um segundo modo de codificação a ser usado quando se comprime o componente espacial, selecionar uma dentre a primeira estimativa e a segunda estimativa que tem um menor número de bits a ser usado como a estimativa determinada do número de bits.
[0420] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado para identificar um identificador de categoria que identifica uma categoria à qual o componente espacial corresponde, identifica um comprimento de bits de um valor residual para o componente espacial que resultaria quando se comprime o componente espacial “correspondente à categoria, e determina a estimativa do número de bits, pelo menos em parte, adicionando um número de bits usados para representar o identificador de categoria para o comprimento de bits do valor residual.
[0421] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para selecionar um dentre uma pluralidade de livros de códigos a ser usada quando se comprime o componente espacial.
[0422] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usado para representar o componente espacial com o uso de cada um dentre a pluralidade de livros de códigos, e selecionar o livro dentre a pluralidade de livros de códigos que resultou na estimativa determinada que tem o menor número de bits.
[0423] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usado para representar o componente espacial com o uso de um ou mais dentre a pluralidade de livros de códigos, em que os um ou mais dentre a pluralidade de livros de códigos selecionados com base em uma ordem dos elementos do componente espacial para ser compactado em relação a outros elementos do componente espacial.
[0424] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usados para representar o componente espacial com o uso de um dentre a pluralidade de livros de códigos projetada para ser usada quando o componente espacial não é previsto a partir de um componente espacial subsequente.
[0425] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usados para representar o componente espacial com o uso de um dentre a pluralidade de livros de códigos projetada para ser usada quando o componente espacial é previsto a partir de um componente espacial subsequente.
[0426] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usado para representar o componente espacial com o uso da pluralidade de livros de códigos projetada para ser usada quando o componente espacial é representativa de um objeto de áudio sintético no campo sonoro.
[0427] Nesses e em outros casos, o objeto de áudio sintético compreende um objeto de áudio modulado por código de pulso (PCM).
[0428] Nesses e em outros casos, o dispositivo de codificação de áudio 20 é configurado adicionalmente para determinar uma estimativa de um número de bits usado para representar o componente espacial com o uso da pluralidade de livros de códigos projetada para ser usada quando o componente espacial é representativa de um objeto de áudio gravado no campo sonoro.
[0429] Em cada um dos vários casos descritos acima, deveria ser compreendido que o dispositivo de codificação de áudio 20 pode realizar um método ou de outra forma compreende meios para realizar cada etapa do método para o qual o dispositivo de codificação de áudio 20 é configurado para realizar em alguns casos, esses meios podem compreende um ou mais processadores. Em alguns casos, os um ou mais processadores podem representar um processador de propósito especial configurado por meio de instruções armazenadas em um meio de armazenamento legível por computador não transitório. Em outras palavras, vários aspectos dos conjuntos de procedimentos em cada um dos conjuntos de exemplos de codificação podem fornecer um meio de armazenamento legível por computador não transitório que tem armazenado no mesmo instruções que, quando executadas, fazem com que os um ou mais processadores realizem o método para o qual o dispositivo de codificação de áudio 20 foi configurado para realizar.
[0430] A Figura 5 é um diagrama de blocos que ilustra o dispositivo de decodificação de áudio 24 da Figura 3 em mais detalhes. Conforme mostrado no exemplo da Figura 5, o dispositivo de decodificação de áudio 24 pode incluir uma unidade de extração 72, uma unidade de reconstrução à base de direcionalidade 90 e uma unidade de reconstrução à base de vetor 92.
[0431] A unidade de extração 72 pode representar uma unidade configurada para receber o fluxo de bits 21 e extrair as várias verões codificadas (por exemplo, uma versão codificada à base de direcionalidade ou uma versão codificada à base de vetor) dos coeficientes de HOA 11. A unidade de extração 72 pode determinar a partir do elemento de sintaxe notado acima (por exemplo, o elemento de sintaxe de ChannelType mostrado nos exemplos das Figuras 10E e 10H(i)-100(ii)) se os coeficientes de HOA 11 foram codificados por meio das várias versões. Quando uma codificação à base de direcionalidade foi realizada, a unidade de extração 72 pode extrair a versão à base de direcionalidade dos coeficientes de HOA 11 e os elementos de sintaxe associadas a essa versão codificada (que é denotada como informações à base de direcionalidade 91 no exemplo da Figura 5), que passa essas informações à base de direcionalidade 91 para a unidade de reconstrução à base de direcionalidade 90. Essa unidade de reconstrução à base de direcionalidade 90 pode representar a unidade configurada para reconstruir os coeficientes de HOA na forma de coeficientes de HOA 11” com base nas informações à base de direcionalidade 91. O fluxo de bits e a disposição de elementos de sintaxe dentro do fluxo de bits são descritos abaixo em maiores detalhes em relação ao exemplo das Figuras 10-100(ii) e 11.
[0432] Quando o elemento de sintaxe indica que os coeficientes HOA 11 foram codificados com o uso de uma síntese com base em vetor, a unidade de extração 72 pode extrair os vetores V[k] de primeiro plano codificados 57, os coeficientes HOA de ambiente codificado 59 e os sinais de nFG codificados 59. A unidade de extração 72 pode passar os vetores de primeiro plano codificados V[k] 57 para a unidade de quantização 74 e os coeficientes de HOA de ambiente codificados 59 em conjunto com os sinais de nFG codificados 61 para a unidade de decodificação psicoacústica 80.
[0433] Para extrair os vetores de primeiro plano codificados V[k] 57, os coeficientes de HOA de ambiente codificados 59 e os sinais de nFG codificados 59, as unidade de extração 72 podem obter as informações de canal auxiliares 57, que incluem o elemento de sintaxe denotado codedVVecLength. A unidade de extração 72 pode analisar o codedVVecLength a partir das informações de canal auxiliares 57. A unidade de extração 72 pode ser configurada para operar em que um dos modos de configuração descritos acima com base no elemento de sintaxe de codedVVecLength.
[0434] A unidade de extração 72 então opera de acordo com qualquer um dos modos de configuração para analisar uma forma compactada dos vetores de primeiro plano reduzidos V[k] 55º, a partir das informações de canal auxiliares 57. A unidade de extração 72 pode operar de acordo com a instrução switch apresentada no seguindo pseudo-código com a sintaxe apresentada na tabela de sintaxe a seguir para VectorData: switch CodedVvecLengthí case O: VWeclLength = NumOfHoaCoeffs; for (m=8; m<VWecLlength; ++m)f WecCoeffId[m] = m; + break; case 1: Weclength = NumOfHoaCoeffs - MinNumOfCoeffsForâmbHOA - NumOfContaddHoaChans; n=o; for(n=MinNumOfCoeffsForAmbHOA; m<NumOfHoaCoeffs; ++m)í CoeffIdx = m+1; if(CoeffIdx isNotMemberOf ContaddHoaCoeff)( WecCoeffId[n] = CoeffIdx-1; nes; + ) break; case 2: VWeclength = NumOfHoaCoeffs - MinNumOfCoeffsForambHOA; for (m=0; m< Weclength; ++m)f WecCoeffId[m] = m + MinNumOfCoeffsForAmbHOA; ) break; case 3: Weclength = NumOfHoaCoeffs - NumOfContAddHoaChans; n=0o; for(n=9; m<NumOftoaCoeffs; ++m)( cc. ml; if(c tsNotMemberOf ContaddHoaCoeff)í WecCoeffId[n] « c-1; nes; + ) )
BR112015030102-9A 2013-05-29 2014-05-29 Compressão de representações decompostas de campo sonoro BR112015030102B1 (pt)

Applications Claiming Priority (39)

Application Number Priority Date Filing Date Title
US201361828615P 2013-05-29 2013-05-29
US201361828445P 2013-05-29 2013-05-29
US61/828,445 2013-05-29
US61/828,615 2013-05-29
US201361829182P 2013-05-30 2013-05-30
US201361829155P 2013-05-30 2013-05-30
US201361829174P 2013-05-30 2013-05-30
US61/829,155 2013-05-30
US61/829,182 2013-05-30
US61/829,174 2013-05-30
US201361829846P 2013-05-31 2013-05-31
US201361829791P 2013-05-31 2013-05-31
US61/829,791 2013-05-31
US61/829,846 2013-05-31
US201361886617P 2013-10-03 2013-10-03
US201361886605P 2013-10-03 2013-10-03
US61/886,617 2013-10-03
US61/886,605 2013-10-03
US201361899034P 2013-11-01 2013-11-01
US201361899041P 2013-11-01 2013-11-01
US61/899,041 2013-11-01
US61/899,034 2013-11-01
US201461925126P 2014-01-08 2014-01-08
US201461925074P 2014-01-08 2014-01-08
US201461925158P 2014-01-08 2014-01-08
US201461925112P 2014-01-08 2014-01-08
US61/925,112 2014-01-08
US61/925,158 2014-01-08
US61/925,074 2014-01-08
US61/925,126 2014-01-08
US201461933706P 2014-01-30 2014-01-30
US201461933721P 2014-01-30 2014-01-30
US61/933,706 2014-01-30
US61/933,721 2014-01-30
US201462003515P 2014-05-27 2014-05-27
US62/003,515 2014-05-27
US14/289,551 2014-05-28
US14/289,551 US9502044B2 (en) 2013-05-29 2014-05-28 Compression of decomposed representations of a sound field
PCT/US2014/040025 WO2014194090A1 (en) 2013-05-29 2014-05-29 Compression of decomposed representations of a sound field

Publications (2)

Publication Number Publication Date
BR112015030102A2 true BR112015030102A2 (pt) 2020-07-14
BR112015030102B1 BR112015030102B1 (pt) 2022-08-23

Family

ID=51985123

Family Applications (1)

Application Number Title Priority Date Filing Date
BR112015030102-9A BR112015030102B1 (pt) 2013-05-29 2014-05-29 Compressão de representações decompostas de campo sonoro

Country Status (20)

Country Link
US (16) US10499176B2 (pt)
EP (8) EP3107093A1 (pt)
JP (6) JP6345771B2 (pt)
KR (11) KR101877605B1 (pt)
CN (7) CN105284132B (pt)
AU (1) AU2014274076B2 (pt)
BR (1) BR112015030102B1 (pt)
CA (1) CA2912810C (pt)
ES (4) ES2764384T3 (pt)
HK (1) HK1215752A1 (pt)
HU (3) HUE046520T2 (pt)
IL (1) IL242648B (pt)
MY (1) MY174865A (pt)
PH (1) PH12015502634A1 (pt)
RU (1) RU2668059C2 (pt)
SG (1) SG11201509462VA (pt)
TW (2) TWI645723B (pt)
UA (1) UA116140C2 (pt)
WO (12) WO2014194115A1 (pt)
ZA (1) ZA201509227B (pt)

Families Citing this family (122)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US10178489B2 (en) 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9883310B2 (en) 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US10499176B2 (en) 2013-05-29 2019-12-03 Qualcomm Incorporated Identifying codebooks to use when coding spatial components of a sound field
US9691406B2 (en) * 2013-06-05 2017-06-27 Dolby Laboratories Licensing Corporation Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US20150243292A1 (en) 2014-02-25 2015-08-27 Qualcomm Incorporated Order format signaling for higher-order ambisonic audio data
US10412522B2 (en) 2014-03-21 2019-09-10 Qualcomm Incorporated Inserting audio channels into descriptions of soundfields
EP2922057A1 (en) 2014-03-21 2015-09-23 Thomson Licensing Method for compressing a Higher Order Ambisonics (HOA) signal, method for decompressing a compressed HOA signal, apparatus for compressing a HOA signal, and apparatus for decompressing a compressed HOA signal
US9847087B2 (en) 2014-05-16 2017-12-19 Qualcomm Incorporated Higher order ambisonics signal compression
US10134403B2 (en) * 2014-05-16 2018-11-20 Qualcomm Incorporated Crossfading between higher order ambisonic signals
US9959876B2 (en) 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US20150332682A1 (en) 2014-05-16 2015-11-19 Qualcomm Incorporated Spatial relation coding for higher order ambisonic coefficients
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US20150347392A1 (en) * 2014-05-29 2015-12-03 International Business Machines Corporation Real-time filtering of massive time series sets for social media trends
WO2015184316A1 (en) 2014-05-30 2015-12-03 Qualcomm Incoprporated Obtaining symmetry information for higher order ambisonic audio renderers
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
US9838819B2 (en) 2014-07-02 2017-12-05 Qualcomm Incorporated Reducing correlation between higher order ambisonic (HOA) background channels
US9736606B2 (en) 2014-08-01 2017-08-15 Qualcomm Incorporated Editing of higher-order ambisonic audio data
US9847088B2 (en) 2014-08-29 2017-12-19 Qualcomm Incorporated Intermediate compression for higher order ambisonic audio data
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US20160093308A1 (en) 2014-09-26 2016-03-31 Qualcomm Incorporated Predictive vector quantization techniques in a higher order ambisonics (hoa) framework
US9875745B2 (en) 2014-10-07 2018-01-23 Qualcomm Incorporated Normalization of ambient higher order ambisonic audio data
US10140996B2 (en) 2014-10-10 2018-11-27 Qualcomm Incorporated Signaling layers for scalable coding of higher order ambisonic audio data
US9940937B2 (en) 2014-10-10 2018-04-10 Qualcomm Incorporated Screen related adaptation of HOA content
US9984693B2 (en) 2014-10-10 2018-05-29 Qualcomm Incorporated Signaling channels for scalable coding of higher order ambisonic audio data
CN106303897A (zh) 2015-06-01 2017-01-04 杜比实验室特许公司 处理基于对象的音频信号
AU2016269886B2 (en) * 2015-06-02 2020-11-12 Sony Corporation Transmission device, transmission method, media processing device, media processing method, and reception device
EP3329486B1 (en) * 2015-07-30 2020-07-29 Dolby International AB Method and apparatus for generating from an hoa signal representation a mezzanine hoa signal representation
US12087311B2 (en) 2015-07-30 2024-09-10 Dolby Laboratories Licensing Corporation Method and apparatus for encoding and decoding an HOA representation
JP6501259B2 (ja) * 2015-08-04 2019-04-17 本田技研工業株式会社 音声処理装置及び音声処理方法
US10693936B2 (en) * 2015-08-25 2020-06-23 Qualcomm Incorporated Transporting coded audio data
US20170098452A1 (en) * 2015-10-02 2017-04-06 Dts, Inc. Method and system for audio processing of dialog, music, effect and height objects
US9961475B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from object-based audio to HOA
US10249312B2 (en) * 2015-10-08 2019-04-02 Qualcomm Incorporated Quantization of spatial vectors
EP4411732A3 (en) 2015-10-08 2024-10-09 Dolby International AB Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations
US9961467B2 (en) 2015-10-08 2018-05-01 Qualcomm Incorporated Conversion from channel-based audio to HOA
EA035078B1 (ru) 2015-10-08 2020-04-24 Долби Интернэшнл Аб Многоуровневое кодирование сжатых представлений звука или звукового поля
US10070094B2 (en) 2015-10-14 2018-09-04 Qualcomm Incorporated Screen related adaptation of higher order ambisonic (HOA) content
US9959880B2 (en) 2015-10-14 2018-05-01 Qualcomm Incorporated Coding higher-order ambisonic coefficients during multiple transitions
WO2017085140A1 (en) * 2015-11-17 2017-05-26 Dolby International Ab Method and apparatus for converting a channel-based 3d audio signal to an hoa audio signal
EP3174316B1 (en) * 2015-11-27 2020-02-26 Nokia Technologies Oy Intelligent audio rendering
EP3188504B1 (en) 2016-01-04 2020-07-29 Harman Becker Automotive Systems GmbH Multi-media reproduction for a multiplicity of recipients
EP3402221B1 (en) * 2016-01-08 2020-04-08 Sony Corporation Audio processing device and method, and program
CA2999393C (en) 2016-03-15 2020-10-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus, method or computer program for generating a sound field description
WO2018001500A1 (en) * 2016-06-30 2018-01-04 Huawei Technologies Duesseldorf Gmbh Apparatuses and methods for encoding and decoding a multichannel audio signal
KR102561371B1 (ko) * 2016-07-11 2023-08-01 삼성전자주식회사 디스플레이장치와, 기록매체
WO2018064528A1 (en) * 2016-09-29 2018-04-05 The Trustees Of Princeton University Ambisonic navigation of sound fields from an array of microphones
CN107945810B (zh) * 2016-10-13 2021-12-14 杭州米谟科技有限公司 用于编码和解码hoa或多声道数据的方法和装置
US20180107926A1 (en) * 2016-10-19 2018-04-19 Samsung Electronics Co., Ltd. Method and apparatus for neural network quantization
US11321609B2 (en) 2016-10-19 2022-05-03 Samsung Electronics Co., Ltd Method and apparatus for neural network quantization
CN109804645A (zh) * 2016-10-31 2019-05-24 谷歌有限责任公司 基于投影的音频代码化
CN108206021B (zh) * 2016-12-16 2020-12-18 南京青衿信息科技有限公司 一种后向兼容式三维声编码器、解码器及其编解码方法
KR20190118212A (ko) * 2017-01-24 2019-10-18 주식회사 알티스트 차량 상태 모니터링 시스템 및 방법
US20180317006A1 (en) 2017-04-28 2018-11-01 Qualcomm Incorporated Microphone configurations
US9820073B1 (en) 2017-05-10 2017-11-14 Tls Corp. Extracting a common signal from multiple audio signals
US11277705B2 (en) 2017-05-15 2022-03-15 Dolby Laboratories Licensing Corporation Methods, systems and apparatus for conversion of spatial audio format(s) to speaker signals
US10390166B2 (en) * 2017-05-31 2019-08-20 Qualcomm Incorporated System and method for mixing and adjusting multi-input ambisonics
US10405126B2 (en) 2017-06-30 2019-09-03 Qualcomm Incorporated Mixed-order ambisonics (MOA) audio data for computer-mediated reality systems
EP3652735A1 (en) 2017-07-14 2020-05-20 Fraunhofer Gesellschaft zur Förderung der Angewand Concept for generating an enhanced sound field description or a modified sound field description using a multi-point sound field description
BR112020000759A2 (pt) * 2017-07-14 2020-07-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, método para gerar uma descrição aprimorada de campo sonoro, método para gerar uma descrição modificada de campo sonoro de uma descrição de campo sonoro e metadados em relação a informações espaciais da descrição de campo sonoro, programa de computador, descrição aprimorada de campo sonoro
KR102568365B1 (ko) 2017-07-14 2023-08-18 프라운 호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 깊이-확장형 DirAC 기술 또는 기타 기술을 이용하여 증강된 음장 묘사 또는 수정된 음장 묘사를 생성하기 위한 개념
US10075802B1 (en) 2017-08-08 2018-09-11 Qualcomm Incorporated Bitrate allocation for higher order ambisonic audio data
US10674301B2 (en) * 2017-08-25 2020-06-02 Google Llc Fast and memory efficient encoding of sound objects using spherical harmonic symmetries
US10764684B1 (en) 2017-09-29 2020-09-01 Katherine A. Franco Binaural audio using an arbitrarily shaped microphone array
US10986456B2 (en) * 2017-10-05 2021-04-20 Qualcomm Incorporated Spatial relation coding using virtual higher order ambisonic coefficients
KR102683551B1 (ko) 2017-10-05 2024-07-11 소니그룹주식회사 복호 장치 및 방법, 그리고 프로그램을 기록한 컴퓨터 판독가능 기록매체
CN111656442B (zh) 2017-11-17 2024-06-28 弗劳恩霍夫应用研究促进协会 使用量化和熵编码来编码或解码定向音频编码参数的装置和方法
US10595146B2 (en) 2017-12-21 2020-03-17 Verizon Patent And Licensing Inc. Methods and systems for extracting location-diffused ambient sound from a real-world scene
EP3506080B1 (en) * 2017-12-27 2023-06-07 Nokia Technologies Oy Audio scene processing
US11409923B1 (en) * 2018-01-22 2022-08-09 Ansys, Inc Systems and methods for generating reduced order models
FR3079706B1 (fr) 2018-03-29 2021-06-04 Inst Mines Telecom Procede et systeme de diffusion d'un flux audio multicanal a des terminaux de spectateurs assistant a un evenement sportif
GB2572650A (en) * 2018-04-06 2019-10-09 Nokia Technologies Oy Spatial audio parameters and associated spatial audio playback
US10672405B2 (en) * 2018-05-07 2020-06-02 Google Llc Objective quality metrics for ambisonic spatial audio
CN108831494B (zh) * 2018-05-29 2022-07-19 平安科技(深圳)有限公司 语音增强方法、装置、计算机设备及存储介质
GB2574873A (en) * 2018-06-21 2019-12-25 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US10999693B2 (en) 2018-06-25 2021-05-04 Qualcomm Incorporated Rendering different portions of audio data using different renderers
US12056594B2 (en) * 2018-06-27 2024-08-06 International Business Machines Corporation Low precision deep neural network enabled by compensation instructions
US11798569B2 (en) 2018-10-02 2023-10-24 Qualcomm Incorporated Flexible rendering of audio data
EP4220639A1 (en) * 2018-10-26 2023-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Directional loudness map based audio processing
US12009001B2 (en) 2018-10-31 2024-06-11 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
GB2578625A (en) 2018-11-01 2020-05-20 Nokia Technologies Oy Apparatus, methods and computer programs for encoding spatial metadata
ES2969138T3 (es) * 2018-12-07 2024-05-16 Fraunhofer Ges Forschung Aparato, método y programa informático para codificación, decodificación, procesamiento de escenas y otros procedimientos relacionados con codificación de audio espacial basada en dirac que utiliza compensación directa de componentes
FR3090179B1 (fr) * 2018-12-14 2021-04-09 Fond B Com Procédé d’interpolation d’un champ sonore, produit programme d’ordinateur et dispositif correspondants.
CA3123982C (en) * 2018-12-19 2024-03-12 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for reproducing a spatially extended sound source or apparatus and method for generating a bitstream from a spatially extended sound source
KR102277952B1 (ko) * 2019-01-11 2021-07-19 브레인소프트주식회사 디제이 변환에 의한 주파수 추출 방법
EP3706119A1 (fr) * 2019-03-05 2020-09-09 Orange Codage audio spatialisé avec interpolation et quantification de rotations
GB2582748A (en) * 2019-03-27 2020-10-07 Nokia Technologies Oy Sound field related rendering
RU2722223C1 (ru) * 2019-04-16 2020-05-28 Вадим Иванович Филиппов Способ сжатия многомерных образов путем приближения элементов пространств Lp{ (0, 1]m} , p больше или равно 1 и меньше бесконечности, по системам сжатий и сдвигов одной функции рядами типа Фурье с целыми коэффциентами и целочисленное разложение элементов многомодулярных пространств
US12073842B2 (en) * 2019-06-24 2024-08-27 Qualcomm Incorporated Psychoacoustic audio coding of ambisonic audio data
US11538489B2 (en) * 2019-06-24 2022-12-27 Qualcomm Incorporated Correlating scene-based audio data for psychoacoustic audio coding
GB2586214A (en) * 2019-07-31 2021-02-17 Nokia Technologies Oy Quantization of spatial audio direction parameters
WO2021026314A1 (en) * 2019-08-08 2021-02-11 Boomcloud 360, Inc. Nonlinear adaptive filterbanks for psychoacoustic frequency range extension
CN114303392A (zh) * 2019-08-30 2022-04-08 杜比实验室特许公司 多声道音频信号的声道标识
GB2587196A (en) * 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
US11430451B2 (en) * 2019-09-26 2022-08-30 Apple Inc. Layered coding of audio with discrete objects
CN110708647B (zh) * 2019-10-29 2020-12-25 扆亮海 一种球面分配引导的数据匹配立体声场重构方法
GB2590906A (en) * 2019-12-19 2021-07-14 Nomono As Wireless microphone with local storage
US11636866B2 (en) 2020-03-24 2023-04-25 Qualcomm Incorporated Transform ambisonic coefficients using an adaptive network
CN113593585A (zh) * 2020-04-30 2021-11-02 华为技术有限公司 音频信号的比特分配方法和装置
GB2595871A (en) * 2020-06-09 2021-12-15 Nokia Technologies Oy The reduction of spatial audio parameters
WO2022046155A1 (en) * 2020-08-28 2022-03-03 Google Llc Maintaining invariance of sensory dissonance and sound localization cues in audio codecs
FR3113993B1 (fr) * 2020-09-09 2023-02-24 Arkamys Procédé de spatialisation sonore
WO2022066313A1 (en) * 2020-09-25 2022-03-31 Apple Inc. Higher order ambisonics encoding and decoding
CN112327398B (zh) * 2020-11-20 2022-03-08 中国科学院上海光学精密机械研究所 一种矢量补偿体布拉格光栅角度偏转器的制备方法
US11743670B2 (en) 2020-12-18 2023-08-29 Qualcomm Incorporated Correlation-based rendering with multiple distributed streams accounting for an occlusion for six degree of freedom applications
US11521623B2 (en) 2021-01-11 2022-12-06 Bank Of America Corporation System and method for single-speaker identification in a multi-speaker environment on a low-frequency audio recording
CN113518299B (zh) * 2021-04-30 2022-06-03 电子科技大学 一种改进的源分量及环境分量提取方法、设备及计算机可读存储介质
CN113345448B (zh) * 2021-05-12 2022-08-05 北京大学 一种基于独立成分分析的hoa信号压缩方法
CN115376527A (zh) * 2021-05-17 2022-11-22 华为技术有限公司 三维音频信号编码方法、装置和编码器
CN115497485B (zh) * 2021-06-18 2024-10-18 华为技术有限公司 三维音频信号编码方法、装置、编码器和系统
CN113378063B (zh) * 2021-07-09 2023-07-28 小红书科技有限公司 一种基于滑动谱分解确定内容多样性的方法和内容排序方法
WO2023008831A1 (ko) * 2021-07-27 2023-02-02 브레인소프트 주식회사 해석적 방법에 기반한 디제이 변환 주파수 추출 방법
US20230051841A1 (en) * 2021-07-30 2023-02-16 Qualcomm Incorporated Xr rendering for 3d audio content and audio codec
CN113647978B (zh) * 2021-08-18 2023-11-21 重庆大学 一种带有截断因子的高鲁棒性符号相干系数超声成像方法

Family Cites Families (209)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1159034B (it) 1983-06-10 1987-02-25 Cselt Centro Studi Lab Telecom Sintetizzatore vocale
US4972344A (en) 1986-05-30 1990-11-20 Finial Technology, Inc. Dual beam optical turntable
US5012518A (en) * 1989-07-26 1991-04-30 Itt Corporation Low-bit-rate speech coder using LPC data reduction processing
US5363050A (en) 1990-08-31 1994-11-08 Guo Wendy W Quantitative dielectric imaging system
WO1992012607A1 (en) 1991-01-08 1992-07-23 Dolby Laboratories Licensing Corporation Encoder/decoder for multidimensional sound fields
US5757927A (en) 1992-03-02 1998-05-26 Trifield Productions Ltd. Surround sound apparatus
JP2626492B2 (ja) 1993-09-13 1997-07-02 日本電気株式会社 ベクトル量子化装置
US5790759A (en) 1995-09-19 1998-08-04 Lucent Technologies Inc. Perceptual noise masking measure based on synthesis filter frequency response
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
JP3707116B2 (ja) 1995-10-26 2005-10-19 ソニー株式会社 音声復号化方法及び装置
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3849210B2 (ja) 1996-09-24 2006-11-22 ヤマハ株式会社 音声符号化復号方式
US5821887A (en) 1996-11-12 1998-10-13 Intel Corporation Method and apparatus for decoding variable length codes
US6167375A (en) 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6072878A (en) 1997-09-24 2000-06-06 Sonic Solutions Multi-channel surround sound mastering and reproduction techniques that preserve spatial harmonics
US6263312B1 (en) 1997-10-03 2001-07-17 Alaris, Inc. Audio compression and decompression employing subband decomposition of residual signal and distortion reduction
JP3211762B2 (ja) 1997-12-12 2001-09-25 日本電気株式会社 音声及び音楽符号化方式
AUPP272698A0 (en) 1998-03-31 1998-04-23 Lake Dsp Pty Limited Soundfield playback from a single speaker system
EP1018840A3 (en) 1998-12-08 2005-12-21 Canon Kabushiki Kaisha Digital receiving apparatus and method
EP1095370A1 (en) 1999-04-05 2001-05-02 Hughes Electronics Corporation Spectral phase modeling of the prototype waveform components for a frequency domain interpolative speech codec system
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
JP2002094989A (ja) 2000-09-14 2002-03-29 Pioneer Electronic Corp ビデオ信号符号化装置及びビデオ信号符号化方法
US7660424B2 (en) 2001-02-07 2010-02-09 Dolby Laboratories Licensing Corporation Audio channel spatial translation
US20020169735A1 (en) 2001-03-07 2002-11-14 David Kil Automatic mapping from data to preprocessing algorithms
GB2379147B (en) 2001-04-18 2003-10-22 Univ York Sound processing
US20030147539A1 (en) * 2002-01-11 2003-08-07 Mh Acoustics, Llc, A Delaware Corporation Audio system based on at least second-order eigenbeams
US7031894B2 (en) * 2002-01-16 2006-04-18 Timbre Technologies, Inc. Generating a library of simulated-diffraction signals and hypothetical profiles of periodic gratings
US7262770B2 (en) 2002-03-21 2007-08-28 Microsoft Corporation Graphics image rendering with radiance self-transfer for low-frequency lighting environments
US20030223603A1 (en) * 2002-05-28 2003-12-04 Beckman Kenneth Oren Sound space replication
US8160269B2 (en) 2003-08-27 2012-04-17 Sony Computer Entertainment Inc. Methods and apparatuses for adjusting a listening area for capturing sounds
ES2378462T3 (es) 2002-09-04 2012-04-12 Microsoft Corporation Codificación entrópica por adaptación de codificación entre modalidades de nivel y de longitud/nivel de cadencia
FR2844894B1 (fr) 2002-09-23 2004-12-17 Remy Henri Denis Bruno Procede et systeme de traitement d'une representation d'un champ acoustique
US7330812B2 (en) 2002-10-04 2008-02-12 National Research Council Of Canada Method and apparatus for transmitting an audio stream having additional payload in a hidden sub-channel
FR2847376B1 (fr) 2002-11-19 2005-02-04 France Telecom Procede de traitement de donnees sonores et dispositif d'acquisition sonore mettant en oeuvre ce procede
US6961696B2 (en) 2003-02-07 2005-11-01 Motorola, Inc. Class quantization for distributed speech recognition
FI115324B (fi) * 2003-03-14 2005-04-15 Elekta Neuromag Oy Menetelmä ja järjestelmä monikanavaisen mittaussignaalin käsittelemiseksi
US7558393B2 (en) 2003-03-18 2009-07-07 Miller Iii Robert E System and method for compatible 2D/3D (full sphere with height) surround sound reproduction
US7920709B1 (en) 2003-03-25 2011-04-05 Robert Hickling Vector sound-intensity probes operating in a half-space
JP2005086486A (ja) 2003-09-09 2005-03-31 Alpine Electronics Inc オーディオ装置およびオーディオ処理方法
US7433815B2 (en) 2003-09-10 2008-10-07 Dilithium Networks Pty Ltd. Method and apparatus for voice transcoding between variable rate coders
US7447317B2 (en) 2003-10-02 2008-11-04 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V Compatible multi-channel coding/decoding by weighting the downmix channel
KR100556911B1 (ko) 2003-12-05 2006-03-03 엘지전자 주식회사 무선 동영상 스트리밍 서비스를 위한 동영상 데이터의 구조
KR100629997B1 (ko) 2004-02-26 2006-09-27 엘지전자 주식회사 오디오 신호의 인코딩 방법
US7283634B2 (en) 2004-08-31 2007-10-16 Dts, Inc. Method of mixing audio channels using correlated outputs
US7630902B2 (en) 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
FR2880755A1 (fr) 2005-01-10 2006-07-14 France Telecom Procede et dispositif d'individualisation de hrtfs par modelisation
KR100636229B1 (ko) 2005-01-14 2006-10-19 학교법인 성균관대학 신축형 부호화를 위한 적응적 엔트로피 부호화 및 복호화방법과 그 장치
EP1845339B1 (en) 2005-03-30 2011-12-28 Aisin Aw Co., Ltd. Navigation system for vehicle
US7271747B2 (en) 2005-05-10 2007-09-18 Rice University Method and apparatus for distributed compressed sensing
US8170883B2 (en) * 2005-05-26 2012-05-01 Lg Electronics Inc. Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal
ATE378793T1 (de) 2005-06-23 2007-11-15 Akg Acoustics Gmbh Methode zur modellierung eines mikrofons
US7599840B2 (en) * 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
JP2009518659A (ja) 2005-09-27 2009-05-07 エルジー エレクトロニクス インコーポレイティド マルチチャネルオーディオ信号の符号化/復号化方法及び装置
US8510105B2 (en) * 2005-10-21 2013-08-13 Nokia Corporation Compression and decompression of data vectors
EP1946612B1 (fr) 2005-10-27 2012-11-14 France Télécom Individualisation de hrtfs utilisant une modelisation par elements finis couplee a un modele correctif
US8190425B2 (en) 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
CN101385075B (zh) 2006-02-07 2015-04-22 Lg电子株式会社 用于编码/解码信号的装置和方法
ATE527833T1 (de) 2006-05-04 2011-10-15 Lg Electronics Inc Verbesserung von stereo-audiosignalen mittels neuabmischung
US8712061B2 (en) 2006-05-17 2014-04-29 Creative Technology Ltd Phase-amplitude 3-D stereo encoder and decoder
US8379868B2 (en) * 2006-05-17 2013-02-19 Creative Technology Ltd Spatial audio coding based on universal spatial cues
US8345899B2 (en) 2006-05-17 2013-01-01 Creative Technology Ltd Phase-amplitude matrixed surround decoder
US20080004729A1 (en) 2006-06-30 2008-01-03 Nokia Corporation Direct encoding into a directional audio coding format
US7877253B2 (en) 2006-10-06 2011-01-25 Qualcomm Incorporated Systems, methods, and apparatus for frame erasure recovery
DE102006053919A1 (de) 2006-10-11 2008-04-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Erzeugen einer Anzahl von Lautsprechersignalen für ein Lautsprecher-Array, das einen Wiedergaberaum definiert
US7966175B2 (en) 2006-10-18 2011-06-21 Polycom, Inc. Fast lattice vector quantization
JP5394931B2 (ja) 2006-11-24 2014-01-22 エルジー エレクトロニクス インコーポレイティド オブジェクトベースオーディオ信号の復号化方法及びその装置
KR101111520B1 (ko) * 2006-12-07 2012-05-24 엘지전자 주식회사 오디오 처리 방법 및 장치
US7663623B2 (en) 2006-12-18 2010-02-16 Microsoft Corporation Spherical harmonics scaling
JP2008227946A (ja) 2007-03-13 2008-09-25 Toshiba Corp 画像復号装置
US8908873B2 (en) 2007-03-21 2014-12-09 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
US9015051B2 (en) 2007-03-21 2015-04-21 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Reconstruction of audio channels with direction parameters indicating direction of origin
US8290167B2 (en) 2007-03-21 2012-10-16 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Method and apparatus for conversion between multi-channel audio formats
JP5686594B2 (ja) 2007-04-12 2015-03-18 トムソン ライセンシングThomson Licensing スケーラブル・ビデオ符号化のためのビデオ・ユーザビリティ情報(vui)用の方法及び装置
US20080298610A1 (en) * 2007-05-30 2008-12-04 Nokia Corporation Parameter Space Re-Panning for Spatial Audio
US8180062B2 (en) * 2007-05-30 2012-05-15 Nokia Corporation Spatial sound zooming
JP5291096B2 (ja) * 2007-06-08 2013-09-18 エルジー エレクトロニクス インコーポレイティド オーディオ信号処理方法及び装置
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
WO2009007639A1 (fr) 2007-07-03 2009-01-15 France Telecom Quantification apres transformation lineaire combinant les signaux audio d'une scene sonore, codeur associe
US8463615B2 (en) 2007-07-30 2013-06-11 Google Inc. Low-delay audio coder
EP2023339B1 (en) 2007-07-30 2010-08-25 Global IP Solutions (GIPS) AB A low-delay audio coder
JP5264913B2 (ja) 2007-09-11 2013-08-14 ヴォイスエイジ・コーポレーション 話声およびオーディオの符号化における、代数符号帳の高速検索のための方法および装置
WO2009046223A2 (en) 2007-10-03 2009-04-09 Creative Technology Ltd Spatial audio analysis and synthesis for binaural reproduction and format conversion
US8509454B2 (en) * 2007-11-01 2013-08-13 Nokia Corporation Focusing on a portion of an audio scene for an audio signal
WO2009067741A1 (en) 2007-11-27 2009-06-04 Acouity Pty Ltd Bandwidth compression of parametric soundfield representations for transmission and storage
US8306007B2 (en) 2008-01-16 2012-11-06 Panasonic Corporation Vector quantizer, vector inverse quantizer, and methods therefor
EP2094032A1 (en) 2008-02-19 2009-08-26 Deutsche Thomson OHG Audio signal, method and apparatus for encoding or transmitting the same and method and apparatus for processing the same
EP2259253B1 (en) 2008-03-03 2017-11-15 LG Electronics Inc. Method and apparatus for processing audio signal
ES2739667T3 (es) 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
US8219409B2 (en) * 2008-03-31 2012-07-10 Ecole Polytechnique Federale De Lausanne Audio wave field encoding
WO2009134820A2 (en) 2008-04-28 2009-11-05 Cornell University Tool for accurate quantification in molecular mri
US8184298B2 (en) 2008-05-21 2012-05-22 The Board Of Trustees Of The University Of Illinois Spatial light interference microscopy and fourier transform light scattering for cell and tissue characterization
US8452587B2 (en) 2008-05-30 2013-05-28 Panasonic Corporation Encoder, decoder, and the methods therefor
WO2010003837A1 (en) 2008-07-08 2010-01-14 Brüel & Kjær Sound & Vibration Measurement A/S Reconstructing an acoustic field
EP2144230A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme having cascaded switches
GB0817950D0 (en) 2008-10-01 2008-11-05 Univ Southampton Apparatus and method for sound reproduction
JP5697301B2 (ja) 2008-10-01 2015-04-08 株式会社Nttドコモ 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム、動画像復号プログラム、及び動画像符号化・復号システム
US8207890B2 (en) 2008-10-08 2012-06-26 Qualcomm Atheros, Inc. Providing ephemeris data and clock corrections to a satellite navigation system receiver
US8391500B2 (en) 2008-10-17 2013-03-05 University Of Kentucky Research Foundation Method and system for creating three-dimensional spatial audio
FR2938688A1 (fr) 2008-11-18 2010-05-21 France Telecom Codage avec mise en forme du bruit dans un codeur hierarchique
WO2010070225A1 (fr) 2008-12-15 2010-06-24 France Telecom Codage perfectionne de signaux audionumeriques multicanaux
US8817991B2 (en) 2008-12-15 2014-08-26 Orange Advanced encoding of multi-channel digital audio signals
EP2205007B1 (en) 2008-12-30 2019-01-09 Dolby International AB Method and apparatus for three-dimensional acoustic field encoding and optimal reconstruction
US8332229B2 (en) 2008-12-30 2012-12-11 Stmicroelectronics Asia Pacific Pte. Ltd. Low complexity MPEG encoding for surround sound recordings
WO2010086342A1 (en) 2009-01-28 2010-08-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder, audio decoder, method for encoding an input audio information, method for decoding an input audio information and computer program using improved coding tables
GB2478834B (en) * 2009-02-04 2012-03-07 Richard Furse Sound system
JP5163545B2 (ja) 2009-03-05 2013-03-13 富士通株式会社 オーディオ復号装置及びオーディオ復号方法
EP2237270B1 (en) 2009-03-30 2012-07-04 Nuance Communications, Inc. A method for determining a noise reference signal for noise compensation and/or noise reduction
GB0906269D0 (en) 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
WO2011022027A2 (en) 2009-05-08 2011-02-24 University Of Utah Research Foundation Annular thermoacoustic energy converter
US8570291B2 (en) 2009-05-21 2013-10-29 Panasonic Corporation Tactile processing device
ES2524428T3 (es) * 2009-06-24 2014-12-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Decodificador de señales de audio, procedimiento para decodificar una señal de audio y programa de computación que utiliza etapas en cascada de procesamiento de objetos de audio
ES2690164T3 (es) 2009-06-25 2018-11-19 Dts Licensing Limited Dispositivo y método para convertir una señal de audio espacial
EP2486561B1 (en) 2009-10-07 2016-03-30 The University Of Sydney Reconstruction of a recorded sound field
KR101370192B1 (ko) 2009-10-15 2014-03-05 비덱스 에이/에스 오디오 코덱을 갖는 보청기 및 방법
CN102598125B (zh) 2009-11-13 2014-07-02 松下电器产业株式会社 编码装置、解码装置及其方法
JP5427565B2 (ja) * 2009-11-24 2014-02-26 株式会社日立製作所 Mri装置用磁場調整
UA100353C2 (uk) 2009-12-07 2012-12-10 Долбі Лабораторіс Лайсензін Корпорейшн Декодування цифрових потоків кодованого багатоканального аудіосигналу з використанням адаптивного гібридного перетворення
EP2346028A1 (en) * 2009-12-17 2011-07-20 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. An apparatus and a method for converting a first parametric spatial audio signal into a second parametric spatial audio signal
CN102104452B (zh) 2009-12-22 2013-09-11 华为技术有限公司 信道状态信息反馈方法、信道状态信息获得方法及设备
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
US9058803B2 (en) 2010-02-26 2015-06-16 Orange Multichannel audio stream compression
KR101445296B1 (ko) 2010-03-10 2014-09-29 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 샘플링 레이트 의존 시간 왜곡 윤곽 인코딩을 이용하는 오디오 신호 디코더, 오디오 신호 인코더, 방법, 및 컴퓨터 프로그램
WO2011117399A1 (en) 2010-03-26 2011-09-29 Thomson Licensing Method and device for decoding an audio soundfield representation for audio playback
EP2375410B1 (en) 2010-03-29 2017-11-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. A spatial audio processor and a method for providing spatial parameters based on an acoustic input signal
JP5850216B2 (ja) 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
TW201214415A (en) 2010-05-28 2012-04-01 Fraunhofer Ges Forschung Low-delay unified speech and audio codec
US9053697B2 (en) 2010-06-01 2015-06-09 Qualcomm Incorporated Systems, methods, devices, apparatus, and computer program products for audio equalization
US9357229B2 (en) 2010-07-28 2016-05-31 Qualcomm Incorporated Coding motion vectors in video coding
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
NZ587483A (en) 2010-08-20 2012-12-21 Ind Res Ltd Holophonic speaker system with filters that are pre-configured based on acoustic transfer functions
US9271081B2 (en) 2010-08-27 2016-02-23 Sonicemotion Ag Method and device for enhanced sound field reproduction of spatially encoded audio input signals
CN101977349A (zh) 2010-09-29 2011-02-16 华南理工大学 Ambisonic声重发系统解码的优化改进方法
CN103155591B (zh) 2010-10-14 2015-09-09 杜比实验室特许公司 使用自适应频域滤波和动态快速卷积的自动均衡方法及装置
US20120093323A1 (en) 2010-10-14 2012-04-19 Samsung Electronics Co., Ltd. Audio system and method of down mixing audio signals using the same
US9552840B2 (en) 2010-10-25 2017-01-24 Qualcomm Incorporated Three-dimensional sound capturing and reproducing with multi-microphones
EP2451196A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Method and apparatus for generating and for decoding sound field data including ambisonics sound field data of an order higher than three
EP2450880A1 (en) 2010-11-05 2012-05-09 Thomson Licensing Data structure for Higher Order Ambisonics audio data
KR101401775B1 (ko) 2010-11-10 2014-05-30 한국전자통신연구원 스피커 어레이 기반 음장 합성을 이용한 음장 재생 장치 및 방법
US9448289B2 (en) 2010-11-23 2016-09-20 Cornell University Background field removal method for MRI using projection onto dipole fields
ES2643163T3 (es) 2010-12-03 2017-11-21 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Aparato y procedimiento para codificación de audio espacial basada en geometría
EP2464146A1 (en) * 2010-12-10 2012-06-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for decomposing an input signal using a pre-calculated reference curve
EP2469741A1 (en) 2010-12-21 2012-06-27 Thomson Licensing Method and apparatus for encoding and decoding successive frames of an ambisonics representation of a 2- or 3-dimensional sound field
US20120163622A1 (en) 2010-12-28 2012-06-28 Stmicroelectronics Asia Pacific Pte Ltd Noise detection and reduction in audio devices
EP2661748A2 (en) 2011-01-06 2013-11-13 Hank Risan Synthetic simulation of a media recording
US9008176B2 (en) 2011-01-22 2015-04-14 Qualcomm Incorporated Combined reference picture list construction for video coding
US20120189052A1 (en) 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
DK3182409T3 (en) * 2011-02-03 2018-06-14 Ericsson Telefon Ab L M DETERMINING THE INTERCHANNEL TIME DIFFERENCE FOR A MULTI-CHANNEL SIGNAL
WO2012122397A1 (en) 2011-03-09 2012-09-13 Srs Labs, Inc. System for dynamically creating and rendering audio objects
CN103620675B (zh) 2011-04-21 2015-12-23 三星电子株式会社 对线性预测编码系数进行量化的设备、声音编码设备、对线性预测编码系数进行反量化的设备、声音解码设备及其电子装置
EP2541547A1 (en) 2011-06-30 2013-01-02 Thomson Licensing Method and apparatus for changing the relative positions of sound objects contained within a higher-order ambisonics representation
KR102003191B1 (ko) * 2011-07-01 2019-07-24 돌비 레버러토리즈 라이쎈싱 코오포레이션 적응형 오디오 신호 생성, 코딩 및 렌더링을 위한 시스템 및 방법
US8548803B2 (en) * 2011-08-08 2013-10-01 The Intellisis Corporation System and method of processing a sound signal including transforming the sound signal into a frequency-chirp domain
US9641951B2 (en) 2011-08-10 2017-05-02 The Johns Hopkins University System and method for fast binaural rendering of complex acoustic scenes
EP2560161A1 (en) 2011-08-17 2013-02-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Optimal mixing matrices and usage of decorrelators in spatial audio processing
EP2592846A1 (en) 2011-11-11 2013-05-15 Thomson Licensing Method and apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
EP2592845A1 (en) 2011-11-11 2013-05-15 Thomson Licensing Method and Apparatus for processing signals of a spherical microphone array on a rigid sphere used for generating an Ambisonics representation of the sound field
EP2600343A1 (en) 2011-12-02 2013-06-05 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for merging geometry - based spatial audio coding streams
KR101590332B1 (ko) 2012-01-09 2016-02-18 삼성전자주식회사 영상장치 및 그 제어방법
JP2015509212A (ja) 2012-01-19 2015-03-26 コーニンクレッカ フィリップス エヌ ヴェ 空間オーディオ・レンダリング及び符号化
EP2637427A1 (en) 2012-03-06 2013-09-11 Thomson Licensing Method and apparatus for playback of a higher-order ambisonics audio signal
EP2645748A1 (en) 2012-03-28 2013-10-02 Thomson Licensing Method and apparatus for decoding stereo loudspeaker signals from a higher-order Ambisonics audio signal
EP2839461A4 (en) * 2012-04-19 2015-12-16 Nokia Technologies Oy AUDIO SCENE APPARATUS
EP2665208A1 (en) 2012-05-14 2013-11-20 Thomson Licensing Method and apparatus for compressing and decompressing a Higher Order Ambisonics signal representation
US9190065B2 (en) * 2012-07-15 2015-11-17 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US20140086416A1 (en) 2012-07-15 2014-03-27 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for three-dimensional audio coding using basis function coefficients
US9288603B2 (en) 2012-07-15 2016-03-15 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for backward-compatible audio coding
CN104584588B (zh) * 2012-07-16 2017-03-29 杜比国际公司 用于渲染音频声场表示以供音频回放的方法和设备
EP2688066A1 (en) 2012-07-16 2014-01-22 Thomson Licensing Method and apparatus for encoding multi-channel HOA audio signals for noise reduction, and method and apparatus for decoding multi-channel HOA audio signals for noise reduction
US9473870B2 (en) 2012-07-16 2016-10-18 Qualcomm Incorporated Loudspeaker position compensation with 3D-audio hierarchical coding
JP6279569B2 (ja) 2012-07-19 2018-02-14 ドルビー・インターナショナル・アーベー マルチチャンネルオーディオ信号のレンダリングを改善する方法及び装置
US9516446B2 (en) 2012-07-20 2016-12-06 Qualcomm Incorporated Scalable downmix design for object-based surround codec with cluster analysis by synthesis
US9761229B2 (en) 2012-07-20 2017-09-12 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for audio object clustering
JP5967571B2 (ja) 2012-07-26 2016-08-10 本田技研工業株式会社 音響信号処理装置、音響信号処理方法、及び音響信号処理プログラム
PL2915166T3 (pl) 2012-10-30 2019-04-30 Nokia Technologies Oy Sposób i urządzenie do kwantyzacji odpornego wektora
US9336771B2 (en) 2012-11-01 2016-05-10 Google Inc. Speech recognition using non-parametric models
EP2743922A1 (en) 2012-12-12 2014-06-18 Thomson Licensing Method and apparatus for compressing and decompressing a higher order ambisonics representation for a sound field
US9913064B2 (en) 2013-02-07 2018-03-06 Qualcomm Incorporated Mapping virtual speakers to physical speakers
US9883310B2 (en) 2013-02-08 2018-01-30 Qualcomm Incorporated Obtaining symmetry information for higher order ambisonic audio renderers
EP2765791A1 (en) 2013-02-08 2014-08-13 Thomson Licensing Method and apparatus for determining directions of uncorrelated sound sources in a higher order ambisonics representation of a sound field
US10178489B2 (en) 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
US9609452B2 (en) 2013-02-08 2017-03-28 Qualcomm Incorporated Obtaining sparseness information for higher order ambisonic audio renderers
US9338420B2 (en) 2013-02-15 2016-05-10 Qualcomm Incorporated Video analysis assisted generation of multi-channel audio data
CN104010265A (zh) * 2013-02-22 2014-08-27 杜比实验室特许公司 音频空间渲染设备及方法
US9685163B2 (en) * 2013-03-01 2017-06-20 Qualcomm Incorporated Transforming spherical harmonic coefficients
SG11201507066PA (en) 2013-03-05 2015-10-29 Fraunhofer Ges Forschung Apparatus and method for multichannel direct-ambient decomposition for audio signal processing
US9197962B2 (en) * 2013-03-15 2015-11-24 Mh Acoustics Llc Polyhedral audio system based on at least second-order eigenbeams
EP2800401A1 (en) 2013-04-29 2014-11-05 Thomson Licensing Method and Apparatus for compressing and decompressing a Higher Order Ambisonics representation
JP6515087B2 (ja) 2013-05-16 2019-05-15 コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. オーディオ処理装置及び方法
US10499176B2 (en) 2013-05-29 2019-12-03 Qualcomm Incorporated Identifying codebooks to use when coding spatial components of a sound field
US9466305B2 (en) 2013-05-29 2016-10-11 Qualcomm Incorporated Performing positional analysis to code spherical harmonic coefficients
US9384741B2 (en) * 2013-05-29 2016-07-05 Qualcomm Incorporated Binauralization of rotated higher order ambisonics
US9691406B2 (en) * 2013-06-05 2017-06-27 Dolby Laboratories Licensing Corporation Method for encoding audio signals, apparatus for encoding audio signals, method for decoding audio signals and apparatus for decoding audio signals
EP4425489A2 (en) 2013-07-05 2024-09-04 Dolby International AB Enhanced soundfield coding using parametric component generation
TWI673707B (zh) 2013-07-19 2019-10-01 瑞典商杜比國際公司 將以L<sub>1</sub>個頻道為基礎之輸入聲音訊號產生至L<sub>2</sub>個揚聲器頻道之方法及裝置,以及得到一能量保留混音矩陣之方法及裝置,用以將以輸入頻道為基礎之聲音訊號混音以用於L<sub>1</sub>個聲音頻道至L<sub>2</sub>個揚聲器頻道
US20150127354A1 (en) 2013-10-03 2015-05-07 Qualcomm Incorporated Near field compensation for decomposed representations of a sound field
US9922656B2 (en) 2014-01-30 2018-03-20 Qualcomm Incorporated Transitioning of ambient higher-order ambisonic coefficients
US9489955B2 (en) 2014-01-30 2016-11-08 Qualcomm Incorporated Indicating frame parameter reusability for coding vectors
US20150243292A1 (en) * 2014-02-25 2015-08-27 Qualcomm Incorporated Order format signaling for higher-order ambisonic audio data
US20150264483A1 (en) 2014-03-14 2015-09-17 Qualcomm Incorporated Low frequency rendering of higher-order ambisonic audio data
US10770087B2 (en) 2014-05-16 2020-09-08 Qualcomm Incorporated Selecting codebooks for coding vectors decomposed from higher-order ambisonic audio signals
US9620137B2 (en) 2014-05-16 2017-04-11 Qualcomm Incorporated Determining between scalar and vector quantization in higher order ambisonic coefficients
US9852737B2 (en) 2014-05-16 2017-12-26 Qualcomm Incorporated Coding vectors decomposed from higher-order ambisonics audio signals
US9959876B2 (en) * 2014-05-16 2018-05-01 Qualcomm Incorporated Closed loop quantization of higher order ambisonic coefficients
US20150332682A1 (en) * 2014-05-16 2015-11-19 Qualcomm Incorporated Spatial relation coding for higher order ambisonic coefficients
US10142642B2 (en) 2014-06-04 2018-11-27 Qualcomm Incorporated Block adaptive color-space conversion coding
US9747910B2 (en) 2014-09-26 2017-08-29 Qualcomm Incorporated Switching between predictive and non-predictive quantization techniques in a higher order ambisonics (HOA) framework
US20160093308A1 (en) 2014-09-26 2016-03-31 Qualcomm Incorporated Predictive vector quantization techniques in a higher order ambisonics (hoa) framework

Also Published As

Publication number Publication date
SG11201509462VA (en) 2015-12-30
JP6290498B2 (ja) 2018-03-07
CN105580072B (zh) 2019-10-22
BR112015030102B1 (pt) 2022-08-23
US9769586B2 (en) 2017-09-19
JP2016526189A (ja) 2016-09-01
EP3107094A1 (en) 2016-12-21
HUE039457T2 (hu) 2019-01-28
WO2014194109A1 (en) 2014-12-04
US9716959B2 (en) 2017-07-25
EP3005360A1 (en) 2016-04-13
TW201511583A (zh) 2015-03-16
WO2014194084A1 (en) 2014-12-04
EP3005360B1 (en) 2017-05-03
KR101795900B1 (ko) 2017-11-08
EP3005358B1 (en) 2017-06-28
WO2014194090A9 (en) 2015-03-26
WO2014194115A1 (en) 2014-12-04
EP3005359B1 (en) 2017-05-10
US20140358561A1 (en) 2014-12-04
EP3005359A1 (en) 2016-04-13
KR20160013133A (ko) 2016-02-03
US9749768B2 (en) 2017-08-29
TW201509200A (zh) 2015-03-01
WO2014194107A1 (en) 2014-12-04
US9883312B2 (en) 2018-01-30
US20160381482A1 (en) 2016-12-29
EP3107094B1 (en) 2018-07-04
CN105580072A (zh) 2016-05-11
PH12015502634B1 (en) 2016-03-07
US20140358558A1 (en) 2014-12-04
RU2015151021A (ru) 2017-07-04
HUE033545T2 (hu) 2017-12-28
EP3005358A1 (en) 2016-04-13
WO2014194105A1 (en) 2014-12-04
KR20160016879A (ko) 2016-02-15
JP2016523468A (ja) 2016-08-08
US20240276166A1 (en) 2024-08-15
KR20160016885A (ko) 2016-02-15
US20140355770A1 (en) 2014-12-04
KR20160015264A (ko) 2016-02-12
KR20160016877A (ko) 2016-02-15
WO2014194080A1 (en) 2014-12-04
AU2014274076B2 (en) 2019-11-21
AU2014274076A1 (en) 2015-12-24
CA2912810C (en) 2021-12-28
JP2016523376A (ja) 2016-08-08
CN105340009A (zh) 2016-02-17
KR20160013125A (ko) 2016-02-03
US20140358559A1 (en) 2014-12-04
WO2014194116A1 (en) 2014-12-04
CN105284132B (zh) 2018-02-02
WO2014194110A1 (en) 2014-12-04
US20140358563A1 (en) 2014-12-04
CN105917407B (zh) 2020-04-24
PH12015502634A1 (en) 2016-03-07
TWI645723B (zh) 2018-12-21
CN105284131A (zh) 2016-01-27
EP3005361A1 (en) 2016-04-13
CN110767242A (zh) 2020-02-07
KR102190201B1 (ko) 2020-12-11
ES2635327T3 (es) 2017-10-03
US11146903B2 (en) 2021-10-12
CN110767242B (zh) 2024-05-24
US20140358565A1 (en) 2014-12-04
HUE046520T2 (hu) 2020-03-30
ES2641175T3 (es) 2017-11-08
CN105284131B (zh) 2018-09-18
CN105264598A (zh) 2016-01-20
EP3107093A1 (en) 2016-12-21
CN105340009B (zh) 2019-08-09
KR102407554B1 (ko) 2022-06-13
KR20160016883A (ko) 2016-02-15
ZA201509227B (en) 2022-01-26
KR20210094128A (ko) 2021-07-28
JP6199519B2 (ja) 2017-09-20
EP3107095A1 (en) 2016-12-21
JP2017199013A (ja) 2017-11-02
JP2016524727A (ja) 2016-08-18
IL242648B (en) 2018-12-31
CN105284132A (zh) 2016-01-27
US20140358266A1 (en) 2014-12-04
US9495968B2 (en) 2016-11-15
US20140355771A1 (en) 2014-12-04
US20220030372A1 (en) 2022-01-27
KR101961986B1 (ko) 2019-03-25
WO2014194106A1 (en) 2014-12-04
JP6121625B2 (ja) 2017-04-26
KR101877605B1 (ko) 2018-07-12
US11962990B2 (en) 2024-04-16
KR20160016881A (ko) 2016-02-15
KR20160013132A (ko) 2016-02-03
ES2764384T3 (es) 2020-06-03
JP2017142520A (ja) 2017-08-17
US9980074B2 (en) 2018-05-22
US10499176B2 (en) 2019-12-03
ES2689566T3 (es) 2018-11-14
UA116140C2 (uk) 2018-02-12
EP3282448A3 (en) 2018-04-11
KR101929092B1 (ko) 2018-12-13
US9763019B2 (en) 2017-09-12
US9502044B2 (en) 2016-11-22
KR20160016878A (ko) 2016-02-15
CN105917407A (zh) 2016-08-31
US20140355769A1 (en) 2014-12-04
US9774977B2 (en) 2017-09-26
EP3005361B1 (en) 2017-06-21
US20140358560A1 (en) 2014-12-04
EP3107095B1 (en) 2019-10-02
US9854377B2 (en) 2017-12-26
WO2014194075A1 (en) 2014-12-04
US20160366530A1 (en) 2016-12-15
CN105264598B (zh) 2018-12-18
EP3282448A2 (en) 2018-02-14
WO2014194099A1 (en) 2014-12-04
JP6449256B2 (ja) 2019-01-09
WO2014194090A1 (en) 2014-12-04
CA2912810A1 (en) 2014-12-04
RU2668059C2 (ru) 2018-09-25
MY174865A (en) 2020-05-19
JP6345771B2 (ja) 2018-06-20
JP6185159B2 (ja) 2017-08-23
US20140358562A1 (en) 2014-12-04
US20140358564A1 (en) 2014-12-04
HK1215752A1 (zh) 2016-09-09

Similar Documents

Publication Publication Date Title
BR112015030102A2 (pt) compressão de representações decompostas de campo sonoro
JP6542297B2 (ja) フレームパラメータ再使用可能性を示すこと
TWI670709B (zh) 獲得複數個高階立體混響(hoa)係數之方法,經組態以獲得複數個hoa係數器件,及用於判定權重值之器件
TWI612517B (zh) 較高階立體混響聲(hoa)架構中於預測及非預測量化技術間切換
CN106463129B (zh) 选择码簿以用于译码从高阶立体混响音频信号分解的向量
JP6293930B2 (ja) 高次アンビソニック係数においてスカラー量子化とベクトル量子化との間で決定すること
JP2017507350A (ja) 環境高次アンビソニックス係数の遷移
TW201621885A (zh) 較高階立體混響聲(hoa)架構中之預測向量量化技術
BR112015030103A2 (pt) compressão de representações decomposta de campo sonoro

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B06U Preliminary requirement: requests with searches performed by other patent offices: procedure suspended [chapter 6.21 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B350 Update of information on the portal [chapter 15.35 patent gazette]
B06A Patent application procedure suspended [chapter 6.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted [chapter 16.1 patent gazette]

Free format text: PRAZO DE VALIDADE: 20 (VINTE) ANOS CONTADOS A PARTIR DE 29/05/2014, OBSERVADAS AS CONDICOES LEGAIS