MX2022002895A - Determinacion de codificacion y decodificacion asociada de parametro de audio espacial. - Google Patents

Determinacion de codificacion y decodificacion asociada de parametro de audio espacial.

Info

Publication number
MX2022002895A
MX2022002895A MX2022002895A MX2022002895A MX2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A
Authority
MX
Mexico
Prior art keywords
spatial audio
audio signal
block
time
bits
Prior art date
Application number
MX2022002895A
Other languages
English (en)
Inventor
Adriana Vasilache
Original Assignee
Nokia Technologies Oy
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nokia Technologies Oy filed Critical Nokia Technologies Oy
Publication of MX2022002895A publication Critical patent/MX2022002895A/es

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/22Mode decision, i.e. based on audio signal content versus external parameters
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Mathematical Physics (AREA)
  • Quality & Reliability (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

Un aparato que comprende medios configurados para: generar parámetros de metadatos direccionales de señal de audio espacial para un bloque de tiempo-frecuencias; generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para un bloque de tiempo-frecuencias basándose en una primera resolución de cuantificación (203); comparar un número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación contra un número determinado de bits; emitir o almacenar los parámetros de metadatos direccionales de señal de audio espacial codificada para un bloque de tiempo-frecuencias (108) basándose en una primera resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias (108) basándose en la primera resolución de cuantificación es menor que un número determinado de bits (217); generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en una segunda resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias (108) basándose en la primera resolución de cuantificación es mayor que el número de bits determinado y una diferencia entre el número de bits determinado y el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es menor que un número determinado de bits que se encuentra dentro de un umbral determinado (217); generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en una tercera resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es mayor que el número de bits determinado y la diferencia entre el número de bits determinado y el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es mayor que el umbral determinado, en donde se determina la tercera resolución de cuantificación de manera que un número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias basándose en la tercera resolución de cuantificación es siempre igual o menor que el número de bits determinado (217).
MX2022002895A 2019-09-13 2020-09-09 Determinacion de codificacion y decodificacion asociada de parametro de audio espacial. MX2022002895A (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
GB1913274.5A GB2587196A (en) 2019-09-13 2019-09-13 Determination of spatial audio parameter encoding and associated decoding
PCT/FI2020/050578 WO2021048468A1 (en) 2019-09-13 2020-09-09 Determination of spatial audio parameter encoding and associated decoding

Publications (1)

Publication Number Publication Date
MX2022002895A true MX2022002895A (es) 2022-04-06

Family

ID=68315272

Family Applications (1)

Application Number Title Priority Date Filing Date
MX2022002895A MX2022002895A (es) 2019-09-13 2020-09-09 Determinacion de codificacion y decodificacion asociada de parametro de audio espacial.

Country Status (8)

Country Link
US (2) US12046250B2 (es)
EP (2) EP4365896A3 (es)
JP (1) JP7405962B2 (es)
KR (1) KR20220062599A (es)
CN (1) CN114365218A (es)
GB (1) GB2587196A (es)
MX (1) MX2022002895A (es)
WO (1) WO2021048468A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022223133A1 (en) * 2021-04-23 2022-10-27 Nokia Technologies Oy Spatial audio parameter encoding and associated decoding
GB2615607A (en) 2022-02-15 2023-08-16 Nokia Technologies Oy Parametric spatial audio rendering
WO2023179846A1 (en) 2022-03-22 2023-09-28 Nokia Technologies Oy Parametric spatial audio encoding
WO2024110006A1 (en) 2022-11-21 2024-05-30 Nokia Technologies Oy Determining frequency sub bands for spatial audio parameters
WO2024111300A1 (ja) * 2022-11-22 2024-05-30 富士フイルム株式会社 音データ作成方法及び音データ作成装置
GB2626953A (en) 2023-02-08 2024-08-14 Nokia Technologies Oy Audio rendering of spatial audio

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US7012630B2 (en) * 1996-02-08 2006-03-14 Verizon Services Corp. Spatial sound conference system and apparatus
US7930170B2 (en) 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
KR100682890B1 (ko) 2004-09-08 2007-02-15 삼성전자주식회사 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치
US7668715B1 (en) 2004-11-30 2010-02-23 Cirrus Logic, Inc. Methods for selecting an initial quantization step size in audio encoders and systems using the same
MX2008010836A (es) * 2006-02-24 2008-11-26 France Telecom Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente.
DE102008004674A1 (de) 2007-12-17 2009-06-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signalaufnahme mit variabler Richtcharakteristik
EP2154910A1 (en) 2008-08-13 2010-02-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus for merging spatial audio streams
EP2249334A1 (en) 2009-05-08 2010-11-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio format transcoder
JP5267362B2 (ja) * 2009-07-03 2013-08-21 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置
JP6250071B2 (ja) * 2013-02-21 2017-12-20 ドルビー・インターナショナル・アーベー パラメトリック・マルチチャネル・エンコードのための方法
US20140355769A1 (en) 2013-05-29 2014-12-04 Qualcomm Incorporated Energy preservation for decomposed representations of a sound field
EP3297298B1 (en) * 2016-09-19 2020-05-06 A-Volute Method for reproducing spatially distributed sounds
GB2559200A (en) * 2017-01-31 2018-08-01 Nokia Technologies Oy Stereo audio signal encoder
AU2018368589B2 (en) * 2017-11-17 2021-10-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding
WO2019170955A1 (en) * 2018-03-08 2019-09-12 Nokia Technologies Oy Audio coding
GB2575305A (en) 2018-07-05 2020-01-08 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
GB2575632A (en) * 2018-07-16 2020-01-22 Nokia Technologies Oy Sparse quantization of spatial audio parameters
GB2577698A (en) 2018-10-02 2020-04-08 Nokia Technologies Oy Selection of quantisation schemes for spatial audio parameter encoding
GB2585187A (en) 2019-06-25 2021-01-06 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding

Also Published As

Publication number Publication date
GB201913274D0 (en) 2019-10-30
EP4029015A4 (en) 2024-01-24
JP7405962B2 (ja) 2023-12-26
CN114365218A (zh) 2022-04-15
GB2587196A (en) 2021-03-24
EP4365896A2 (en) 2024-05-08
EP4365896A3 (en) 2024-05-22
US20240212696A1 (en) 2024-06-27
US20220343928A1 (en) 2022-10-27
EP4029015A1 (en) 2022-07-20
JP2022548038A (ja) 2022-11-16
US12046250B2 (en) 2024-07-23
KR20220062599A (ko) 2022-05-17
WO2021048468A1 (en) 2021-03-18

Similar Documents

Publication Publication Date Title
MX2022002895A (es) Determinacion de codificacion y decodificacion asociada de parametro de audio espacial.
MX2020005044A (es) Aparato y metodo para codificar o decodificar parametros de codificacion de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia.
ZA202107888B (en) Context coding for transform skip mode
EP4307679A3 (en) Luts with intra prediction modes and intra mode prediction from non-adjacent blocks
MX2021008910A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales.
MX2024001850A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales.
MX2024002052A (es) Codificador, decodificador, metodo de codificacion y metodo de decodificacion.
MX2021011338A (es) Procesamiento de residuos en codificacion de video.
MX2024005050A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales.
MX2021008616A (es) Aparato y método para codificar una representación de audio espacial o aparato y método para decodificar una señal de audio codificada utilizando metadatos de transporte y programas de computadora relacionados.
EP4307668A3 (en) Methods and apparatuses for encoding and decoding video according to coding order
GB2600624A9 (en) Adaptive bit rate ratio control
IL312390A (en) Methods and devices for producing or decoding a bit sequence comprising embedded audio signals
MX2024004940A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales.
AU2020316506A8 (en) Quantization process for palette mode
AU2018260836A1 (en) Encoder, decoder, system and methods for encoding and decoding
EP4373091A3 (en) Coding device, coding method, decoding device, and decoding method
MX2021015312A (es) Codificador, decodificador, metodos y programas informaticos con una escala mejorada basada en transformacion.
MX2021002620A (es) Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo de codificacion de datos tridimensionales y dispositivo de decodificacion de datos tridimensionales.
WO2020236719A3 (en) Transform design for large blocks in video coding
MX2021010562A (es) Seleccion de modelo de contexto impulsada en caso de uso para herramientas de codificacion de video hibridas.
MX2022005146A (es) Distribucion de tasa de bits en servicios inmersivos de voz y audio.
PH12021551118A1 (en) Tree-based transform unit (tu) partition for video coding
EP4325727A3 (en) Data processing method and device
EP4375994A3 (en) Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder