MX2022002895A - Determinacion de codificacion y decodificacion asociada de parametro de audio espacial. - Google Patents
Determinacion de codificacion y decodificacion asociada de parametro de audio espacial.Info
- Publication number
- MX2022002895A MX2022002895A MX2022002895A MX2022002895A MX2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A MX 2022002895 A MX2022002895 A MX 2022002895A
- Authority
- MX
- Mexico
- Prior art keywords
- spatial audio
- audio signal
- block
- time
- bits
- Prior art date
Links
- 238000013139 quantization Methods 0.000 abstract 12
- 230000005236 sound signal Effects 0.000 abstract 12
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/22—Mode decision, i.e. based on audio signal content versus external parameters
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Mathematical Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
Un aparato que comprende medios configurados para: generar parámetros de metadatos direccionales de señal de audio espacial para un bloque de tiempo-frecuencias; generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para un bloque de tiempo-frecuencias basándose en una primera resolución de cuantificación (203); comparar un número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación contra un número determinado de bits; emitir o almacenar los parámetros de metadatos direccionales de señal de audio espacial codificada para un bloque de tiempo-frecuencias (108) basándose en una primera resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias (108) basándose en la primera resolución de cuantificación es menor que un número determinado de bits (217); generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en una segunda resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias (108) basándose en la primera resolución de cuantificación es mayor que el número de bits determinado y una diferencia entre el número de bits determinado y el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es menor que un número determinado de bits que se encuentra dentro de un umbral determinado (217); generar parámetros de metadatos direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en una tercera resolución de cuantificación cuando el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es mayor que el número de bits determinado y la diferencia entre el número de bits determinado y el número de bits usados para los parámetros direccionales de señal de audio espacial codificada (108) para el bloque de tiempo-frecuencias basándose en la primera resolución de cuantificación es mayor que el umbral determinado, en donde se determina la tercera resolución de cuantificación de manera que un número de bits usados para los parámetros direccionales de señal de audio espacial codificada para el bloque de tiempo-frecuencias basándose en la tercera resolución de cuantificación es siempre igual o menor que el número de bits determinado (217).
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GB1913274.5A GB2587196A (en) | 2019-09-13 | 2019-09-13 | Determination of spatial audio parameter encoding and associated decoding |
PCT/FI2020/050578 WO2021048468A1 (en) | 2019-09-13 | 2020-09-09 | Determination of spatial audio parameter encoding and associated decoding |
Publications (1)
Publication Number | Publication Date |
---|---|
MX2022002895A true MX2022002895A (es) | 2022-04-06 |
Family
ID=68315272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
MX2022002895A MX2022002895A (es) | 2019-09-13 | 2020-09-09 | Determinacion de codificacion y decodificacion asociada de parametro de audio espacial. |
Country Status (8)
Country | Link |
---|---|
US (2) | US12046250B2 (es) |
EP (2) | EP4365896A3 (es) |
JP (1) | JP7405962B2 (es) |
KR (1) | KR20220062599A (es) |
CN (1) | CN114365218A (es) |
GB (1) | GB2587196A (es) |
MX (1) | MX2022002895A (es) |
WO (1) | WO2021048468A1 (es) |
Families Citing this family (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2022223133A1 (en) * | 2021-04-23 | 2022-10-27 | Nokia Technologies Oy | Spatial audio parameter encoding and associated decoding |
GB2615607A (en) | 2022-02-15 | 2023-08-16 | Nokia Technologies Oy | Parametric spatial audio rendering |
WO2023179846A1 (en) | 2022-03-22 | 2023-09-28 | Nokia Technologies Oy | Parametric spatial audio encoding |
WO2024110006A1 (en) | 2022-11-21 | 2024-05-30 | Nokia Technologies Oy | Determining frequency sub bands for spatial audio parameters |
WO2024111300A1 (ja) * | 2022-11-22 | 2024-05-30 | 富士フイルム株式会社 | 音データ作成方法及び音データ作成装置 |
GB2626953A (en) | 2023-02-08 | 2024-08-14 | Nokia Technologies Oy | Audio rendering of spatial audio |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US7012630B2 (en) * | 1996-02-08 | 2006-03-14 | Verizon Services Corp. | Spatial sound conference system and apparatus |
US7930170B2 (en) | 2001-01-11 | 2011-04-19 | Sasken Communication Technologies Limited | Computationally efficient audio coder |
KR100682890B1 (ko) | 2004-09-08 | 2007-02-15 | 삼성전자주식회사 | 비트량 고속제어가 가능한 오디오 부호화 방법 및 장치 |
US7668715B1 (en) | 2004-11-30 | 2010-02-23 | Cirrus Logic, Inc. | Methods for selecting an initial quantization step size in audio encoders and systems using the same |
MX2008010836A (es) * | 2006-02-24 | 2008-11-26 | France Telecom | Un metodo para codificacion binaria de indices de cuantificacion de una envoltura de señal, un metodo para descodificar una envoltura de señal, y modulos de codificacion y descodificacion correspondiente. |
DE102008004674A1 (de) | 2007-12-17 | 2009-06-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Signalaufnahme mit variabler Richtcharakteristik |
EP2154910A1 (en) | 2008-08-13 | 2010-02-17 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for merging spatial audio streams |
EP2249334A1 (en) | 2009-05-08 | 2010-11-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio format transcoder |
JP5267362B2 (ja) * | 2009-07-03 | 2013-08-21 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラムならびに映像伝送装置 |
JP6250071B2 (ja) * | 2013-02-21 | 2017-12-20 | ドルビー・インターナショナル・アーベー | パラメトリック・マルチチャネル・エンコードのための方法 |
US20140355769A1 (en) | 2013-05-29 | 2014-12-04 | Qualcomm Incorporated | Energy preservation for decomposed representations of a sound field |
EP3297298B1 (en) * | 2016-09-19 | 2020-05-06 | A-Volute | Method for reproducing spatially distributed sounds |
GB2559200A (en) * | 2017-01-31 | 2018-08-01 | Nokia Technologies Oy | Stereo audio signal encoder |
AU2018368589B2 (en) * | 2017-11-17 | 2021-10-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding or decoding directional audio coding parameters using quantization and entropy coding |
WO2019170955A1 (en) * | 2018-03-08 | 2019-09-12 | Nokia Technologies Oy | Audio coding |
GB2575305A (en) | 2018-07-05 | 2020-01-08 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
GB2575632A (en) * | 2018-07-16 | 2020-01-22 | Nokia Technologies Oy | Sparse quantization of spatial audio parameters |
GB2577698A (en) | 2018-10-02 | 2020-04-08 | Nokia Technologies Oy | Selection of quantisation schemes for spatial audio parameter encoding |
GB2585187A (en) | 2019-06-25 | 2021-01-06 | Nokia Technologies Oy | Determination of spatial audio parameter encoding and associated decoding |
-
2019
- 2019-09-13 GB GB1913274.5A patent/GB2587196A/en not_active Withdrawn
-
2020
- 2020-09-09 EP EP24157987.9A patent/EP4365896A3/en active Pending
- 2020-09-09 MX MX2022002895A patent/MX2022002895A/es unknown
- 2020-09-09 CN CN202080063807.3A patent/CN114365218A/zh active Pending
- 2020-09-09 KR KR1020227012049A patent/KR20220062599A/ko not_active Application Discontinuation
- 2020-09-09 EP EP20863003.8A patent/EP4029015A4/en active Pending
- 2020-09-09 JP JP2022516079A patent/JP7405962B2/ja active Active
- 2020-09-09 US US17/642,288 patent/US12046250B2/en active Active
- 2020-09-09 WO PCT/FI2020/050578 patent/WO2021048468A1/en active Application Filing
-
2024
- 2024-03-07 US US18/598,219 patent/US20240212696A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
GB201913274D0 (en) | 2019-10-30 |
EP4029015A4 (en) | 2024-01-24 |
JP7405962B2 (ja) | 2023-12-26 |
CN114365218A (zh) | 2022-04-15 |
GB2587196A (en) | 2021-03-24 |
EP4365896A2 (en) | 2024-05-08 |
EP4365896A3 (en) | 2024-05-22 |
US20240212696A1 (en) | 2024-06-27 |
US20220343928A1 (en) | 2022-10-27 |
EP4029015A1 (en) | 2022-07-20 |
JP2022548038A (ja) | 2022-11-16 |
US12046250B2 (en) | 2024-07-23 |
KR20220062599A (ko) | 2022-05-17 |
WO2021048468A1 (en) | 2021-03-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
MX2022002895A (es) | Determinacion de codificacion y decodificacion asociada de parametro de audio espacial. | |
MX2020005044A (es) | Aparato y metodo para codificar o decodificar parametros de codificacion de audio direccional utilizando diferentes resoluciones de tiempo/frecuencia. | |
ZA202107888B (en) | Context coding for transform skip mode | |
EP4307679A3 (en) | Luts with intra prediction modes and intra mode prediction from non-adjacent blocks | |
MX2021008910A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales. | |
MX2024001850A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales. | |
MX2024002052A (es) | Codificador, decodificador, metodo de codificacion y metodo de decodificacion. | |
MX2021011338A (es) | Procesamiento de residuos en codificacion de video. | |
MX2024005050A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales. | |
MX2021008616A (es) | Aparato y método para codificar una representación de audio espacial o aparato y método para decodificar una señal de audio codificada utilizando metadatos de transporte y programas de computadora relacionados. | |
EP4307668A3 (en) | Methods and apparatuses for encoding and decoding video according to coding order | |
GB2600624A9 (en) | Adaptive bit rate ratio control | |
IL312390A (en) | Methods and devices for producing or decoding a bit sequence comprising embedded audio signals | |
MX2024004940A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo codificador de datos tridimensionales y dispositivo decodificador de datos tridimensionales. | |
AU2020316506A8 (en) | Quantization process for palette mode | |
AU2018260836A1 (en) | Encoder, decoder, system and methods for encoding and decoding | |
EP4373091A3 (en) | Coding device, coding method, decoding device, and decoding method | |
MX2021015312A (es) | Codificador, decodificador, metodos y programas informaticos con una escala mejorada basada en transformacion. | |
MX2021002620A (es) | Metodo de codificacion de datos tridimensionales, metodo de decodificacion de datos tridimensionales, dispositivo de codificacion de datos tridimensionales y dispositivo de decodificacion de datos tridimensionales. | |
WO2020236719A3 (en) | Transform design for large blocks in video coding | |
MX2021010562A (es) | Seleccion de modelo de contexto impulsada en caso de uso para herramientas de codificacion de video hibridas. | |
MX2022005146A (es) | Distribucion de tasa de bits en servicios inmersivos de voz y audio. | |
PH12021551118A1 (en) | Tree-based transform unit (tu) partition for video coding | |
EP4325727A3 (en) | Data processing method and device | |
EP4375994A3 (en) | Multi-channel signal encoding method, multi-channel signal decoding method, encoder, and decoder |