ES2540215T3 - Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial - Google Patents
Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial Download PDFInfo
- Publication number
- ES2540215T3 ES2540215T3 ES12712126.7T ES12712126T ES2540215T3 ES 2540215 T3 ES2540215 T3 ES 2540215T3 ES 12712126 T ES12712126 T ES 12712126T ES 2540215 T3 ES2540215 T3 ES 2540215T3
- Authority
- ES
- Spain
- Prior art keywords
- icd
- value
- band
- values
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title abstract description 7
- 230000009466 transformation Effects 0.000 abstract description 8
- 208000024875 Infantile dystonia-parkinsonism Diseases 0.000 description 21
- 208000001543 infantile parkinsonism-dystonia Diseases 0.000 description 21
- 238000001228 spectrum Methods 0.000 description 9
- 230000001419 dependent effect Effects 0.000 description 4
- 230000011664 signaling Effects 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 3
- 230000021615 conjugation Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000007858 starting material Substances 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000005236 sound signal Effects 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/008—Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2400/00—Details of stereophonic systems covered by H04S but not provided for in its groups
- H04S2400/01—Multi-channel, i.e. more than two input channels, sound reproduction with two speakers wherein the multi-channel information is substantially preserved
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/01—Enhancing the perception of the sound image or of the spatial distribution using head related transfer functions [HRTF's] or equivalents thereof, e.g. interaural time difference [ITD] or interaural level difference [ILD]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereophonic System (AREA)
Abstract
Un método (30) para la estimación de diferencias inter-canal, ICD, que comprende: aplicar (30a, 30b) una transformación desde un dominio temporal a un dominio frecuencial para una pluralidad de señales de canal de audio; calcular (31, 32) una pluralidad de valores de ICD para las diferencias ICD entre al menos una de la pluralidad de señales de canal de audio y una señal de canal de audio de referencia en una gama de frecuencias predeterminada, calculándose cada valor de ICD en una parte de la gama de frecuencias predeterminada; calcular (35), para cada uno de la pluralidad de valores de ICD, un valor de ICD ponderado multiplicando cada uno de la pluralidad de valores de ICD con factor de ponderación que depende de la frecuencia correspondiente; y calcular (36) un valor de gama de ICD para la gama de frecuencias predeterminada añadiendo la pluralidad de valores de ICD ponderados.
Description
5
15
25
35
45
55
E12712126
22-06-2015
decodificada para una pluralidad de señales de canal de audio utilizando el valor de la gama ICD objeto de lectura desde la sección de parámetros del flujo de bits de audio recibido 1 según se proporciona por el módulo de extracción de parámetros 21. Por último, el módulo de transformación 25 puede acoplarse al módulo de mezcla en sentido ascendente 24 y configurarse para transformar la pluralidad de señales de canal de audio desde un dominio frecuencial a un dominio temporal para la reducción del sonido sobre la base de la pluralidad de señales de canal de audio.
La Figura 4 ilustra, de forma esquemática, una forma de realización de un método 30 para la codificación espacial paramétrica. El método 30 comprende, en una primera etapa, la realización de una transformación de tiempofrecuencia en canales de entrada, a modo de ejemplo, los canales de entrada 10a, 10b. En caso de una señal estéreo, se realiza una primera transformación en la etapa 30a y una segunda transformación se realiza en la etapa 30b. La transformación puede, en cada caso, realizarse utilizando la transformación de Fourier rápida (FFT). Como alternativa, puede realizarse la transformación de Fourier a corto plazo (STFT), el filtrado de modulación cosenoidal con un banco de filtros con modulación cosenoidal o un filtrado complejo con un banco de filtros complejos.
En una segunda etapa 31, puede calcularse un espectro cruzado c[b] por sub-banda b como
en donde X1[k] y X2[k] son los coeficientes de FFT de los dos canales 1 y 2, a modo de ejemplo, el canal izquierdo y el canal derecho en caso de estéreo. El asterisco “*” indica la conjugación compleja. kb d indica el bit de inicio de la sub-banda b y kb+1 indica el bit de inicio de la sub-banda próxima b+1. Por consiguiente, los contenedores de frecuencias [k] de FFT desde kb a kb+1 representan la sub-banda b.
Como alternativa, el espectro cruzado puede calcularse para cada contenedor de frecuencia k de FFT. En este caso, la sub-banda b corresponde directamente a un contenedor de frecuencias [k].
En una tercera etapa 32, pueden calcularse las diferencias inter-canal por sub-banda b sobre la base del espectro cruzado. A modo de ejemplo, en caso de la diferencia de fase interaural, IPD, dicho cálculo puede realizarse como
en donde el valor de IPD por sub-banda b es el ángulo del espectro cruzado c[b] de la respectiva sub-banda b. Las etapas 31 y 32 aseguran que una pluralidad de valores de ICD, en particular valores de IPD, para los ICDs/IPDs entre al menos una de la pluralidad de señales de canal de audio y una señal de canal de audio de referencia, a través de una gama de frecuencias predeterminada, son objeto de cálculo. Además, cada valor de ICD se calcula sobre una parte de la gama de frecuencias predeterminada, que es una sub-banda de frecuencias b o al menos un contenedor de frecuencias único.
El sistema de cálculo según se detalla con respecto a las etapas 31 y 32 corresponde al método según se conoce a partir de los documentos de Breebart, J., van de Par, S. Kohlrausch, A., Schuijers, E.: “Codificación paramétrica de señal de audio estéreo”, EURASIP Journal on Applied Signal Processing, 2005, nº 9, páginas 1305-1322.
El valor de IPD representa una diferencia de fase para una señal limitada en banda. Si el ancho de banda está suficientemente limitado, esta diferencia de fase puede considerarse como un retardo fraccionario entre las señales de entrada. Para cada sub-banda de frecuencia b, las diferencias IPD y las diferencias de tiempo inter-canal, ITD, representan la misma información. No obstante, para el banco completo, el valor de IPD difiere del valor de ITD: el valor IPD de banda completa es la diferencia de fase constante entre dos canales 1 y 2, mientras que el valor ITD de banda completa es la diferencia de tiempo constante entre dos canales.
Con el fin de calcular el valor de IPD de banda completa sobre la base del valor de IPD de sub-bandas, podría ser posible calcular el valor medio a través de los valores de IPD de sub-bandas para obtener el valor de IPD de banda completa, es decir, el valor de gama IPD a través de la gama de frecuencias completa de las señales de canal de audio. Sin embargo, este método de estimación puede llevar a una estimación incorrecta de un valor de gama IPD representativo, puesto que las sub-bandas de frecuencia tienen diferente importancia perceptual.
Para el cálculo de un valor de gama ICD, una gama de frecuencias predeterminada puede definirse. A modo de ejemplo, la gama de frecuencias predeterminada puede ser la banda de frecuencias completa de la pluralidad de señales de canal de audio. Como alternativa, uno o más intervalos de frecuencia predeterminados dentro de la banda de frecuencias completa de la pluralidad de señales de canal de audio pueden seleccionarse, cuyos intervalos de frecuencias predeterminados pueden ser coherentes o estar separados. La gama de frecuencias predeterminada puede incluir, a modo de ejemplo, la banda de frecuencias entre 200 Hz y 600 Hz o, como alternativa, entre 300 Hz y 1.5 kHz.
En una tercera etapa 33 y una cuarta etapa 34, en paralelo con las primera y segunda etapas 31 y 32, la energía
7
E12712126
22-06-2015
E[b] de cada parte de la gama de frecuencias predeterminada, esto es, cada sub-banda de frecuencia b o contenedor de frecuencia b se calcula por
o como alternativa
y posteriormente se normaliza sobre la energía EG de la gama de frecuencias predeterminada, a modo de ejemplo, la banda completa:
en donde Mmin y Mmax son el índice de la sub-banda de frecuencia más baja y más alta o el contenedor de frecuencias dentro de la gama de frecuencias predeterminada, respectivamente.
En la etapa 35, para cada uno de la pluralidad de valores de ICD, a modo de ejemplo, los valores IPD[b], un valor de ICD ponderado, a modo de ejemplo, un valor de IPD ponderado IPDw[b], se calcula multiplicando cada uno de la
20 El factor de ponderación dependiente de la frecuencia puede ser, a modo de ejemplo, un valor de energía ponderado asociado Ew[b] según se calcula por
Puede ser posible atenuar los factores de ponderación Ew[b] a través de tramas consecutivas, esto es, teniendo en cuenta una fracción de los factores de ponderación Ew[b] de tramas anteriores de la pluralidad de señales de canal 25 de audio cuando se calculan los factores de ponderación actuales Ew[b].
Por último, en la etapa 36, un valor de gama ICD, a modo de ejemplo, un valor IPD de banda completa IPDF, puede calcularse para la gama de frecuencias predeterminada añadiendo la pluralidad de valores ICD ponderados:
30
Como alternativa, los factores de ponderación Ew[b] pueden derivarse a partir de una curva de enmascaramiento para la distribución de energía de las frecuencias de las señales de canal de audio normalizadas a través de la gama de frecuencias predeterminada. Dicha curva de enmascaramiento puede calcularse, a modo de ejemplo, como es 35 conocido a partir del documento de Bosi, M. Goldberg, R.: “Introducción a la codificación de audio digital y sus normas”, Kluwer Academic Publishers 2003. También es posible determinar los factores de ponderación dependientes de la frecuencia sobre la base de los valores de entropía perceptual de las sub-bandas b de las señales de canal de audio normalizadas a través de una gama de frecuencias predeterminada. En ese caso, la versión normalizada de la curva de enmascaramiento o la entropía perceptual puede utilizarse como función de
40 ponderación.
El método según se ilustra en la Figura 4 puede aplicarse también a la codificación de audio paramétrica multicanal. Un espectro cruzado puede calcularse por sub-banda b y por cada canal j como:
45
en donde Xj[k] es el coeficiente de FFT del canal j y Xref[k] es el coeficiente FFT de un canal de referencia. El canal de referencia puede ser un canal seleccionado de entre la pluralidad de canales j. Como alternativa, el canal de referencia puede ser el espectro de una señal de mezcla reductora única, que es la media sobre todos los canales j.
50 En el caso anterior, se genera M-1 pistas espaciales, mientras que en el último caso, se generan M pistas espaciales, como M siendo el número de canales j. El asterisco “*” indica la conjugación compleja, kb indica el contenedor de inicio de la sub-banda b y kb+1 indica el contenedor de inicio de la sub-banda próxima b+1. En consecuencia, los contenedores de frecuencias [k] de FFT desde kb a kb+1 representan la sub-banda b.
8
E12712126
22-06-2015
Como alternativa, puede calcularse el espectro cruzado para cada contenedor de frecuencias k de FFT. En este caso, la sub-banda b corresponde directamente a un contenedor de frecuencias [k].
Las diferencias inter-canal del canal j pueden calcularse por sub-banda b sobre la base del espectro cruzado. A modo de ejemplo, en caso de la diferencia de fase, IPD, dicho cálculo puede realizarse como
en donde el valor IPDj por sub-banda b y canal j es el ángulo del espectro cruzado q[b] de la respectiva sub-banda b y canal j.
10 El valor de Ej[b] de energía por canal j de cada parte de la gama de frecuencias predeterminada, esto es, cada subbanda de frecuencia b o contenedor de frecuencia b se calcula mediante
o como alternativa
y posteriormente, se normaliza sobre el valor EGj de energía de la gama de frecuencias predeterminada, a modo de ejemplo, la banda completa:
20
en donde Mmin y Mmax son el índice de la sub-banda de frecuencia más baja y más alta o el contenedor dentro de la gama de frecuencias predeterminada, respectivamente.
25 Para cada uno de la pluralidad de valores ICD, a modo de ejemplo, los valores IPDj[b], un valor ICD ponderado, a modo de ejemplo, un valor IPD ponderado IPDwj[b], se calcula multiplicando cada uno de la pluralidad de valores ICD con un factor de ponderación dependiente de la frecuencia correspondiente Ewj[b]:
El factor de ponderación dependiente de la frecuencia puede ser, a modo de ejemplo, un valor de energía ponderado asociado Ewj[b] según se calcula por
35 Puede ser posible atenuar el valor de los factores de ponderación Ewj[b] a través de tramas consecutivas, esto es, teniendo en cuenta una fracción de los factores de ponderación Ewj[b] de tramas anteriores de la pluralidad de señales de canal de audio cuando se calculan los factores de ponderación actuales Ewj[b].
40 Por último, un valor de gama ICD, a modo de ejemplo, un valor IPD de banda completa IPDFj puede calcularse para la gama de frecuencias predeterminada añadiendo la pluralidad de valores ICD ponderados:
45 La Figura 5 ilustra, de forma esquemática, una estructura de flujo de bits de un flujo de bits de audio, a modo de ejemplo, el flujo de bits de audio 1 detallado en las Figuras 1 a 3. En la Figura 5, el flujo de bits de audio 1 puede incluir una sección de flujo de bits de audio de mezcla reductora codificada 1a y una sección de parámetros 1b. La sección de flujo de bits de audio de mezcla reductora codificada 1a y la sección de parámetros 1b pueden alternarse y su longitud combinada puede ser indicativa de la tasa binaria global del flujo de bits de audio 1. La sección de flujo
50 de bits de audio de mezcla reductora codificada 1a puede incluir los datos de audio reales que se van a decodificar. La sección de parámetros 1b puede comprender una o más representaciones cuantificadas de parámetros de codificación espacial tales como el valor de la gama ICD. El flujo de bits de audio 1 puede incluir, a modo de ejemplo, un bit de indicador de señalización 2 utilizado para la señalización explícita si el flujo de bits de audio 1 incluye datos auxiliares en la sección de parámetros 1b o no los incluye. Además, la sección de parámetros 1b
55 puede incluir un bit indicador de señalización 3b utilizado para la señalización implícita si el flujo de bits de audio 1 incluye datos auxiliares en la sección de parámetros 1b o no lo incluye.
9
Claims (1)
-
imagen1 imagen2
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2012/056342 WO2013149673A1 (en) | 2012-04-05 | 2012-04-05 | Method for inter-channel difference estimation and spatial audio coding device |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2540215T3 true ES2540215T3 (es) | 2015-07-09 |
Family
ID=45929533
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES12712126.7T Active ES2540215T3 (es) | 2012-04-05 | 2012-04-05 | Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial |
Country Status (7)
Country | Link |
---|---|
US (1) | US9275646B2 (es) |
EP (1) | EP2702587B1 (es) |
JP (1) | JP2015517121A (es) |
KR (1) | KR101662682B1 (es) |
CN (1) | CN103534753B (es) |
ES (1) | ES2540215T3 (es) |
WO (1) | WO2013149673A1 (es) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101646353B1 (ko) | 2014-10-16 | 2016-08-08 | 현대자동차주식회사 | 차량용 다단 자동변속기 |
CN106033672B (zh) * | 2015-03-09 | 2021-04-09 | 华为技术有限公司 | 确定声道间时间差参数的方法和装置 |
US9591427B1 (en) * | 2016-02-20 | 2017-03-07 | Philip Scott Lyren | Capturing audio impulse responses of a person with a smartphone |
CN107452387B (zh) | 2016-05-31 | 2019-11-12 | 华为技术有限公司 | 一种声道间相位差参数的提取方法及装置 |
US10217467B2 (en) | 2016-06-20 | 2019-02-26 | Qualcomm Incorporated | Encoding and decoding of interchannel phase differences between audio signals |
US9875747B1 (en) | 2016-07-15 | 2018-01-23 | Google Llc | Device specific multi-channel data compression |
US10366695B2 (en) * | 2017-01-19 | 2019-07-30 | Qualcomm Incorporated | Inter-channel phase difference parameter modification |
CN109215668B (zh) * | 2017-06-30 | 2021-01-05 | 华为技术有限公司 | 一种声道间相位差参数的编码方法及装置 |
ES2909343T3 (es) * | 2018-04-05 | 2022-05-06 | Fraunhofer Ges Forschung | Aparato, método o programa informático para estimar una diferencia de tiempo entre canales |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5956674A (en) * | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5835375A (en) * | 1996-01-02 | 1998-11-10 | Ati Technologies Inc. | Integrated MPEG audio decoder and signal processor |
DE19632734A1 (de) * | 1996-08-14 | 1998-02-19 | Thomson Brandt Gmbh | Verfahren und Vorrichtung zum Generieren eines Mehrton-Signals aus einem Mono-Signal |
US6199039B1 (en) * | 1998-08-03 | 2001-03-06 | National Science Council | Synthesis subband filter in MPEG-II audio decoding |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
ATE332003T1 (de) | 2002-04-22 | 2006-07-15 | Koninkl Philips Electronics Nv | Parametrische beschreibung von mehrkanal-audio |
US7903824B2 (en) | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
PL1754222T3 (pl) | 2005-04-19 | 2008-04-30 | Dolby Int Ab | Uzależniona od energii kwantyzacja służąca do wydajnego kodowania parametrów dźwięku przestrzennego |
WO2008046530A2 (en) * | 2006-10-16 | 2008-04-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for multi -channel parameter transformation |
US20100121632A1 (en) | 2007-04-25 | 2010-05-13 | Panasonic Corporation | Stereo audio encoding device, stereo audio decoding device, and their method |
KR101108060B1 (ko) * | 2008-09-25 | 2012-01-25 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치 |
CN101408615B (zh) * | 2008-11-26 | 2011-11-30 | 武汉大学 | 双耳时间差itd临界感知特性的测量方法及其装置 |
KR101613975B1 (ko) * | 2009-08-18 | 2016-05-02 | 삼성전자주식회사 | 멀티 채널 오디오 신호의 부호화 방법 및 장치, 그 복호화 방법 및 장치 |
EP2323130A1 (en) | 2009-11-12 | 2011-05-18 | Koninklijke Philips Electronics N.V. | Parametric encoding and decoding |
WO2011072729A1 (en) * | 2009-12-16 | 2011-06-23 | Nokia Corporation | Multi-channel audio processing |
CN102714036B (zh) * | 2009-12-28 | 2014-01-22 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
-
2012
- 2012-04-05 EP EP12712126.7A patent/EP2702587B1/en active Active
- 2012-04-05 WO PCT/EP2012/056342 patent/WO2013149673A1/en unknown
- 2012-04-05 JP JP2015503767A patent/JP2015517121A/ja active Pending
- 2012-04-05 CN CN201280023292.XA patent/CN103534753B/zh active Active
- 2012-04-05 ES ES12712126.7T patent/ES2540215T3/es active Active
- 2012-04-05 KR KR1020147029934A patent/KR101662682B1/ko active IP Right Grant
-
2013
- 2013-12-31 US US14/145,432 patent/US9275646B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
CN103534753B (zh) | 2015-05-27 |
US9275646B2 (en) | 2016-03-01 |
CN103534753A (zh) | 2014-01-22 |
KR101662682B1 (ko) | 2016-10-05 |
US20140164001A1 (en) | 2014-06-12 |
EP2702587B1 (en) | 2015-04-01 |
EP2702587A1 (en) | 2014-03-05 |
WO2013149673A1 (en) | 2013-10-10 |
KR20140139591A (ko) | 2014-12-05 |
JP2015517121A (ja) | 2015-06-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2540215T3 (es) | Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial | |
ES2773794T3 (es) | Aparato y procedimiento para estimar una diferencia de tiempos entre canales | |
KR101685860B1 (ko) | 공간 오디오 객체 코딩에 있어서 신호 종속적인 줌 변환을 위한 인코더, 디코더 및 방법들 | |
ES2823560T3 (es) | Análisis/síntesis espectral de baja complejidad utilizando resolución temporal seleccionable | |
ES2687952T3 (es) | Reducción de fallas de filtro peine en mezcla descendente de canales múltiples con alineación de fase adaptativa | |
KR101646650B1 (ko) | 최적의 저-스루풋 파라메트릭 코딩/디코딩 | |
ES2703327T3 (es) | Codificador, decodificador y métodos para codificación espacial de objetos de audio de multirresolución retrocompatible | |
EP3605847B1 (en) | Multichannel signal encoding method and apparatus | |
ES2760934T3 (es) | Dispositivo, método, programa y medio de almacenamiento de análisis de predicción lineal | |
KR102201951B1 (ko) | 오디오 인코더 및 디코더 | |
EP4276820A2 (en) | Audio frame loss concealment | |
BR112015009352B1 (pt) | Dispositivo de codificação de fala/áudio, dispositivo de decodificação de fala/áudio, método de codificação de fala/áudio e método de decodificação de fala/áudio | |
ES2783975T3 (es) | Codificación multicanal | |
KR102196390B1 (ko) | 채널 간 위상차 파라미터 추출 방법 및 장치 | |
ES2529732T3 (es) | Método de codificación estéreo, dispositivo y codificador | |
KR102469964B1 (ko) | 서브대역 그룹들에 대한 서브대역 구성 데이터를 코딩하거나 디코딩하는 방법 및 장치 | |
CN103236264B (zh) | 一种用于声源分离的编解码方法 | |
ES2823250T3 (es) | Aparato de codificación de señal de audio, dispositivo de decodificación de señal de audio y métodos del mismo | |
US9842594B2 (en) | Frequency band table design for high frequency reconstruction algorithms | |
JP2017058696A (ja) | インターチャネル差分推定方法及び空間オーディオ符号化装置 | |
KR20160003083A (ko) | 오디오 인코딩 및 디코딩 방법들, 대응하는 컴퓨터-판독 가능한 매체들 및 대응하는 오디오 인코더 및 디코더 | |
JP5762620B2 (ja) | 低周波数エフェクトチャネルのための複雑さが低減された変換 |