ES2559307T3 - Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable - Google Patents

Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable Download PDF

Info

Publication number
ES2559307T3
ES2559307T3 ES07725316.9T ES07725316T ES2559307T3 ES 2559307 T3 ES2559307 T3 ES 2559307T3 ES 07725316 T ES07725316 T ES 07725316T ES 2559307 T3 ES2559307 T3 ES 2559307T3
Authority
ES
Spain
Prior art keywords
filter
deformation characteristic
audio signal
signal
audio
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES07725316.9T
Other languages
English (en)
Inventor
Juergen Herre
Bernhard Grill
Markus Multrus
Stefan Bayer
Ulrich Kraemer
Jens Hirschfeld
Stefan Wabnik
Gerald Schuller
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Original Assignee
Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/428,297 external-priority patent/US7873511B2/en
Priority claimed from EP06013604A external-priority patent/EP1873754B1/en
Application filed by Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV filed Critical Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Application granted granted Critical
Publication of ES2559307T3 publication Critical patent/ES2559307T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/20Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction

Abstract

Codificador de audio para codificar una senal de audio, que comprende: un pre-filtro (12) para generar una senal de audio pre-filtrada, teniendo el pre-filtro una caracteristica de deformacion de frecuencia variable, siendo la caracteristica de deformacion de frecuencia controlable en respuesta a una senal de control que varia en el tiempo, indicando la senal de control una caracteristica de deformacion de frecuencia pequena o ninguna o una caracteristica de deformacion de frecuencia comparativamente alta; un controlador (18) para proporcionar la senal de control que varia en el tiempo, dependiendo la senal de control que varia en el tiempo de la senal de audio; y un procesador de codificacion controlable (22) para procesar la senal de audio pre-filtrada para obtener una senal de audio codificada, en el que el procesador de codificacion se controla para procesar la senal de audio pre-filtrada de acuerdo con un primer algoritmo de codificacion (22a) adaptado a un patron de senal del habla, o de acuerdo con un segundo algoritmo de codificacion (22b) diferente adecuado para codificar una senal de musica.

Description

imagen1
imagen2
imagen3
imagen4
imagen5
imagen6
imagen7
imagen8
imagen9
modo que, después del prefiltrado, las porciones psicoacústicamente más importantes se amplifican con respecto a las porciones psicoacústicamente menos importantes. En el lado del decodificador, el postfiltro se implementa como un filtro para regenerar una situación similar a una situación antes de prefiltrado, es decir, un filtro inverso que amplifica porciones menos importantes con respecto a porciones más importantes de modo que la señal después
5 del postfiltrado es al margen de los errores de codificación similar a la señal de audio original introducida en el codificador.
Los coeficientes de filtro para el prefiltro anteriormente descrito se transmiten también preferentemente mediante información secundaria desde el codificador al decodificador.
10 Típicamente, el prefiltro así como el postfiltro se implementarán como un filtro FIR deformado, una estructura del cual se ilustra en la Figura 4, o como un filtro digital IIR deformado. El filtro de la Figura 4 se describe en detalle en [KHL 97]. Ejemplos de filtros IIR deformados se muestran también en [KHL 97]. Todos estos filtros digitales tienen en común que tienen elementos de retardo deformados 60 y coeficientes de ponderación o elementos de ponderación
15 indicados mediante β0, . β1, β2 .,.... Una estructura de filtro se transforma a un filtro deformado, cuando un elemento de retardo en una estructura de filtro sin deformar (no mostrado en este punto) se sustituye por un filtro paso todo, tal como un filtro paso todo de primer orden D(z), como se ilustra en ambos lados de las estructuras de filtro en la Figura 4. Una implementación computacionalmente eficaz de la estructura izquierda se muestra a la derecha de la Figura 4, donde se muestra el uso explícito del factor de deformación λ y la implementación de la misma.
20 Por lo tanto, la estructura de filtro a la derecha de la Figura 4 puede implementarse fácilmente en el prefiltro así como en el postfiltro, en el que el factor de deformación se controla mediante el parámetro λ, mientras la característica de filtro, es decir, los coeficientes de filtro del análisis/síntesis de LPC o prefiltrado o postfiltrado para amplificar/amortiguar porciones psicoacústicamente más importantes se controla estableciendo los parámetros de
25 ponderación β0, β1, β2,.... a valores apropiados.
La Figura 5 ilustra la dependencia de la característica de deformación de frecuencia en el factor de deformación λ para λ entre 0,8 y +0,8. No se obtendrá deformación en absoluto, cuando λ se establece a 0,0. Se obtiene una deformación piscoacústicamente a escala completa estableciendo λ entre 0,3 y 0,4. En general, el factor de
30 deformación óptimo depende de la tasa de muestreo elegida y tiene un valor de entre aproximadamente 0,3 y 0,4 para tasas de muestreo entre 32 y 48 kHz. La resolución de frecuencia no uniforme obtenida entonces usando el filtro deformado es similar a la escala BARK o ERB. Pueden implementarse características de deformación sustancialmente más fuertes, pero estas son únicamente útiles en ciertas situaciones, que pueden ocurrir cuando el controlador determina que estos factores de deformación superiores son útiles.
35 Por lo tanto, el prefiltro en el lado del codificador tendrá preferentemente factores de deformación positivos λ para aumentar la resolución de frecuencia en el intervalo de baja frecuencia y para reducir la resolución de frecuencia en el intervalo de alta frecuencia. Por lo tanto, el postfiltro en el lado del decodificador tendrá también los factores de deformación positivos. Por lo tanto, se muestra un filtro de deformación que varía en el tiempo inventivo preferido en
40 la Figura 6 en 70 como una parte del procesador de audio. El filtro inventivo es, preferentemente, un filtro lineal, que se implementa como un prefiltro o un postfiltro para filtrar para amplificar o amortiguar porciones psicoacústicamente más/menos importantes o que se implementa como un filtro de análisis/síntesis de LPC que depende de la señal de control del sistema. Se ha de observar en este punto que el filtro deformado es un filtro lineal y no cambia la frecuencia de un componente tal como una onda seno introducida en el filtro. Sin embargo, cuando se
45 supone que el filtro antes de la deformación es un filtro paso bajo, el diagrama de la Figura 5 se ha de interpretar como se expone a continuación.
Cuando la onda seno de ejemplo tiene una frecuencia original normalizada de 0,6, entonces el filtro aplicaría para un factor de deformación igual a 0,0 la ponderación de fase y amplitud definida mediante la respuesta de impulso
50 de filtro de este filtro no deformado.
Cuando se establece un factor de deformación de 0,8 para este filtro paso bajo (ahora el filtro se hace un filtro deformado), la onda seno que tiene una frecuencia normalizada de 0,6 se filtrará de manera que la salida se pondera mediante la ponderación de fase y amplitud que el filtro no deformado tiene para una frecuencia
55 normalizada de 0,97 en la Figura 5. Puesto que este filtro es un filtro lineal, la frecuencia de la onda seno no cambia.
Dependiendo de la situación, cuando el filtro 70 está únicamente deformado, entonces tiene que aplicarse un factor de deformación o, generalmente, el control de deformación 16, o 46. Los coeficientes de filtro βi se deducen a partir del umbral de enmascaramiento. Estos coeficientes de filtro pueden ser coeficientes de preo postfiltro, o
60 coeficientes de filtro de análisis/síntesis de LPC, o cualquier otro coeficiente de filtro útil en relación con cualquier primer o segundo algoritmos de codificación.
Por lo tanto, un procesador de audio incluye, además del filtro que tiene características de deformación variables, el controlador 18 de la Figura 1 o el controlador implementado como el detector de algoritmo de codificación 32 de la
11
imagen10
imagen11
imagen12
imagen13

Claims (1)

  1. imagen1
    imagen2
    imagen3
ES07725316.9T 2006-06-30 2007-05-16 Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable Active ES2559307T3 (es)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US428297 2006-06-30
EP06013604 2006-06-30
US11/428,297 US7873511B2 (en) 2006-06-30 2006-06-30 Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
EP06013604A EP1873754B1 (en) 2006-06-30 2006-06-30 Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
PCT/EP2007/004401 WO2008000316A1 (en) 2006-06-30 2007-05-16 Audio encoder, audio decoder and audio processor having a dynamically variable harping characteristic

Publications (1)

Publication Number Publication Date
ES2559307T3 true ES2559307T3 (es) 2016-02-11

Family

ID=38509999

Family Applications (1)

Application Number Title Priority Date Filing Date
ES07725316.9T Active ES2559307T3 (es) 2006-06-30 2007-05-16 Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable

Country Status (17)

Country Link
EP (1) EP2038879B1 (es)
JP (1) JP5205373B2 (es)
KR (1) KR101145578B1 (es)
AR (1) AR061696A1 (es)
AU (2) AU2007264175B2 (es)
BR (1) BRPI0712625B1 (es)
CA (1) CA2656423C (es)
ES (1) ES2559307T3 (es)
HK (1) HK1128811A1 (es)
IL (1) IL195983A (es)
MX (1) MX2008016163A (es)
MY (1) MY142675A (es)
NO (1) NO340436B1 (es)
PL (1) PL2038879T3 (es)
RU (1) RU2418322C2 (es)
TW (1) TWI348683B (es)
WO (1) WO2008000316A1 (es)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
MY154452A (en) 2008-07-11 2015-06-15 Fraunhofer Ges Forschung An apparatus and a method for decoding an encoded audio signal
EP2144231A1 (en) 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
RU2536679C2 (ru) 2008-07-11 2014-12-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы
FR2949582B1 (fr) * 2009-09-02 2011-08-26 Alcatel Lucent Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede
EP2638541A1 (en) * 2010-11-10 2013-09-18 Koninklijke Philips Electronics N.V. Method and device for estimating a pattern in a signal
MY158977A (en) * 2010-12-03 2016-11-30 ERICSSON TELEFON AB L M (publ) Source signal adaptive frame aggregation
TWI733583B (zh) * 2010-12-03 2021-07-11 美商杜比實驗室特許公司 音頻解碼裝置、音頻解碼方法及音頻編碼方法
EP2860729A4 (en) * 2012-06-04 2016-03-02 Samsung Electronics Co Ltd METHOD AND DEVICE FOR AUDIO CODING, METHOD AND DEVICE FOR AUDIO DECODING, AND MULTIMEDIA DEVICE EMPLOYING THEM
TWI517142B (zh) * 2012-07-02 2016-01-11 Sony Corp Audio decoding apparatus and method, audio coding apparatus and method, and program
US9548056B2 (en) 2012-12-19 2017-01-17 Dolby International Ab Signal adaptive FIR/IIR predictors for minimizing entropy
EP2992605B1 (en) * 2013-04-29 2017-06-07 Dolby Laboratories Licensing Corporation Frequency band compression with dynamic thresholds
CN104934034B (zh) 2014-03-19 2016-11-16 华为技术有限公司 用于信号处理的方法和装置
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
RU2628459C1 (ru) * 2016-10-13 2017-08-17 Общество с ограниченной ответственностью "Силовая электроника" Способ декодирования LDPC-кодов и устройство для его осуществления
WO2020086623A1 (en) * 2018-10-22 2020-04-30 Zeev Neumeier Hearing aid

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4132109B2 (ja) * 1995-10-26 2008-08-13 ソニー株式会社 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置
US6456964B2 (en) * 1998-12-21 2002-09-24 Qualcomm, Incorporated Encoding of periodic speech using prototype waveforms
JP2000322095A (ja) * 1999-05-13 2000-11-24 Mitsubishi Electric Corp 音声復号装置
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
CA2457988A1 (en) * 2004-02-18 2005-08-18 Voiceage Corporation Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization
US7587254B2 (en) 2004-04-23 2009-09-08 Nokia Corporation Dynamic range control and equalization of digital audio using warped processing

Also Published As

Publication number Publication date
PL2038879T3 (pl) 2016-04-29
AR061696A1 (es) 2008-09-17
IL195983A0 (en) 2009-09-01
MY142675A (en) 2010-12-15
NO340436B1 (no) 2017-04-24
AU2011200461A1 (en) 2011-02-24
EP2038879B1 (en) 2015-11-04
AU2007264175A1 (en) 2008-01-03
KR20090025304A (ko) 2009-03-10
KR101145578B1 (ko) 2012-05-16
CA2656423C (en) 2013-12-17
CA2656423A1 (en) 2008-01-03
EP2038879A1 (en) 2009-03-25
HK1128811A1 (zh) 2009-11-06
BRPI0712625A2 (pt) 2012-10-16
MX2008016163A (es) 2009-02-04
JP2009541802A (ja) 2009-11-26
BRPI0712625B1 (pt) 2023-10-10
RU2009103010A (ru) 2010-08-10
TW200809771A (en) 2008-02-16
TWI348683B (en) 2011-09-11
NO20090400L (no) 2009-01-27
JP5205373B2 (ja) 2013-06-05
RU2418322C2 (ru) 2011-05-10
IL195983A (en) 2012-01-31
AU2007264175B2 (en) 2011-03-03
AU2011200461B2 (en) 2011-11-10
WO2008000316A8 (en) 2009-02-26
WO2008000316A1 (en) 2008-01-03

Similar Documents

Publication Publication Date Title
ES2559307T3 (es) Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable
US6453282B1 (en) Method and device for detecting a transient in a discrete-time audiosignal
CN104395958B (zh) 数字音频信号中的有效前回声衰减
EP2707873B1 (en) Method and encoder for processing a digital stereo audio signal
US7873511B2 (en) Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US8682652B2 (en) Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
CN105960675B (zh) 音频信号解码器中改进的频带扩展
JP2010170124A (ja) 信号圧縮方法及び装置
CA2898677A1 (en) Low-frequency emphasis for lpc-based coding in frequency domain
EP2628156A1 (en) Audio signal bandwidth extension in celp-based speech coder
EP1873754B1 (en) Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2011127569A1 (en) Flexible and scalable combined innovation codebook for use in celp coder and decoder
ES2692831T3 (es) Discriminación y atenuación de pre-ecos en una señal de audio digital
FI3707715T3 (fi) Signaalisuodatus
WO2008138267A1 (fr) Procede de post-traitement et appareil d'amelioration de ton fondamental
EP2628155A1 (en) Audio signal bandwidth extension in celp-based speech coder
Lee et al. Pre-echo control using an improved post-filter in the frequency domain
Kitamura et al. Spectral distortion and quality of synthesized speech in cepstral speech analysis‐synthesis system
Zölzer et al. Dynamic range control
Chan Efficient implementation of perceptual postfilter for CELP coding of speech
JPS61242117A (ja) ブロツクフロ−テイング方式