ES2559307T3 - Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable - Google Patents
Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable Download PDFInfo
- Publication number
- ES2559307T3 ES2559307T3 ES07725316.9T ES07725316T ES2559307T3 ES 2559307 T3 ES2559307 T3 ES 2559307T3 ES 07725316 T ES07725316 T ES 07725316T ES 2559307 T3 ES2559307 T3 ES 2559307T3
- Authority
- ES
- Spain
- Prior art keywords
- filter
- deformation characteristic
- audio signal
- signal
- audio
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/20—Vocoders using multiple modes using sound class specific coding, hybrid encoders or object based coding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
Abstract
Codificador de audio para codificar una senal de audio, que comprende: un pre-filtro (12) para generar una senal de audio pre-filtrada, teniendo el pre-filtro una caracteristica de deformacion de frecuencia variable, siendo la caracteristica de deformacion de frecuencia controlable en respuesta a una senal de control que varia en el tiempo, indicando la senal de control una caracteristica de deformacion de frecuencia pequena o ninguna o una caracteristica de deformacion de frecuencia comparativamente alta; un controlador (18) para proporcionar la senal de control que varia en el tiempo, dependiendo la senal de control que varia en el tiempo de la senal de audio; y un procesador de codificacion controlable (22) para procesar la senal de audio pre-filtrada para obtener una senal de audio codificada, en el que el procesador de codificacion se controla para procesar la senal de audio pre-filtrada de acuerdo con un primer algoritmo de codificacion (22a) adaptado a un patron de senal del habla, o de acuerdo con un segundo algoritmo de codificacion (22b) diferente adecuado para codificar una senal de musica.
Description
modo que, después del prefiltrado, las porciones psicoacústicamente más importantes se amplifican con respecto a las porciones psicoacústicamente menos importantes. En el lado del decodificador, el postfiltro se implementa como un filtro para regenerar una situación similar a una situación antes de prefiltrado, es decir, un filtro inverso que amplifica porciones menos importantes con respecto a porciones más importantes de modo que la señal después
5 del postfiltrado es al margen de los errores de codificación similar a la señal de audio original introducida en el codificador.
Los coeficientes de filtro para el prefiltro anteriormente descrito se transmiten también preferentemente mediante información secundaria desde el codificador al decodificador.
10 Típicamente, el prefiltro así como el postfiltro se implementarán como un filtro FIR deformado, una estructura del cual se ilustra en la Figura 4, o como un filtro digital IIR deformado. El filtro de la Figura 4 se describe en detalle en [KHL 97]. Ejemplos de filtros IIR deformados se muestran también en [KHL 97]. Todos estos filtros digitales tienen en común que tienen elementos de retardo deformados 60 y coeficientes de ponderación o elementos de ponderación
15 indicados mediante β0, . β1, β2 .,.... Una estructura de filtro se transforma a un filtro deformado, cuando un elemento de retardo en una estructura de filtro sin deformar (no mostrado en este punto) se sustituye por un filtro paso todo, tal como un filtro paso todo de primer orden D(z), como se ilustra en ambos lados de las estructuras de filtro en la Figura 4. Una implementación computacionalmente eficaz de la estructura izquierda se muestra a la derecha de la Figura 4, donde se muestra el uso explícito del factor de deformación λ y la implementación de la misma.
20 Por lo tanto, la estructura de filtro a la derecha de la Figura 4 puede implementarse fácilmente en el prefiltro así como en el postfiltro, en el que el factor de deformación se controla mediante el parámetro λ, mientras la característica de filtro, es decir, los coeficientes de filtro del análisis/síntesis de LPC o prefiltrado o postfiltrado para amplificar/amortiguar porciones psicoacústicamente más importantes se controla estableciendo los parámetros de
25 ponderación β0, β1, β2,.... a valores apropiados.
La Figura 5 ilustra la dependencia de la característica de deformación de frecuencia en el factor de deformación λ para λ entre 0,8 y +0,8. No se obtendrá deformación en absoluto, cuando λ se establece a 0,0. Se obtiene una deformación piscoacústicamente a escala completa estableciendo λ entre 0,3 y 0,4. En general, el factor de
30 deformación óptimo depende de la tasa de muestreo elegida y tiene un valor de entre aproximadamente 0,3 y 0,4 para tasas de muestreo entre 32 y 48 kHz. La resolución de frecuencia no uniforme obtenida entonces usando el filtro deformado es similar a la escala BARK o ERB. Pueden implementarse características de deformación sustancialmente más fuertes, pero estas son únicamente útiles en ciertas situaciones, que pueden ocurrir cuando el controlador determina que estos factores de deformación superiores son útiles.
35 Por lo tanto, el prefiltro en el lado del codificador tendrá preferentemente factores de deformación positivos λ para aumentar la resolución de frecuencia en el intervalo de baja frecuencia y para reducir la resolución de frecuencia en el intervalo de alta frecuencia. Por lo tanto, el postfiltro en el lado del decodificador tendrá también los factores de deformación positivos. Por lo tanto, se muestra un filtro de deformación que varía en el tiempo inventivo preferido en
40 la Figura 6 en 70 como una parte del procesador de audio. El filtro inventivo es, preferentemente, un filtro lineal, que se implementa como un prefiltro o un postfiltro para filtrar para amplificar o amortiguar porciones psicoacústicamente más/menos importantes o que se implementa como un filtro de análisis/síntesis de LPC que depende de la señal de control del sistema. Se ha de observar en este punto que el filtro deformado es un filtro lineal y no cambia la frecuencia de un componente tal como una onda seno introducida en el filtro. Sin embargo, cuando se
45 supone que el filtro antes de la deformación es un filtro paso bajo, el diagrama de la Figura 5 se ha de interpretar como se expone a continuación.
Cuando la onda seno de ejemplo tiene una frecuencia original normalizada de 0,6, entonces el filtro aplicaría para un factor de deformación igual a 0,0 la ponderación de fase y amplitud definida mediante la respuesta de impulso
50 de filtro de este filtro no deformado.
Cuando se establece un factor de deformación de 0,8 para este filtro paso bajo (ahora el filtro se hace un filtro deformado), la onda seno que tiene una frecuencia normalizada de 0,6 se filtrará de manera que la salida se pondera mediante la ponderación de fase y amplitud que el filtro no deformado tiene para una frecuencia
55 normalizada de 0,97 en la Figura 5. Puesto que este filtro es un filtro lineal, la frecuencia de la onda seno no cambia.
Dependiendo de la situación, cuando el filtro 70 está únicamente deformado, entonces tiene que aplicarse un factor de deformación o, generalmente, el control de deformación 16, o 46. Los coeficientes de filtro βi se deducen a partir del umbral de enmascaramiento. Estos coeficientes de filtro pueden ser coeficientes de preo postfiltro, o
60 coeficientes de filtro de análisis/síntesis de LPC, o cualquier otro coeficiente de filtro útil en relación con cualquier primer o segundo algoritmos de codificación.
Por lo tanto, un procesador de audio incluye, además del filtro que tiene características de deformación variables, el controlador 18 de la Figura 1 o el controlador implementado como el detector de algoritmo de codificación 32 de la
11
Claims (1)
-
imagen1 imagen2 imagen3
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US428297 | 2006-06-30 | ||
EP06013604 | 2006-06-30 | ||
US11/428,297 US7873511B2 (en) | 2006-06-30 | 2006-06-30 | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
EP06013604A EP1873754B1 (en) | 2006-06-30 | 2006-06-30 | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic |
PCT/EP2007/004401 WO2008000316A1 (en) | 2006-06-30 | 2007-05-16 | Audio encoder, audio decoder and audio processor having a dynamically variable harping characteristic |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2559307T3 true ES2559307T3 (es) | 2016-02-11 |
Family
ID=38509999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES07725316.9T Active ES2559307T3 (es) | 2006-06-30 | 2007-05-16 | Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable |
Country Status (17)
Country | Link |
---|---|
EP (1) | EP2038879B1 (es) |
JP (1) | JP5205373B2 (es) |
KR (1) | KR101145578B1 (es) |
AR (1) | AR061696A1 (es) |
AU (2) | AU2007264175B2 (es) |
BR (1) | BRPI0712625B1 (es) |
CA (1) | CA2656423C (es) |
ES (1) | ES2559307T3 (es) |
HK (1) | HK1128811A1 (es) |
IL (1) | IL195983A (es) |
MX (1) | MX2008016163A (es) |
MY (1) | MY142675A (es) |
NO (1) | NO340436B1 (es) |
PL (1) | PL2038879T3 (es) |
RU (1) | RU2418322C2 (es) |
TW (1) | TWI348683B (es) |
WO (1) | WO2008000316A1 (es) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
MY154452A (en) | 2008-07-11 | 2015-06-15 | Fraunhofer Ges Forschung | An apparatus and a method for decoding an encoded audio signal |
EP2144231A1 (en) | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
RU2536679C2 (ru) | 2008-07-11 | 2014-12-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен | Передатчик сигнала активации с деформацией по времени, кодер звукового сигнала, способ преобразования сигнала активации с деформацией по времени, способ кодирования звукового сигнала и компьютерные программы |
FR2949582B1 (fr) * | 2009-09-02 | 2011-08-26 | Alcatel Lucent | Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede |
EP2638541A1 (en) * | 2010-11-10 | 2013-09-18 | Koninklijke Philips Electronics N.V. | Method and device for estimating a pattern in a signal |
MY158977A (en) * | 2010-12-03 | 2016-11-30 | ERICSSON TELEFON AB L M (publ) | Source signal adaptive frame aggregation |
TWI733583B (zh) * | 2010-12-03 | 2021-07-11 | 美商杜比實驗室特許公司 | 音頻解碼裝置、音頻解碼方法及音頻編碼方法 |
EP2860729A4 (en) * | 2012-06-04 | 2016-03-02 | Samsung Electronics Co Ltd | METHOD AND DEVICE FOR AUDIO CODING, METHOD AND DEVICE FOR AUDIO DECODING, AND MULTIMEDIA DEVICE EMPLOYING THEM |
TWI517142B (zh) * | 2012-07-02 | 2016-01-11 | Sony Corp | Audio decoding apparatus and method, audio coding apparatus and method, and program |
US9548056B2 (en) | 2012-12-19 | 2017-01-17 | Dolby International Ab | Signal adaptive FIR/IIR predictors for minimizing entropy |
EP2992605B1 (en) * | 2013-04-29 | 2017-06-07 | Dolby Laboratories Licensing Corporation | Frequency band compression with dynamic thresholds |
CN104934034B (zh) | 2014-03-19 | 2016-11-16 | 华为技术有限公司 | 用于信号处理的方法和装置 |
EP2980795A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor |
EP2980794A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and decoder using a frequency domain processor and a time domain processor |
RU2628459C1 (ru) * | 2016-10-13 | 2017-08-17 | Общество с ограниченной ответственностью "Силовая электроника" | Способ декодирования LDPC-кодов и устройство для его осуществления |
WO2020086623A1 (en) * | 2018-10-22 | 2020-04-30 | Zeev Neumeier | Hearing aid |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4132109B2 (ja) * | 1995-10-26 | 2008-08-13 | ソニー株式会社 | 音声信号の再生方法及び装置、並びに音声復号化方法及び装置、並びに音声合成方法及び装置 |
US6456964B2 (en) * | 1998-12-21 | 2002-09-24 | Qualcomm, Incorporated | Encoding of periodic speech using prototype waveforms |
JP2000322095A (ja) * | 1999-05-13 | 2000-11-24 | Mitsubishi Electric Corp | 音声復号装置 |
US7110953B1 (en) * | 2000-06-02 | 2006-09-19 | Agere Systems Inc. | Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction |
CA2457988A1 (en) * | 2004-02-18 | 2005-08-18 | Voiceage Corporation | Methods and devices for audio compression based on acelp/tcx coding and multi-rate lattice vector quantization |
US7587254B2 (en) | 2004-04-23 | 2009-09-08 | Nokia Corporation | Dynamic range control and equalization of digital audio using warped processing |
-
2007
- 2007-05-16 EP EP07725316.9A patent/EP2038879B1/en active Active
- 2007-05-16 BR BRPI0712625-5A patent/BRPI0712625B1/pt active IP Right Grant
- 2007-05-16 RU RU2009103010/09A patent/RU2418322C2/ru active
- 2007-05-16 KR KR1020087032110A patent/KR101145578B1/ko active IP Right Grant
- 2007-05-16 MY MYPI20085310A patent/MY142675A/en unknown
- 2007-05-16 AU AU2007264175A patent/AU2007264175B2/en active Active
- 2007-05-16 PL PL07725316T patent/PL2038879T3/pl unknown
- 2007-05-16 MX MX2008016163A patent/MX2008016163A/es active IP Right Grant
- 2007-05-16 ES ES07725316.9T patent/ES2559307T3/es active Active
- 2007-05-16 CA CA2656423A patent/CA2656423C/en active Active
- 2007-05-16 WO PCT/EP2007/004401 patent/WO2008000316A1/en active Application Filing
- 2007-05-16 JP JP2009516921A patent/JP5205373B2/ja active Active
- 2007-06-23 TW TW096122715A patent/TWI348683B/zh active
- 2007-06-25 AR ARP070102797A patent/AR061696A1/es active IP Right Grant
-
2008
- 2008-12-16 IL IL195983A patent/IL195983A/en active IP Right Grant
-
2009
- 2009-01-27 NO NO20090400A patent/NO340436B1/no unknown
- 2009-09-11 HK HK09108366.0A patent/HK1128811A1/zh unknown
-
2011
- 2011-02-04 AU AU2011200461A patent/AU2011200461B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
PL2038879T3 (pl) | 2016-04-29 |
AR061696A1 (es) | 2008-09-17 |
IL195983A0 (en) | 2009-09-01 |
MY142675A (en) | 2010-12-15 |
NO340436B1 (no) | 2017-04-24 |
AU2011200461A1 (en) | 2011-02-24 |
EP2038879B1 (en) | 2015-11-04 |
AU2007264175A1 (en) | 2008-01-03 |
KR20090025304A (ko) | 2009-03-10 |
KR101145578B1 (ko) | 2012-05-16 |
CA2656423C (en) | 2013-12-17 |
CA2656423A1 (en) | 2008-01-03 |
EP2038879A1 (en) | 2009-03-25 |
HK1128811A1 (zh) | 2009-11-06 |
BRPI0712625A2 (pt) | 2012-10-16 |
MX2008016163A (es) | 2009-02-04 |
JP2009541802A (ja) | 2009-11-26 |
BRPI0712625B1 (pt) | 2023-10-10 |
RU2009103010A (ru) | 2010-08-10 |
TW200809771A (en) | 2008-02-16 |
TWI348683B (en) | 2011-09-11 |
NO20090400L (no) | 2009-01-27 |
JP5205373B2 (ja) | 2013-06-05 |
RU2418322C2 (ru) | 2011-05-10 |
IL195983A (en) | 2012-01-31 |
AU2007264175B2 (en) | 2011-03-03 |
AU2011200461B2 (en) | 2011-11-10 |
WO2008000316A8 (en) | 2009-02-26 |
WO2008000316A1 (en) | 2008-01-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2559307T3 (es) | Codificador de audio y decodificador de audio que tiene una característica de deformación dinámicamente variable | |
US6453282B1 (en) | Method and device for detecting a transient in a discrete-time audiosignal | |
CN104395958B (zh) | 数字音频信号中的有效前回声衰减 | |
EP2707873B1 (en) | Method and encoder for processing a digital stereo audio signal | |
US7873511B2 (en) | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic | |
US8682652B2 (en) | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic | |
CN105960675B (zh) | 音频信号解码器中改进的频带扩展 | |
JP2010170124A (ja) | 信号圧縮方法及び装置 | |
CA2898677A1 (en) | Low-frequency emphasis for lpc-based coding in frequency domain | |
EP2628156A1 (en) | Audio signal bandwidth extension in celp-based speech coder | |
EP1873754B1 (en) | Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic | |
WO2011127569A1 (en) | Flexible and scalable combined innovation codebook for use in celp coder and decoder | |
ES2692831T3 (es) | Discriminación y atenuación de pre-ecos en una señal de audio digital | |
FI3707715T3 (fi) | Signaalisuodatus | |
WO2008138267A1 (fr) | Procede de post-traitement et appareil d'amelioration de ton fondamental | |
EP2628155A1 (en) | Audio signal bandwidth extension in celp-based speech coder | |
Lee et al. | Pre-echo control using an improved post-filter in the frequency domain | |
Kitamura et al. | Spectral distortion and quality of synthesized speech in cepstral speech analysis‐synthesis system | |
Zölzer et al. | Dynamic range control | |
Chan | Efficient implementation of perceptual postfilter for CELP coding of speech | |
JPS61242117A (ja) | ブロツクフロ−テイング方式 |