ES2237706T3 - Reconstruccion de componentes de alta frecuencia. - Google Patents
Reconstruccion de componentes de alta frecuencia.Info
- Publication number
- ES2237706T3 ES2237706T3 ES02787866T ES02787866T ES2237706T3 ES 2237706 T3 ES2237706 T3 ES 2237706T3 ES 02787866 T ES02787866 T ES 02787866T ES 02787866 T ES02787866 T ES 02787866T ES 2237706 T3 ES2237706 T3 ES 2237706T3
- Authority
- ES
- Spain
- Prior art keywords
- signal
- frequency
- spectral
- band
- encoded
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 claims abstract description 62
- 238000001228 spectrum Methods 0.000 claims abstract description 21
- 230000003595 spectral effect Effects 0.000 claims description 130
- 230000005236 sound signal Effects 0.000 claims description 48
- 238000011069 regeneration method Methods 0.000 claims description 22
- 230000008929 regeneration Effects 0.000 claims description 21
- 210000000481 breast Anatomy 0.000 claims description 14
- 238000005070 sampling Methods 0.000 claims description 13
- 230000015572 biosynthetic process Effects 0.000 claims description 10
- 238000003786 synthesis reaction Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 5
- 230000001419 dependent effect Effects 0.000 claims description 3
- 230000004044 response Effects 0.000 claims description 2
- 238000005259 measurement Methods 0.000 claims 1
- 238000001514 detection method Methods 0.000 abstract description 7
- 230000007246 mechanism Effects 0.000 abstract description 2
- 238000013459 approach Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000017105 transposition Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 230000008520 organization Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000006835 compression Effects 0.000 description 1
- 238000007906 compression Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000008054 signal transmission Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/028—Noise substitution, i.e. substituting non-tonal spectral components by noisy source
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
- G10L19/07—Line spectrum pair [LSP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/093—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters using sinusoidal excitation models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/26—Pre-filtering or post-filtering
- G10L19/265—Pre-filtering, e.g. high frequency emphasis prior to encoding
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Quality & Reliability (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Ceramic Products (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Channel Selection Circuits, Automatic Tuning Circuits (AREA)
- Piezo-Electric Transducers For Audible Bands (AREA)
- Inorganic Insulating Materials (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
Abstract
Codificador para codificar una señal de audio para obtener una señal codificada, destinándose la señal codificada a la decodificación utilizando una técnica de regeneración de altas frecuencias que es conveniente para generar componentes de frecuencia por encima de una frecuencia predeterminada basándose en las componentes de frecuencia por debajo de la frecuencia predeterminada, comprendiendo el codificador: un medio (702) para proporcionar una señal de entrada codificada, que es una representación codificada de una señal de entrada, codificándose la señal de entrada utilizando un algoritmo de codificación y representando un contenido de frecuencia de la señal de audio por debajo de la frecuencia predeterminada; un regenerador (703c) de altas frecuencias sirve para realizar la técnica de regeneración de altas frecuencias sobre la señal de entrada, o sobre una versión codificada y decodificada de la misma, para obtener una señal regenerada que tiene componentes de frecuencia por encima de la frecuencia predeterminada; un detector (703a) para detectar diferencias entre la señal regenerada y la señal de audio, que se encuentran por encima un umbral de significación; un descriptor (703b) para describir diferencias para obtener información adicional; y un combinador (705) para combinar la señal de entrada codificada y la información adicional para producir una señal codificada.
Description
Reconstrucción de componentes de alta
frecuencia.
La presente invención se refiere a sistemas de
codificación de fuentes que utilizan la reconstrucción de altas
frecuencias (HFR - High Frequency Reconstruction) tal como la
Replicación de la Banda Espectral (Spectral Band Replication), o SBR
[WO 98/57436], o métodos relacionados. Mejora el rendimiento de los
métodos de alta calidad (SBR), así como de los métodos de copia de
baja calidad [patente estadounidense 5.127.054]. Es aplicable a
sistemas tanto de codificación de voz como de codificación de audio
natural.
La reconstrucción de altas frecuencias (HFR) es
una tecnología relativamente nueva para la mejora de la calidad de
algoritmos de codificación de audio y voz. Hasta la fecha, se ha
introducido para el uso en codecs de voz, tales como el codificador
AMR de banda ancha para sistemas celulares de 3ª generación, y
codificadores de audio, tales como de mp3 o AAC, en la que los
codecs de forma de onda tradicionales se complementan con el
algoritmo SBR de reconstrucción de altas frecuencias (lo que da como
resultado el mp3PRO o el AAC+SBR).
La reconstrucción de altas frecuencias es un
método muy eficaz para codificar altas frecuencias de señales de
audio y de voz. Puesto que no puede realizar la codificación por su
cuenta, siempre se usa en combinación con un codificador de audio
normal basado en formas de onda (por ejemplo, AAC, mp3) o un
codificador de voz. Éstos son responsables de codificar las
frecuencias más bajas del espectro. La idea básica de la
reconstrucción de altas frecuencias consiste en que las frecuencias
más altas no se codifican y transmiten, sino que se reconstruyen en
el decodificador basándose en el espectro más bajo con ayuda de
algunos parámetros adicionales (principalmente, datos que describen
la envolvente espectral de alta frecuencia de la señal de audio) que
se transmiten en un flujo de bits de baja velocidad binaria (véase,
por ejemplo, Valin J. et al: "Bandwidth extension of
narrowband speech for low bit-rate wideband
coding", Proc. Taller IEEE sobre codificación de voz,
17-20 septiembre, 2000, páginas
130-132), el cual puede transmitirse por separado o
como datos auxiliares del codificador base. Los parámetros
adicionales podrían también omitirse, pero a fecha de hoy, la
calidad alcanzable por un enfoque así será peor en comparación con
un sistema que utilice parámetros adicionales.
Especialmente para la codificación de audio, la
HFR mejora significativamente la eficiencia de la codificación,
especialmente en el intervalo de calidad de "suena bien, pero no
es transparente". Esto es así por dos motivos:
\bullet Los codecs de forma de onda
tradicionales, tales como de mp3, necesitan recudir el ancho de
banda de audio para velocidades binarias muy bajas, ya que si no, el
nivel de artefactos en el espectro se vuelve demasiado alto. La HFR
regenera esas altas frecuencias a un coste muy reducido y con buena
calidad. Puesto que la HFR permite una manera de bajo coste de crear
componentes de alta frecuencia, el ancho de banda de audio
codificado por el codificador de audio puede reducirse
adicionalmente, lo que tiene como resultado menos artefactos y un
mejor comportamiento en el caso más desfavorable de todo el
sistema.
\bullet La HFR puede emplearse en combinación
con un submuestreo en el codificador / sobremuestreo en el
decodificador. En este escenario frecuentemente utilizado, el
codificador HFR analiza las señales de audio de ancho de banda
completo, pero la señal introducida en el codificador de audio se
submuestrea a una velocidad de muestreo menor. Un ejemplo típico es
una velocidad HFR de 44,1 kHz y una velocidad del codificador de
audio de 22,05 kHz. Hacer funcionar el codificador de audio a una
velocidad de muestreo baja es una ventaja porque normalmente es más
eficiente a la velocidad de muestreo más reducida. En el lado de
decodificación, la señal de audio decodificada de baja velocidad de
muestreo se sobremuestrea y se añade la parte de la HFR - por tanto,
pueden generare frecuencias hasta la frecuencia de Nyquist original,
aunque el codificador de audio funciona a, por ejemplo, la mitad de
la velocidad de muestreo.
Un parámetro básico para un sistema que emplee al
HFR es la denominada frecuencia de cruce (COF - Cross Over
Frequency), es decir, la frecuencia en la que se detiene la
codificación normal de formas de onda y comienza el intervalo de
frecuencias de HFR. La disposición más sencilla es tener la COF a
una frecuencia constante. Una solución más avanzada, la cual ya se
ha introducido, consiste en ajustar dinámicamente la COF a las
características de la señal a codificar.
Un problema importante de la HFR es que una señal
de audio puede contener componentes en frecuencias más elevadas que
sean difíciles de reconstruir con el método HFR actual, pero que
podrían reconstruirse más fácilmente por otros medios, por ejemplo,
métodos de codificación de formas de onda o por generación sintética
de señales. Un ejemplo sencillo es codificar una señal que
únicamente conste de una onda senoidal por encima de la COF, figura
1. Aquí, la COF es de 5,5 kHz. Puesto que ninguna señal útil se
encuentra disponible en las frecuencias bajas, el método HFR, basado
en la extrapolación de la banda baja para obtener una banda alta, no
generará ninguna señal.
Por consiguiente, la señal de onda senoidal no
puede reconstruirse. Se precisan otros medios para codificar esta
señal de una manera útil. En este caso sencillo, los sistemas HFR
que proporcionan un ajuste flexible de la COF, ya pueden resolver el
problema hasta cierto punto. Si la COF se fija por encima de la
frecuencia de la onda senoidal, la señal puede codificarse muy
eficientemente empleando el codificador central. Sin embargo, esto
presupone que resulta posible hacerlo, lo que no siempre puede ser
el caso. Tal como se ha mencionado anteriormente, una de las
ventajas principales de combinar la HFR con la codificación de audio
es el hecho de que el codificador central puede funcionar a mitad de
la velocidad de muestreo (proporcionando una eficiencia de
compresión más elevada). En un escenario realista, tal como un
sistema a 44,1 kHz con el núcleo funcionando a 22,05 kHz, un
codificador central así sólo puede codificar señales de hasta
aproximadamente 10,5 kHz. Sin embargo, aparte de eso, el problema se
vuelve significativamente más complicado, incluso para partes del
espectro dentro del alcance del codificador central, cuando se
consideran señales más complejas. Las señales del mundo real pueden,
por ejemplo, contener componentes audibles semejantes a ondas
senoidales a altas frecuencias dentro de un espectro complejo (por
ejemplo, campanas pequeñas), figura 2. El ajuste de la COF no supone
una solución en este caso, ya que la mayor parte de la ganancia
conseguida por el método HFR disminuiría al usar el codificador
central para una parte mucho más grande del espectro.
Por tanto, una solución a los problemas esbozados
más arriba, y el asunto de la presente invención, es la idea de un
sistema HFR muy flexible que no sólo permita cambiar la COF, sino
que permita una composición mucho más flexible del espectro
decodificado/reconstruido por una composición selectiva en
frecuencia de distintos métodos.
La base de la invención es un mecanismo en el
sistema HFR que permite una selección dependiente de la frecuencia
de distintos métodos de codificación o reconstrucción. Por ejemplo,
esto podría realizarse con el sistema de análisis/síntesis con banco
de 64 filtros de banda empleado en la SBR. Un complejo banco de
filtros que proporcione funciones de ecualización libres de alias
puede ser especialmente útil.
La actividad inventiva principal es que el banco
de filtros se utiliza ahora no sólo para servir como filtro para la
COF y el siguiente ajuste de envolvente. También se empleó, de
manera muy flexible, para seleccionar la entrada para cada uno de
los canales del banco de filtros que sale de las siguientes
fuentes:
codificación de formas de onda (utilizando el
codificador central);
transposición (con el siguiente ajuste de
envolvente);
codificación de formas de onda (utilizando una
codificación adicional más allá de Nyquist);
codificación paramétrica;
cualquier otro método de
codificación/reconstrucción aplicable en ciertas partes del
espectro;
o cualquier combinación de los mismos.
Por tanto, la codificación de formas de onda,
otros métodos de codificación y la reconstrucción HFR pueden
utilizarse ahora en cualquier disposición espectral arbitraria para
conseguir la calidad y la ganancia de codificación más altas
posibles. Sin embargo, debería resultar evidente que la invención no
se limita al uso de un banco de filtros en subbandas, sino que, por
supuesto, puede emplearse con un filtrado selectivo en frecuencia
arbitrario.
La presente invención comprende las siguientes
características:
un método HFR que utiliza la banda baja
disponible en dicho decodificador para extrapolar una banda
alta;
en el lado del codificador, usar el método HFR
para evaluar, dentro de diferentes regiones de frecuencia, dónde el
método HFR, basándose en el intervalo de frecuencias por debajo de
la COF, no genera correctamente una línea espectral o líneas
espectrales similares a la línea espectral o líneas espectrales de
la señal original;
codificar la línea espectral o líneas espectrales
para las diferentes regiones de frecuencia;
transmitir la línea espectral o líneas
espectrales codificadas para las diferentes regiones de frecuencia
del codificador al decodificador;
decodificar la línea espectral o líneas
espectrales;
añadir la línea espectral o líneas espectrales
decodificadas a las diferentes regiones de frecuencia de la salida
del método HFR en el decodificador;
la codificación es una codificación paramétrica
de dicha línea espectral o líneas espectrales;
la codificación es una codificación de formas de
onda de dicha línea espectral o líneas espectrales;
la línea espectral o líneas espectrales,
codificadas paramétricamente, se sintetizan empleando un banco de
filtros en subbandas;
la codificación de formas de onda de la línea
espectral o líneas espectrales es realizada por el codificador
central subyacente del sistema de codificación de fuentes;
la codificación de formas de onda de la línea
espectral o líneas espectrales es realizada por un codificador de
formas de onda arbitrario.
La presente invención se describirá ahora por
medio de ejemplos ilustrativos, los cuales no limitan el alcance o
espíritu de la invención, con referencia a los dibujos adjuntos, en
los que:
La figura 1 ilustra el espectro de una señal
original con sólo un seno por encima de una COF de 5,5 kHz;
la figura 2 ilustra el espectro de una señal
original que contiene campanillas en música pop;
la figura 3 ilustra la detección de los armónicos
que faltan utilizando la ganancia de predicción;
la figura 4 ilustra el espectro de una señal
original;
la figura 5 ilustra el espectro sin la presente
invención;
la figura 6 ilustra el espectro de salida sin la
presente invención;
la figura 7 ilustra una posible implementación de
un codificador de la presente invención;
la figura 8 ilustra una posible implementación de
un decodificador de la presente invención;
la figura 9 ilustra un diagrama esquemático de un
codificador inventivo;
la figura 10 ilustra un diagrama esquemático de
un decodificador inventivo;
la figura 11 es un diagrama que muestra la
organización del intervalo espectral en bandas y canales de factores
de escala en relación con la frecuencia de corte y la frecuencia de
muestreo, y
la figura 12 es el diagrama esquemático para el
decodificador inventivo en relación con un método de transposición
HFR basado en un enfoque de banco de filtros.
Las realizaciones descritas más abajo son
meramente ilustrativas para los principios de la presente invención,
para la mejora de sistemas de reconstrucción de altas frecuencias.
Se entiende que las modificaciones y variaciones de las
disposiciones y los detalles descritos en la presente memoria les
resultarán evidentes a otros expertos en la técnica. Por tanto, la
intención es que esté limitada únicamente por el alcance de las
inminentes reivindicaciones de patente y no por los detalles
específicos presentados a modo de descripción y explicación de las
realizaciones en la presente memoria.
La figura 9 ilustra un codificador inventivo. El
codificador incluye un codificador 702 central. Cabe indicarse aquí
que el método inventivo también puede emplearse como un denominado
módulo de ampliación para un codificador central existente. En este
caso, el codificador inventivo incluye una entrada para recibir una
señal codificada de entrada producida por un codificador 702 central
permanente distinto.
El codificador inventivo de la figura 9 incluye
adicionalmente un bloque 703c de regeneración de altas frecuencias,
un detector 703a de diferencias, un bloque 703b de descripción de
diferencias, así como un combinador 705.
En lo sucesivo, se describirá la interdependencia
funcional de los medios a los que se ha hecho referencia más
arriba.
En particular, el codificador inventivo es para
codificar una entrada de señal de audio en una entrada 900 de
señales de audio para obtener una señal codificada. La señal
codificada está dirigida a la decodificación utilizando una técnica
de regeneración de altas frecuencias que es conveniente para generar
componentes de frecuencia por encima de una frecuencia
predeterminada, la cual se llama también frecuencia de corte,
basándose en las componentes de frecuencia por debajo de la
frecuencia predeterminada.
Cabe indicarse aquí que puede emplearse, como
técnica de regeneración de altas frecuencias, una amplia variedad de
aquellas técnicas que se han dado a conocer recientemente. A este
respecto, el término "componente de frecuencia" ha de
entenderse en sentido amplio. Este término incluye al menos
coeficientes espectrales obtenidos por medio de una transformada en
dominio del tiempo/dominio de la frecuencia, tal como una FFT, una
MDCT u otra. Adicionalmente, el término "componente de
frecuencia" también incluye señales de paso de banda, es decir,
señales obtenidas a la salida de filtros selectivos en frecuencia
tales como un filtro paso bajo, un filtro pasabanda o un filtro
paso
alto.
alto.
Independientemente del hecho de si el codificador
702 central forma parte del codificador inventivo o si el
codificador inventivo se emplea como módulo de ampliación para un
codificador central existente, el codificador incluye medios para
proporcionar una señal de entrada codificada, que es una
representación codificada de una señal de entrada y que se codifica
empleando un algoritmo de codificación. A este respecto, cabe
observarse que la señal de entrada representa un contenido de
frecuencia de la señal de audio por debajo de una frecuencia
predeterminada, es decir, por debajo de la denominada frecuencia de
corte. Para ilustrar el hecho de que el contenido de frecuencia de
la señal de entrada sólo incluye una parte de banda baja de la señal
de audio, en la figura 9 se muestra un filtro 902 paso bajo. El
codificador inventivo puede tener, en efecto, un filtro paso bajo
así. Alternativamente, un filtro paso bajo así puede incluirse en el
codificador 702 central. Alternativamente, un codificador central
puede realizar la función de desechar una banda de frecuencia de la
señal de audio mediante cualquier otro medio conocido.
A la salida del codificador 702 central, se
encuentra presente una señal de entrada codificada que, con respecto
a este contenido de frecuencia, es similar a la señal de entrada,
pero es diferente de la señal de audio porque la señal de entrada
codificada no incluye ningún componente de frecuencia por encima de
la frecuencia predetermina-
da.
da.
El bloque 703c de regeneración de altas
frecuencias sirve para realizar la técnica de regeneración de altas
frecuencias sobre la señal de entrada, es decir, la señal de entrada
introducida en el codificador 702 central, o sobre una versión
codificada y decodificada de nuevo de la misma. En caso de que se
seleccione esta alternativa, el codificador inventivo incluye
también un decodificador 903 central que recibe la señal de entrada
codificada del codificador central y decodifica esta señal para que
se tenga exactamente la misma situación que se da en el lado del
decodificador/receptor, en la que ha de realizarse una técnica de
regeneración de altas frecuencias para mejorar el ancho de banda de
audio para señales codificadas que se han transmitido utilizando una
velocidad binaria baja.
El bloque 702 HFR produce a una señal regenerada
que tiene componentes de frecuencia por encima de la frecuencia
predeterminada.
Tal como se muestra en la figura 9, la señal
regenerada por el bloque 703c HFR se introduce en un medio 703a de
detección de diferencias. Por otra parte, el medio de detección de
diferencias también recibe la entrada de señal original de audio en
la entrada 900 de señales de audio. El medio para detectar
diferencias entre la señal regenerada procedente del bloque 703c HFR
y la señal de audio procedente de la entrada 900 se dispone para
detectar una diferencia entre esas señales, que se encuentran por
encima de un umbral de significación predeterminado. Posteriormente
se describen varios ejemplos de umbrales preferidos que funcionan
como umbrales de significación.
La salida del detector de diferencias está
conectada a una entrada de un bloque 703b de descripción de
diferencias. El bloque 703b de descripción de diferencias sirve para
describir diferencias detectadas de una cierta manera para obtener
información adicional sobre las diferencias detectadas. Esta
información adicional es apropiada para introducirse en un medio 705
de combinación que combina la señal de entrada codificada, la
información adicional y varias otras señales que pueden producirse
para obtener una señal codificada a transmitirse a un receptor o
almacenarse en un medio de almacenamiento. Un ejemplo destacado de
información adicional es una información de envolventes espectrales
producida por un estimador 704 de envolventes espectrales. El
estimador 704 de envolventes espectrales está dispuesto para
proporcionar una información de envolventes espectrales de la señal
de audio por encima de la frecuencia predeterminada, es decir, por
encima de la frecuencia de corte. Esta información de envolventes
espectrales se utiliza en un módulo HFR en el lado del decodificador
para sintetizar componentes espectrales de una señal de audio
decodificada por encima de la frecuencia predeterminada.
En una realización preferida de la presente
invención, el estimador 704 de envolventes espectrales está
dispuesto para proporcionar únicamente una representación de baja
resolución de la envolvente espectral. En particular, se prefiere
proporcionar sólo un valor de envolvente espectral para cada banda
de factor de escala. Los expertos en la técnica conocen el uso de
bandas de factor de escala. En relación con los codificadores de
transformada, tales como de MP3 o MPEG-AAC, una
banda de factor de escala incluye varias líneas MDCT. La
organización detallada acerca de qué líneas espectrales pertenecen a
qué banda de factor de escala está estandarizada, pero puede variar.
Generalmente, una banda de factor de escala incluye varias líneas
espectrales (por ejemplo, líneas MDCT, en las que MDCT significa
transformada modificada discreta del coseno), o señales de paso de
banda, cuyo número varía de banda de factor de escala a banda de
factor de escala. Generalmente, una banda de factor de escala
incluye al menos más de dos, y normalmente más de diez o veinte
líneas espectrales o señales de paso de banda.
De acuerdo con una realización preferida de la
presente invención, el codificador inventivo incluye adicionalmente
una frecuencia variable de corte. El control de la frecuencia de
corte lo realiza el detector 703a de diferencias inventivo. El
control está dispuesto de manera que, cuando el detector de
diferencias llega a la conclusión de que una frecuencia de corte más
alta contribuiría mucho a reducir artefactos que se producirían
mediante una HFR pura, el detector de diferencias puede ordenarle al
filtro 902 paso bajo y al estimador 704 de envolventes espectrales,
así como al codificador 702 central, que coloquen la frecuencia de
corte en frecuencias más altas para ampliar el ancho de banda de la
señal de entrada codificada.
Por otra parte, el detector de diferencias
también puede disponerse para reducir la frecuencia de corte en caso
de que descubra que un cierto ancho de banda por debajo de la
frecuencia de corte no es importante acústicamente y por tanto puede
producirse fácilmente mediante una síntesis HFR en el decodificador
en vez de tener que ser codificado directamente por el codificador
central.
Por otra parte, los bits que se ahorran al
reducir la frecuencia de corte pueden utilizarse para el caso en el
que haya que aumentar la frecuencia de corte para que pueda
obtenerse un tipo de opción ahorradora de bits que se conozca para
un método de codificador psicoacústica. En estos métodos muchos
componentes tonales que son difíciles de codificar, es decir, que
precisan muchos bits para codificarse sin artefactos, pueden
consumir más bits cuando, por otro lado, en la señal también se
encuentran presentes partes de señal de ruido blanco que son fáciles
de codificar, es decir, que sólo necesitan un pequeño número de bits
para codificarse sin artefactos, y son reconocidas por un cierto
control de ahorro de bits.
En resumen, el control de la frecuencia de corte
está dispuesto para aumentar o reducir la frecuencia predeterminada,
es decir, la frecuencia de corte, en respuesta a hallazgos hechos
por el detector de diferencias, el cual, en general, calcula la
efectividad y el rendimiento del bloque 703c HFR en simular la
situación real en un diferencia de fase.
Preferiblemente, el detector 703a de diferencias
se dispone para detectar líneas espectrales en la señal de audio que
no se incluyan en la señal regenerada. Para hacer esto, el detector
de diferencias incluye preferiblemente un predictor para realizar
operaciones de predicción sobre la señal regenerada y la señal de
audio y medios para determinar una diferencia en las ganancias de
predicción obtenidas para la señal regenerada y la señal de audio.
En particular, se determinan partes relacionadas con la frecuencia
en la señal regenerada o en la señal de audio, en las que una
diferencia en ganancias de predicción es mayor que el umbral de
ganancia que es el umbral de significación en esta realización
preferida.
Cabe indicarse aquí que el detector 703a de
diferencias funciona preferiblemente como un elemento selectivo en
frecuencia porque calcula bandas de frecuencia en la señal
regenerada, por una parte, y en la señal de audio, por la otra. Con
este fin, el detector de diferencias puede incluir elementos de
conversión tiempo-frecuencia para convertir la señal
de audio y la señal regenerada. En caso de que la señal regenerada
producida por el bloque 703c HFR ya se encuentre presente como una
representación relacionada con la frecuencia, lo cual es el caso en
el método de regeneración de altas frecuencias preferido aplicado
para la presente invención, no son necesarios tales medios de
conversión en dominio del tiempo/dominio de la frecuencia.
En caso de que haya que usar un elemento de
conversión en dominio del tiempo/dominio de la frecuencia, tal como
para convertir la señal de audio, que normalmente es una señal en
dominio del tiempo, se prefiere un enfoque de banco de filtros. Un
banco de filtros de análisis incluye banco de filtros pasabanda
adyacentes, adecuadamente dimensionados, en el que cada filtro
pasabanda produce una señal pasabanda que tiene un ancho de banda
definido por el ancho de banda del filtro pasabanda respectivo. La
señal de filtro pasabanda puede interpretarse como una señal en
dominio del tiempo que tiene un ancho de banda restringido en
comparación con la señal a partir de la cual se ha obtenido. La
frecuencia central de una señal pasabanda está definida por la
ubicación del filtro pasabanda respectivo en el banco de filtros de
análisis, tal como se conoce en la técnica.
Tal como se describirá más adelante, el método
preferido para determinar diferencias por encima de un umbral de
significación es una determinación basada en medidas de la tonalidad
y en particular en una relación tonal a ruido, puesto que tales
métodos son convenientes para descubrir líneas espectrales en
señales o descubrir partes semejantes a ruido en señales de una
manera robusta y eficiente.
A fin de poder codificar las líneas espectrales
que faltarán en la salida decodificada tras la HFR, resulta esencial
detectarlas en el codificador. Para llevar esto a cabo, es necesario
realizar en el codificador una síntesis adecuada de la
posteriormente HFR del decodificador. Esto no implica que la
síntesis necesite ser una señal de salida en dominio del tiempo
similar a la del decodificador. Basta con observar y sintetizar una
representación espectral absoluta de la HFR en el decodificador.
Esto puede llevarse a cabo empleando una predicción en un banco de
filtros QMF con un posteriormente escogimiento de picos de la
diferencia en la ganancia de predicción entre la original y una
homóloga de HFR. En vez del escogimiento de picos de la diferencia
en la ganancia de predicción, también pueden emplearse diferencias
del espectro absoluto. Para ambos métodos, la ganancia de predicción
dependiente de la frecuencia o el espectro absoluto de la HFR se
sintetizan cambiando simplemente la distribución de frecuencias de
las componentes, parecido a los que la HFR hará en el
decodificador.
Una vez que se obtienen las dos representaciones,
la señal original y la señal HFR sintetizada, la detección puede
realizarse de varias maneras.
En un banco de filtros QMF, puede llevarse a cabo
una predicción lineal de bajo orden, por ejemplo, LPC de orden 2,
para los distintos canales. Dada la energía de la señal predicha y
la energía total de la señal, la relación tonal a ruido puede
definirse según
q-\frac{\Psi -
E}{E}
donde
\Psi=|x(0)|^{2} +
|x(1)|^{2} +
....+|x(N-1)|^{2}
es la energía del bloque de señales
y E es la energía del bloque de errores de predicción para un canal
de banco de filtros dado. Esta puede calcularse para la señal
original, y dado esto, una representación de cómo puede obtenerse la
relación tonal/ruido para distintas bandas de frecuencia en la
salida de HFR en el decodificador. Por tanto, puede calcularse la
diferencia entre las dos sobre una base selectiva en frecuencia
arbitraria (mayor que la resolución en frecuencia del QMF). Este
vector de diferencia que representa la diferencia de relaciones
tonal a ruido entre la señal original y la salida esperada de la HFR
en el decodificador se utiliza posteriormente para determinar dónde
se requiere un método de codificación adicional a fin de compensar
las deficiencias de la técnica de HFR dada, figura 3. Aquí, la
relación tonal a ruido correspondiente al intervalo de frecuencias
entre las bandas 15 - 41 del banco de filtros en subbandas se
representa para la señal original y una salida sintetizada de HFR.
La rejilla representa las bandas de factor de escala del intervalo
de frecuencias agrupadas a modo de escala Bark. Para cada banda de
factor de escala, la diferencia entre las componentes más grandes de
la señal original y la salida de HFR se calcula y se representa en
el tercer
gráfico.
La detección anterior también puede realizarse
empleando una representación espectral arbitraria de la señal
original y de una salida sintetizada de HFR, por ejemplo, escogiendo
picos en un espectro absoluto ["Extraction of spectral peak
parameters using a short time Fourier transform modeling [sic] and
no sidelobe windows." Ph Depalle, T Hélie, IRCAM] o métodos
similares, y comparando luego las componentes tonales detectadas en
la señal original y las componentes detectadas en la salida
sintetizada de HFR.
Cuando se ha juzgado que falta una línea
espectral de la salida de HFR, necesita codificarse eficientemente,
transmitirse al decodificador y añadirse a la salida de HFR. Pueden
utilizarse varios enfoques; la codificación de formas de onda
entrelazadas o, por ejemplo, la codificación paramétrica de la línea
espectral.
Si la línea espectral a codificar se encuentra
situada por debajo de FS/2 del codificador central, puede ser
codificada por el mismo. Esto significa que el codificador central
codifica el intervalo de frecuencias completo hasta la COF y también
un intervalo de frecuencias definido, que rodea a la componente
tonal, que no se reproducirá mediante la HFR en el decodificador.
Alternativamente, la componente tonal puede ser codificada por un
codificador de formas de onda arbitrario, con este enfoque, el
sistema no se ve limitado por la FS/2 del codificador central, sino
que puede funcionar en todo el intervalo de frecuencias de la señal
original.
Con este fin, en el codificador inventivo se
proporciona la unidad 910 de control del codificador central. En
caso de que el detector 703a de diferencias determine un pico
significativo por encima de la frecuencia predeterminada, pero por
debajo de la mitad del valor de la frecuencia de muestreo (FS/2),
éste ordena al codificador 702 central que codifique centralmente
una señal pasabanda obtenida de la señal de audio, en el que la
banda de frecuencia de la señal pasabanda incluye la frecuencia
donde se ha detectado la línea espectral y, dependiendo de la
implementación real, también una banda de frecuencia específica que
intercala la línea espectral detectada. Con este fin, el propio
codificador 702 central, o un filtro pasabanda controlable dentro
del codificador central, filtra la parte relevante de la señal de
audio, que se envía directamente al codificador central, tal como se
muestra mediante una línea 912 disconti-
nua.
nua.
En este caso, el codificador 702 central funciona
como el descriptor 703b de diferencias porque codifica la línea
espectral por encima de la frecuencia de corte que ha detectado el
detector de diferencias. Por tanto, la información adicional
obtenida por el descriptor 703b de diferencias corresponde a la
señal codificada producida por el codificador 702 central que está
relacionada con la cierta banda de la señal de audio por encima de
la frecuencia predeterminada, pero por debajo del valor de la
frecuencia de muestreo (FS/2).
Para ilustrar mejor la planificación de
frecuencias anteriormente mencionada, se hace referencia a la figura
11. La figura 11 muestra la escala de frecuencias que comienza en
una frecuencia 0 y se extiende hacia la derecha en la figura 11. En
un cierto valor de frecuencia, puede observarse la frecuencia 1100
predeterminada, que también se llama frecuencia de corte. Por debajo
de esta frecuencia, el codificador 702 central de la figura 9 se
encuentra activo para producir la señal de entrada codificada. Por
encima de la frecuencia predeterminada, sólo se encuentra activo el
estimador 704 de envolventes espectrales para obtener, por ejemplo,
una envolvente espectral para cada banda de factor de escala. Por la
figura 11, se hace evidente que una banda de factor de escala
incluye varios canales que, en el caso los codificadores por
transformada conocidos, corresponden a coeficientes de frecuencia o
señales pasabanda. La figura 11 también es útil para mostrar los
canales de banco de filtros de síntesis del banco de filtros de
síntesis de la figura 12 que se describirán posteriormente.
Adicionalmente, se hace referencia a la mitad del valor de la
frecuencia FS/2 de muestreo que, en el caso de la figura 11, se
encuentra por encima de la frecuencia predetermina-
da.
da.
En caso de que una línea espectral detectada se
encuentre por encima de FS/2, el codificador 702 central no puede
funcionar como el descriptor 703b de diferencias. En este caso, tal
como se esboza más arriba, en el descriptor de diferencias han de
aplicarse algoritmos de codificación completamente diferentes para
codificar/obtener información adicional sobre líneas espectrales en
la señal de audio que no se reproducirán mediante una técnica de HFR
ordinaria.
En lo sucesivo, se hace referencia a la figura 10
para ilustrar un decodificador inventivo para decodificar una señal
codificada. La señal codificada se introduce por una entrada 1000 en
un demultiplexor 801 de flujos de datos. En particular, la señal
codificada incluye una señal de entrada codificada (producida por el
codificador 702 central en la figura 9) que representa un contenido
de frecuencia de una señal original de audio (introducida en la
entrada 1000 desde la figura 9) por debajo de una frecuencia
predeterminada. La codificación de la señal original se realizó en
el codificador 702 central empleando un cierto algoritmo de
codificación conocido. La señal codificada en la entrada 1000
incluye información adicional que describe diferencias detectadas
entre una señal regenerada y la señal original de audio, generándose
la señal regenerada mediante una técnica de regeneración de altas
frecuencias (implementada en el bloque 703c HFR en la figura 9) a
partir de la señal de entrada o de una versión codificada y
decodificada de la misma (realización con el codificador 903 central
en la figura 9).
En particular, el decodificador inventivo incluye
un medio para obtener una señal de entrada decodificada, que se
produce decodificando la señal de entrada codificada de acuerdo con
el algoritmo de codificación. Con este fin, el decodificador
inventivo puede incluir un decodificador 803 central, tal como se
muestra en la figura 10. Alternativamente, el decodificador
inventivo también puede utilizarse como módulo de ampliación para un
decodificador central existente de manera que los medios para
obtener una señal de entrada decodificada puedan implementarse
empleando una cierta entrada de un bloque 804 HFR colocado
subsiguientemente, tal como se muestra en la figura 10. El
decodificador inventivo también incluye un reconstructor para
reconstruir basándose en la información adicional diferencias
detectadas que han sido producidas por el descriptor 703b de
diferencias que se muestra en la figura 9.
Como componente esencial, el decodificador
inventivo incluye adicionalmente un medio de regeneración de altas
frecuencias para realizar una técnica de regeneración de altas
frecuencias similar a la técnica de regeneración de altas
frecuencias que ha sido implementada por el bloque 703c HFR, tal
como se muestra en la figura 9. El bloque de regeneración de altas
frecuencias produce una señal regenerada que, en un decodificador
HFR normal, se utilizaría para sintetizar la parte espectral de la
señal de audio que se ha desechado en el codificador.
De acuerdo con la presente invención, se
proporciona un productor que incluye las funcionalidades de los
bloques 806 y 807, de manera que la señal de audio producida por el
productor no sólo incluye un parte reconstruida de alta frecuencia,
sino que también incluye cualquier diferencia detectada,
preferiblemente una línea espectral, que no puede ser sintetizada
por el bloque 804 HFR pero que se encontraba presente en la señal
original de audio.
Tal como se esbozará mas adelante, el productor
806, 807 puede usar la señal regenerada producida por el bloque 804
HFR y simplemente combinarla con la señal decodificada de banda baja
producida por el decodificador 803 central y luego insertar líneas
espectrales basándose en la información adicional. Alternativa y
preferiblemente, el productor también realiza alguna manipulación de
las líneas espectrales generadas por HFR, tal como se explicará con
respecto a la figura 12. Generalmente, el productor no sólo
simplemente inserta una línea espectral en el espectro HFR en una
cierta posición de frecuencia, sino que también da cuentas de la
energía de la línea espectral insertada en la atenuación de las
líneas espectrales regeneradas por HFR en los alrededores de la
línea espectral insertada.
Las medidas anteriores se basan en una estimación
de parámetros de envolvente espectral realizada en el codificador.
En una banda espectral por encima de la frecuencia predeterminada,
es decir, la frecuencia de corte, en la que está colocada una línea
espectral, el estimador de envolventes espectrales estima la energía
de esta banda. Una banda así es, por ejemplo, una banda de factor de
escala. Puesto que el estimador de envolventes espectrales acumula
la energía en esta banda independientemente del hecho de si la
energía procede de líneas espectrales ruidosas o de ciertos picos
notables, es decir, líneas espectrales tonales, la estimación de la
envolvente espectral para la banda de factor de escala dada incluye
la energía de la línea espectral, así como la energía de las líneas
espectrales "ruidosas" en la banda de factor de escala
dada.
Para usar la información de estimación de la
energía espectral transmitida en relación con la señal codificada de
manera tan precisa como sea posible, el decodificador inventivo da
cuenta del método de acumulación de energía en el codificador
ajustando la línea espectral insertada, así como las líneas
espectrales "ruidosas" vecinas en la banda de factor de escala
dada para que la energía total, es decir, la energía de todas las
líneas en esta banda, corresponda a la energía dictada por la
estimación de envolvente espectral transmitida para esta banda de
factor de escala.
La figura 12 muestra un diagrama esquemático para
la reconstrucción HFR preferida basada en un banco 1200 de filtros
de análisis y un banco 1202 de filtros de síntesis. El banco de
filtros de análisis así como el banco de filtros de síntesis constan
de varios canales de banco de filtros, que también se ilustran en la
figura 11 con respecto a una banda de factor de escala y la
frecuencia predeterminada. Los canales de banco de filtros por
encima de la frecuencia predeterminada, que se indica como 1204 en
la figura 12, han de reconstruirse por medio de señales de banco de
filtros, es decir, los canales de banco de filtros por debajo de la
frecuencia predeterminada, tal como se indica en la figura 12
mediante las líneas 1206. Cabe indicarse aquí que en cada canal de
banco de filtros, se encuentra presente una señal pasabanda que
tiene muestras complejas de señal pasabanda. El bloque 804 de
reconstrucción de altas frecuencias en la figura 10 y también el
bloque 703c HFR de la figura 9 incluyen un módulo 1208 de
transposición/ajuste de envolvente que está dispuesto para llevar a
cabo la HFR con respecto a ciertos algoritmos HFR. Cabe indicarse
que el bloque en el lado del codificador no tiene porqué incluir
necesariamente un módulo de ajuste de envolvente. Se prefiere
estimar una medida de la tonalidad como función de la frecuencia.
Entonces, cuando la tonalidad difiere demasiado, la diferencia en la
envolvente espectral absoluta es irrelevante.
El algoritmo HFR puede ser un algoritmo HFR
armónico puro o armónico aproximado o puede ser un algoritmo HFR de
complejidad reducida que incluya la transposición de varios canales
de banco de filtros consecutivos por debajo de la frecuencia
predeterminada en ciertos canales de banco de filtros consecutivos
por encima de la frecuencia predeterminada. Adicionalmente, el
bloque 1208 incluye preferiblemente una función de ajuste de
envolvente para que las magnitudes de las líneas espectrales
transpuestas se ajusten de manera que la energía acumulada de las
líneas espectrales ajustadas en una banda de factor de escala, por
ejemplo, corresponda al valor de envolvente espectral para la banda
de factor de escala.
Por la figura 12, se hace evidente que una banda
de factor de escala incluye varios canales de banco de filtros. Una
banda de factor de escala ejemplar se extiende desde un canal
l_{inf} de banco de filtros hasta un canal l_{sup} de banco de
filtros.
Con respecto al posterior método de
adaptación/inserción de senos, cabe indicarse aquí que esta
adaptación o "manipulación" es realizada por el productor 806,
807 en la figura 10, el cual incluye un manipulador 1210 para
manipular señales pasabanda producidas por HFR. Como entrada, este
manipulador 1210 recibe, del reconstructor 805 en la figura 10, al
menos la posición de la línea, es decir, preferiblemente el número
l_{s}, en la que ha de colocarse el seno sintetizado.
Adicionalmente, el manipulador 1210 recibe preferiblemente un nivel
adecuado para esta línea espectral (onda senoidal) y preferiblemente
también información sobre una energía total de la banda 1212 de
factores de escala sfb dada.
Cabe indicarse aquí que un cierto canal l_{s}
en el que ha de insertarse la señal senoidal sintética se trata de
manera diferente a los otros canales en la banda 1212 de factores de
escala dada, tal como se esbozará más abajo. Tal como se ha
explicado más arriba, este "tratamiento" de las señales de
canal regeneradas por HFR, tal como son producidas por el bloque
1208, lo realiza el manipulador 1210, que forma parte del productor
806, 807 de la figura 10.
A continuación, se explica un ejemplo de sistema
basado en bancos de filtros que utiliza la codificación paramétrica
de líneas espectrales que faltan.
Cuando se emplea un método HFR en el que el
sistema utiliza la adición de ruido de fondo adaptativo [según el
documento PCT/SE00/00159], sólo es necesario codificar la posición
frecuencial de la línea espectral que falta, puesto que el nivel de
la línea espectral viene dado implícitamente por los datos de
envolvente y los datos de ruido de fondo. La energía total de una
banda de factor de escala dada viene dada por los datos de energía,
y la relación de energía tonal/ruido viene dada por los datos de
nivel de ruido de fondo. Además, en el dominio de alta frecuencia,
la posición exacta de la línea espectral es de menor importancia, ya
que la resolución en frecuencia del sistema auditivo humano es
bastante baja a frecuencias más elevadas. Esto implica que las
líneas espectrales pueden codificarse con gran eficiencia,
esencialmente con un vector que indica para cada banda de factor de
escala si debería añadirse un seno en esa banda particular en el
decodificador.
Las líneas espectrales pueden generarse en el
decodificador de varias maneras. Un enfoque emplea el banco de
filtros QMF ya utilizado para el ajuste de envolvente de la señal
HFR. Este es muy eficaz, ya que resulta muy sencillo generar ondas
senoidales en un banco de filtros en subbandas, siempre y cuando se
coloquen en el centro de un canal de filtro a fin de no generar un
solapamiento en canales adyacentes. Esto no constituye una
restricción severa puesto que la posición frecuencial de la línea
espectral se cuantifica normalmente de manera bastante basta.
Si los datos de envolvente espectral enviados
desde el codificador al decodificador se representan por energías de
banco de filtros en subbandas agrupadas, en tiempo y frecuencia, el
vector envolvente espectral puede representarse en cualquier
instante mediante:
\overline{e}=[e(1),
e(2).....e(M)]
y el vector nivel de ruido de fondo
puede describirse
según:
\overline{q}=[q(1),
q(2).....q(M)]
Aquí, las energías y los datos de ruido de fondo
se promedian en las bandas de banco de filtros QMF descritos por un
vector
\overline{v}=[bfb......bfa]
que contiene la entradas de banda
QMF, de la banda QMF más baja utilizada (bfb) a la más alta (bfa),
cuya longitud es M + 1, y donde los límites de cada banda de factor
de escala (en bandas QMF) vienen dados
por:
donde l_{b} es el límite inferior
y l_{a} es el límite superior de la banda n de factores de escala.
En lo anterior, el vector \overline{q} de datos de nivel de ruido
de fondo se ha representado a la misma resolución en frecuencia que
la de los datos
\overline{e}.
Si en un canal de banco de filtros se genera un
seno sintético, éste debe considerarse para todos los canales de
banco de filtros en subbandas incluidos en esa banda de factor de
escala particular. Puesto que ésta es la mayor resolución en
frecuencia de la envolvente espectral en este intervalo de
frecuencias. Si esta resolución en frecuencia se utiliza también
para señalizar la posición frecuencial de las líneas espectrales que
faltan de la HFR y necesita añadirse a la salida, la generación y
compensación para estos senos sintéticos puede realizarse según lo
que viene a continuación.
En primer lugar, es necesario ajustar todos los
canales de subbanda dentro de la banda de factor de escala actual
para que se mantenga energía media para la banda según:
donde l_{b} y l_{a} son los
límites para la banda de factor de escala en la que se añadirá un
seno sintético, x_{re} y x_{im} son las muestras de subbanda
real e imaginaria, l es el índice de canal
y
g_{hfr}(n)=\sqrt{\frac{\overline{q}(n)}{1
+ \overline{q}(n)}}
es el factor de ajuste de la
ganancia, donde n es la banda de factor de escala actual. Cabe
mencionarse aquí que la ecuación anterior no es válida para la línea
espectral / señal pasabanda del canal de banco de filtros en el que
se colocará el
seno.
Cabe indicarse aquí que la anterior ecuación sólo
es válida para los canales en la banda de factor de escala dada que
se extienden de l_{inf} a l_{sup}, excepto la señal pasabanda en
el canal que tiene el número l_{s}. Esta señal se trata por medio
del siguiente grupo de ecuaciones.
El manipulador 1210 calcula la siguiente ecuación
para el canal que tiene el número l_{s} de canal, es decir, modula
la señal pasabanda en el canal l_{s} por medio de la señal
compleja de modulación que representa una onda senoidal sintética.
Adicionalmente, el manipulador 1210 realiza una ponderación de la
línea espectral producida por el bloque 1208 HFR, así como la
determinación del nivel del seno sintético por medio del factor
g_{seno} de ajuste de senos sintéticos. Por tanto, la siguiente
ecuación es válida únicamente para un canal l_{s} de banco de
filtros en el que se colocará un seno.
Por consiguiente, el seno se coloca en el canal
l_{s} QMF, donde l_{b} \leq l_{s} < l_{u}, según:
y_{re}(l_{s})
- x_{re}(l_{s})\cdot g_{hfr}(l_{s}) +
g_{sen}(l_{s})\cdot\overline{\varphi}_{re}(k)
y_{lm}(l_{s})
- x_{lm}(l_{s})\cdot g_{hfr}(l_{s}) +
g_{sen}(l_{s})\cdot(-l)^{l_{a}}\cdot\overline{\varphi}_{lm}(k)
donde k es el índice del vector
modulación (0 \leq k < 4) y (-l) ^{l}_{s} da el conjugado
complejo para un canal sí y otro no. Esto es necesario puesto que un
canal sí y otro no en el banco de filtros tiene la frecuencia
invertida. El vector modulación para colocar un seno en el centro de
una banda compleja de banco de filtros en subbandas
es:
y el nivel del seno sintético viene
dado
por:
g_{seno}(n) =
\sqrt{\overline{e}(n)}
Lo anterior se representa en las figuras
4-6, en las que en la figura 4 se representa un
espectro de la señal original, y en las figuras 5-6
se representa el espectro de la salida con y sin lo anterior. En la
figura 5, el tono en el entorno de 8 kHz se sustituye por ruido de
banda ancha. En la figura 6, un seno está insertado en el centro de
la banda de factor de escala en el entorno de 8 kHz, y la energía
para la banda de factor de escala entera está ajustada para que
retenga la energía media correcta para esa banda de factor de
escala.
La presente invención puede implementarse tanto
en chips de hardware como en DSP (procesador digital de señales),
para varios tipos sistemas, para el almacenamiento o transmisión de
señales, analógicas o digitales, utilizando codecs arbitrarios. En
la figura 7 se representa una posible implementación de codificador
de la presente invención. La señal analógica de entrada se convierte
701 en una homóloga digital y se suministra al codificador 702
central, así como al módulo de extracción de parámetros para la HFR
704. Se realiza 703 un análisis para determinar qué líneas
espectrales faltarán tras una reconstrucción de altas frecuencias en
el decodificador. Estas líneas espectrales se codifican de manera
adecuada y se multiplexan 705 en el flujo de bits junto con el resto
de los datos codificados. La figura 8 representa una posible
implementación de decodificador de la presente invención. El flujo
de bits se demultiplexa 801 y la banda baja es decodificada por el
decodificador 803 central, la banda alta se reconstruye utilizando
una unidad 804 HFR adecuada y la información adicional de las líneas
espectrales que faltan después de que la HFR se decodifique 805 y se
emplea para regenerar 806 las componentes que faltan. La envolvente
espectral de la banda alta se decodifica 802 y se utiliza para
ajustar 807 la envolvente espectral de la banda alta reconstruida.
La banda baja se retarda 808 a fin de garantizar una sincronización
temporal correcta con la banda alta reconstruida, y las dos se
añaden juntas. La señal digital de banda ancha se convierte 809 en
una señal analógica de banda ancha.
Dependiendo de los detalles de implementación,
los métodos inventivos de codificación o de decodificación pueden
implementarse en hardware o en software. La implementación puede
tener lugar en un soporte de almacenamiento digital, en particular,
un disco, un CD con señales de control legibles electrónicamente,
que puede cooperar con un sistema informático programable para que
se realice el método correspondiente. Generalmente, la presente
invención también se refiere a un producto de programa de ordenador
con un código de programa almacenado en un soporte legible por
máquina para llevar a cabo los métodos inventivos cuando el programa
de ordenador se ejecute en un ordenador. En otras palabras, la
presente invención es por tanto un programa de ordenador con un
código de programa para realizar el método inventivo de codificación
o de decodificación cuando el programa de ordenador se ejecuta en un
ordenador.
Cabe indicarse que la descripción anterior se
refiere a un sistema complejo. Sin embargo, la implementación
inventiva de decodificador también funciona en un sistema de valores
reales. En este caso, las ecuaciones calculadas por el manipulador
1210 sólo incluyen las ecuaciones para la parte real.
Claims (30)
1. Codificador para codificar una señal de audio
para obtener una señal codificada, destinándose la señal codificada
a la decodificación utilizando una técnica de regeneración de altas
frecuencias que es conveniente para generar componentes de
frecuencia por encima de una frecuencia predeterminada basándose en
las componentes de frecuencia por debajo de la frecuencia
predeterminada, comprendiendo el codificador:
un medio (702) para proporcionar una señal de
entrada codificada, que es una representación codificada de una
señal de entrada, codificándose la señal de entrada utilizando un
algoritmo de codificación y representando un contenido de frecuencia
de la señal de audio por debajo de la frecuencia predeterminada;
un regenerador (703c) de altas frecuencias sirve
para realizar la técnica de regeneración de altas frecuencias sobre
la señal de entrada, o sobre una versión codificada y decodificada
de la misma, para obtener una señal regenerada que tiene componentes
de frecuencia por encima de la frecuencia predeterminada;
un detector (703a) para detectar diferencias
entre la señal regenerada y la señal de audio, que se encuentran por
encima un umbral de significación;
un descriptor (703b) para describir diferencias
para obtener información adicional; y
un combinador (705) para combinar la señal de
entrada codificada y la información adicional para producir una
señal codificada.
2. Codificador según la reivindicación 1, en el
que las diferencias detectadas son líneas espectrales en la señal de
audio que no están incluidas en la señal regenerada.
3. Codificador según la reivindicación 1 ó 2, en
el que la frecuencia predeterminada es una frecuencia de corte que
determina una frecuencia hasta la cual el algoritmo de codificación
codifica la señal de entrada.
4. Codificador según una de las reivindicaciones
anteriores, en el que el detector (703a) está dispuesto para usar
una pluralidad de bandas de frecuencia para la señal regenerada y la
señal de audio, en el que las diferencias se detectan basándose en
bandas de frecuencia de la señal regenerada y en las mismas bandas
de frecuencia de la señal de audio.
5. Codificador según una de las reivindicaciones
anteriores, en el que el detector (703a) y/o el regenerador de altas
frecuencias incluyen un convertidor del dominio del tiempo al
dominio de la frecuencia.
6. Codificador según la reivindicación 5, en el
que el convertidor del dominio del tiempo al dominio de la
frecuencia es una transformada o un banco de filtros.
7. Codificador según una de las reivindicaciones
anteriores, en el que el detector (703) comprende:
un predictor para realizar predicciones sobre la
señal regenerada y la señal de audio; y
un detector para detectar una diferencia en unas
ganancias de predicción obtenidas por el predictor que es mayor que
un umbral de ganancia que forma el umbral de significación.
8. Codificador según una de las reivindicaciones
anteriores, en el que el detector (703a) está dispuesto para
detectar una diferencia en el espectro absoluto de la señal de audio
y de la señal regenerada que es superior a un umbral de diferencia
predeterminado que forma el umbral de significación.
9. Codificador según una de las reivindicaciones
anteriores, en el que el detector (703a) para detectar está
dispuesto para determinar una medida de la tonalidad dependiente de
la frecuencia para la señal de audio y la señal regenerada, en el
que se detecta una banda de frecuencia en la que las medidas de la
tonalidad difieren en más de un umbral de diferencia que forma el
umbral de significación.
10. Codificador según la reivindicación 9, en el
que la medida de la tonalidad es una relación tonal a ruido.
11. Codificador según una de las reivindicaciones
anteriores,
en el que la señal de audio es una señal de audio
discreta muestreada utilizando una frecuencia de muestreo;
en el que la frecuencia predeterminada es menor
que la mitad del valor de la frecuencia de muestreo;
en el que el detector (703a) está dispuesto para
determinar una diferencia para una banda de frecuencia específica
por encima de la banda de frecuencia predeterminada, siendo una
frecuencia central de la banda de frecuencia específica menor que la
mitad del valor de la frecuencia de muestreo, comprendiendo además
el codificador:
un controlador (910) para controlar a un
codificador que produce la señal de entrada codificada, para
codificar adicionalmente la señal de audio con respecto a la banda
de frecuencia específica, según el algoritmo de codificación, a fin
de describir la diferencia determinada, en el que una salida del
codificador (702) para la banda de frecuencia específica sirve como
la información adicional.
12. Codificador según una de las reivindicaciones
1 a 10, en el que el descriptor (703b) incluye un filtro pasabanda
para filtrar por paso de banda la señal de audio, fijándose el
filtro pasabanda en una banda de frecuencia específica que incluye
una diferencia detectada, y en el que el descriptor (703b) incluye
un codificador para codificar una salida del filtro pasabanda para
obtener la señal adicional, utilizando el codificador un algoritmo
de codificación distinto del algoritmo de codificación por medio del
cual se codifica la señal de entrada codificada.
13. Codificador según una de las reivindicaciones
1 a 11, en el que el detector para detectar diferencias está
dispuesto para detectar líneas espectrales, y en el que el
descriptor está dispuesto para producir información sobre la
posición frecuencial de la línea espectral detectada.
14. Codificador según la reivindicación 13, en el
que la información sobre la posición frecuencial incluye un vector
que indica, para una banda de factor de escala, si se ha añadido una
línea espectral en la banda de factor de escala específica cuando se
ha decodificado la señal codificada.
15. Codificador según una de las reivindicaciones
anteriores, en el que la señal de audio se procesa en cuanto a
tramas, y en el que la frecuencia determinada es variable de trama a
trama.
16. Codificador según la reivindicación 15, en el
que el detector (703a) de diferencias comprende además un
controlador de la frecuencia de corte para variar la frecuencia
predeterminada basándose en una diferencia detectada.
17. Codificador según una de las reivindicaciones
anteriores, en el que la técnica HFR está dispuesta para producir
valores espectrales por encima de la frecuencia predeterminada a
partir de valores espectrales por debajo de la frecuencia
predeterminada.
18. Codificador según una de las reivindicaciones
anteriores, en el que la técnica HFR está dispuesta para transponer
un grupo de valores espectrales o señales pasabanda que están
relacionadas con frecuencias consecutivas en un grupo de valores
espectrales o señales pasabanda por encima de la frecuencia
predeterminada que corresponden a frecuencias consecutivas.
19. Codificador según la reivindicación 17 ó 18,
que comprende además un estimador (704) de envolventes espectrales
para determinar una envolvente espectral de la señal de audio,
estando relacionada la envolvente espectral con una parte espectral
de la señal de audio por encima de la frecuencia predeterminada.
20. Codificador según la reivindicación 19, en el
que los datos de envolvente espectral incluyen un número de puntos
de datos de envolvente que es menor que un número de valores
espectrales, en el que se proporciona un punto de datos para una
banda de factor de escala.
21. Codificador según una de las reivindicaciones
anteriores, en el que las componentes espectrales son coeficientes
de transformada complejas o señales pasabanda complejas.
22. Decodificador inventivo para decodificar una
señal codificada, incluyendo la señal codificada una señal de
entrada codificada que representa un contenido de frecuencia de una
señal original de audio por debajo de una frecuencia predeterminada,
realizándose la codificación utilizando un algoritmo de
codificación, e información adicional que describe diferencias
detectadas entre una señal regenerada y la señal original de audio,
generándose la señal regenerada mediante una técnica de regeneración
de altas frecuencias a partir de la señal de entrada o de una
versión codificada y decodificada de la misma, comprendiendo el
decodificador:
un medio (803) para obtener una señal de entrada
decodificada, que se produce decodificando la señal de entrada
codificada de acuerdo con el algoritmo de codificación;
un reconstructor (805) para reconstruir
diferencias detectadas basándose en la información adicional;
un regenerador (804) de altas frecuencias para
llevar a cabo una técnica de regeneración de altas frecuencias,
similar a la técnica de regeneración de altas frecuencias para
obtener las diferencias detectadas, para obtener la señal
regenerada;
un productor (806, 807) para producir una señal
de audio regenerada de alta frecuencia basándose en la señal de
entrada decodificada, las diferencias reconstruidas y la señal
regenerada.
23. Decodificador según la reivindicación 22, en
el que una diferencia detectada incluye líneas espectrales en una
región de frecuencias específica y la información adicional está
relacionada con la región de frecuencias específica, en el que el
reconstructor (805) está dispuesto para generar una línea espectral
en la región específica en respuesta a la información adicional.
24. Decodificador según la reivindicación 22 ó
23, en el que la información adicional especifica una banda de
factor de escala en la que ha de reconstruirse una línea espectral,
en el que la señal codificada comprende además datos de envolvente
espectral para describir una parte espectral de la señal de audio
por encima de la frecuencia predeterminada, en el que el productor
(806, 807) está dispuesto para generar una línea espectral en la
banda de factor de escala y en el que el productor (806, 807) está
dispuesto adicionalmente para ajustar líneas espectrales en la banda
de factor de escala para que se mantenga una energía dada para la
banda de factor de escala que incluye la línea espectral
generada.
25. Decodificador según una de las
reivindicaciones 22 a 24, en el que el regenerador (804) de altas
frecuencias incluye un banco (1203) de filtros de síntesis que tiene
canales de banco de filtros de síntesis en el que una banda de
factor de escala incluye más de un canal de banco de filtros, en el
que la señal codificada incluye además un vector envolvente
espectral y un vector nivel de ruido de fondo y en el que el
reconstructor (805) está dispuesto para calcular un nivel de la
línea espectral reconstruida basándose en el vector envolvente
espectral.
26. Decodificador según la reivindicación 25, en
el que el productor (806, 807) está dispuesto para determinar
señales pasabanda para canales de banco de filtros, en los que no ha
de insertarse ningún seno, en una banda de factor de escala de
acuerdo con la siguiente ecuación
en la que l es un número de canal
de banco de filtros, en la que l_{b} es el número de canal de
banco de filtros más bajo para la banda de factor de escala, en la
que l_{a} es el canal de banco de filtros más alto para la banda
de factor de escala, en la que x_{re} es la parte real de una
muestra de señal pasabanda producida por el bloque (804) HFR, en la
que x_{im} es una parte imaginaria de la muestra de señal
pasabanda producida por el bloque (804) HFR, en el que y_{re} e
y_{im} son la parte real y la parte imaginaria de una señal
pasabanda ajustada para un canal de banco de filtros y en la que
g_{hfr} es un factor de ajuste de la ganancia obtenido del vector
nivel de ruido de
fondo.
27. Decodificador según la reivindicación 25 ó
26, en el que el reconstructor (805) está dispuesto para determinar
una cierta banda l_{s} de factor de escala en la que ha de
insertarse un seno sintético y en el que un nivel de un seno
sintético a insertar se define como sigue:
g_{seno}(n) =
\sqrt{\overline{e}(n)}
en la que n es un número de la
banda de factor de escala dada y e es el vector envolvente
espectral, y en el que el productor está dispuesto para determinar
una señal pasabanda para el canal en el que ha de colocarse el seño
sintético de acuerdo con la siguiente
ecuación:
y_{re}(l_{s})
- x_{re}(l_{s})\cdot g_{hfr}(l_{s}) +
g_{sen}(l_{s})\cdot\overline{\varphi}_{re}(k)
y_{lm}(l_{s})
- x_{lm}(l_{s})\cdot g_{hfr}(l_{s}) +
g_{sen}(l_{s})\cdot(-l)^{l_{a}}\cdot\overline{\varphi}_{lm}(k)
en la que l es un número de canal
de banco de filtros, en el que ha de insertarse un seno, en la que
l_{b} es el número de canal de banco de filtros más bajo para la
banda de factor de escala, en la que l_{a} es el canal de banco de
filtros más alto para la banda de factor de escala, en la que
x_{re} es la parte real de una muestra de señal pasabanda
producida por el bloque (804) HFR, en la que x_{im} es una parte
imaginaria de la muestra de señal pasabanda producida por el bloque
(804) HFR, y en el que y_{re} e y_{im} son la parte real y la
parte imaginaria de una señal pasabanda ajustada para un canal de
banco de filtros y en la que g_{hfr} es un factor de ajuste de la
ganancia obtenido del vector nivel de ruido de fondo, en la que
\varphi_{re} y \varphi_{im} forman un vector modulación
complejo para colocar un seno en una señal pasabanda y en la que k
es un índice de vector modulación que oscila entre 0 y
4.
28. Método para codificar una señal de audio para
obtener una señal codificada, destinándose la señal codificada a la
decodificación utilizando una técnica de regeneración de altas
frecuencias que es conveniente para generar componentes de
frecuencia por encima de una frecuencia predeterminada basándose en
las componentes de frecuencia por debajo de la frecuencia
predeterminada, comprendiendo el método las siguientes etapas:
proporcionar una señal de entrada codificada, que
es una representación codificada de una señal de entrada,
codificándose la señal de entrada utilizando un algoritmo de
codificación y representando un contenido de frecuencia de la señal
de audio por debajo de la frecuencia predeterminada;
realizar la técnica de regeneración de altas
frecuencias sobre la señal de entrada, o sobre una versión
codificada y decodificada de la misma, para obtener una señal
regenerada que tiene componentes de frecuencia por encima de la
frecuencia predeterminada;
detectar (703c) diferencias entre la señal
regenerada y la señal de audio, que se encuentran por encima de un
umbral de significación;
describir (703b) diferencias para obtener
información adicional; y
combinar la señal de entrada codificada y la
información adicional para producir una señal codificada.
29. Método para decodificar una señal codificada,
incluyendo la señal codificada una señal de entrada codificada que
representa un contenido de frecuencia de una señal original de audio
por debajo de una frecuencia predeterminada, realizándose la
codificación utilizando un algoritmo de codificación, e información
adicional que describe diferencias detectadas entre una señal
regenerada y la señal original de audio, generándose la señal
regenerada mediante una técnica de regeneración de altas frecuencias
a partir de la señal de entrada o de una versión codificada y
decodificada de la misma, comprendiendo el método las siguientes
etapas:
obtener una señal de entrada decodificada, que se
produce decodificando la señal de entrada codificada de acuerdo con
el algoritmo de codificación;
reconstruir diferencias detectadas basándose en
la información adicional;
llevar a cabo una técnica de regeneración de
altas frecuencias, similar a la técnica de regeneración de altas
frecuencias para obtener las diferencias detectadas, para obtener la
señal regenerada;
producir una señal de audio regenerada de alta
frecuencia basándose en la señal de entrada decodificada, las
diferencias reconstruidas y la señal regenerada.
30. Programa de ordenador que tiene un código de
programa para realizar el método de codificación según la
reivindicación 21 o el método de decodificación según la
reivindicación 22 cuando el programa de ordenador se ejecuta en un
ordenador.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0104004 | 2001-11-29 | ||
SE0104004 | 2001-11-29 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2237706T3 true ES2237706T3 (es) | 2005-08-01 |
Family
ID=20286143
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES02787866T Expired - Lifetime ES2237706T3 (es) | 2001-11-29 | 2002-11-28 | Reconstruccion de componentes de alta frecuencia. |
Country Status (12)
Country | Link |
---|---|
US (15) | US7469206B2 (es) |
EP (1) | EP1423847B1 (es) |
JP (1) | JP3870193B2 (es) |
KR (1) | KR100648760B1 (es) |
CN (1) | CN1279512C (es) |
AT (1) | ATE288617T1 (es) |
AU (1) | AU2002352182A1 (es) |
DE (1) | DE60202881T2 (es) |
ES (1) | ES2237706T3 (es) |
HK (1) | HK1062350A1 (es) |
PT (1) | PT1423847E (es) |
WO (1) | WO2003046891A1 (es) |
Families Citing this family (131)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE60202881T2 (de) | 2001-11-29 | 2006-01-19 | Coding Technologies Ab | Wiederherstellung von hochfrequenzkomponenten |
CN1328707C (zh) | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
JP2005024756A (ja) * | 2003-06-30 | 2005-01-27 | Toshiba Corp | 復号処理回路および移動端末装置 |
KR100513729B1 (ko) * | 2003-07-03 | 2005-09-08 | 삼성전자주식회사 | 계층적인 대역폭 구조를 갖는 음성 압축 및 복원 장치와그 방법 |
JP4966013B2 (ja) * | 2003-10-30 | 2012-07-04 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | オーディオ信号のエンコードまたはデコード |
US7668711B2 (en) * | 2004-04-23 | 2010-02-23 | Panasonic Corporation | Coding equipment |
KR101143724B1 (ko) * | 2004-05-14 | 2012-05-11 | 파나소닉 주식회사 | 부호화 장치 및 부호화 방법, 및 부호화 장치를 구비한 통신 단말 장치 및 기지국 장치 |
EP1742202B1 (en) * | 2004-05-19 | 2008-05-07 | Matsushita Electric Industrial Co., Ltd. | Encoding device, decoding device, and method thereof |
EP1810281B1 (en) * | 2004-11-02 | 2020-02-26 | Koninklijke Philips N.V. | Encoding and decoding of audio signals using complex-valued filter banks |
US8082156B2 (en) | 2005-01-11 | 2011-12-20 | Nec Corporation | Audio encoding device, audio encoding method, and audio encoding program for encoding a wide-band audio signal |
US7536304B2 (en) * | 2005-05-27 | 2009-05-19 | Porticus, Inc. | Method and system for bio-metric voice print authentication |
JP4899359B2 (ja) * | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
KR101171098B1 (ko) * | 2005-07-22 | 2012-08-20 | 삼성전자주식회사 | 혼합 구조의 스케일러블 음성 부호화 방법 및 장치 |
EP1926083A4 (en) * | 2005-09-30 | 2011-01-26 | Panasonic Corp | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
WO2007099580A1 (ja) * | 2006-02-28 | 2007-09-07 | Matsushita Electric Industrial Co., Ltd. | マルチメディアデータ再生装置および方法 |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
EP2062255B1 (en) * | 2006-09-13 | 2010-03-31 | Telefonaktiebolaget LM Ericsson (PUBL) | Methods and arrangements for a speech/audio sender and receiver |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
KR101565919B1 (ko) | 2006-11-17 | 2015-11-05 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 방법 및 장치 |
JP5103880B2 (ja) * | 2006-11-24 | 2012-12-19 | 富士通株式会社 | 復号化装置および復号化方法 |
JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
DE102007003187A1 (de) * | 2007-01-22 | 2008-10-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines zu sendenden Signals oder eines decodierten Signals |
WO2008114080A1 (en) * | 2007-03-16 | 2008-09-25 | Nokia Corporation | Audio decoding |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
CN101939782B (zh) * | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
KR101373004B1 (ko) * | 2007-10-30 | 2014-03-26 | 삼성전자주식회사 | 고주파수 신호 부호화 및 복호화 장치 및 방법 |
US9177569B2 (en) | 2007-10-30 | 2015-11-03 | Samsung Electronics Co., Ltd. | Apparatus, medium and method to encode and decode high frequency signal |
EP2227682A1 (en) * | 2007-11-06 | 2010-09-15 | Nokia Corporation | An encoder |
CA2704812C (en) * | 2007-11-06 | 2016-05-17 | Nokia Corporation | An encoder for encoding an audio signal |
CA2704807A1 (en) * | 2007-11-06 | 2009-05-14 | Nokia Corporation | Audio coding apparatus and method thereof |
CN102568489B (zh) * | 2007-11-06 | 2015-09-16 | 诺基亚公司 | 编码器 |
CN101903945B (zh) * | 2007-12-21 | 2014-01-01 | 松下电器产业株式会社 | 编码装置、解码装置以及编码方法 |
ATE518224T1 (de) * | 2008-01-04 | 2011-08-15 | Dolby Int Ab | Audiokodierer und -dekodierer |
WO2009109373A2 (en) * | 2008-03-04 | 2009-09-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus for mixing a plurality of input data streams |
CN101281748B (zh) * | 2008-05-14 | 2011-06-15 | 武汉大学 | 用编码索引实现的空缺子带填充方法及编码索引生成方法 |
EP2346030B1 (en) * | 2008-07-11 | 2014-10-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, method for encoding an audio signal and computer program |
WO2010003521A1 (en) | 2008-07-11 | 2010-01-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and discriminator for classifying different segments of a signal |
MX2011000367A (es) | 2008-07-11 | 2011-03-02 | Fraunhofer Ges Forschung | Un aparato y un metodo para calcular una cantidad de envolventes espectrales. |
BRPI0910792B1 (pt) * | 2008-07-11 | 2020-03-24 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | "sintetizador de sinal de áudio e codificador de sinal de áudio" |
CA2730232C (en) * | 2008-07-11 | 2015-12-01 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | An apparatus and a method for decoding an encoded audio signal |
JP5203077B2 (ja) * | 2008-07-14 | 2013-06-05 | 株式会社エヌ・ティ・ティ・ドコモ | 音声符号化装置及び方法、音声復号化装置及び方法、並びに、音声帯域拡張装置及び方法 |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
WO2010028299A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Noise-feedback for spectral envelope quantization |
WO2010028297A1 (en) | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8532983B2 (en) * | 2008-09-06 | 2013-09-10 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction for encoding or decoding an audio signal |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
CN101685637B (zh) * | 2008-09-27 | 2012-07-25 | 华为技术有限公司 | 音频编码方法及装置和音频解码方法及装置 |
PL4231291T3 (pl) * | 2008-12-15 | 2024-04-15 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Dekoder powiększania szerokości pasma audio, powiązany sposób oraz program komputerowy |
AU2013203159B2 (en) * | 2008-12-15 | 2015-09-17 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Audio encoder and bandwidth extension decoder |
WO2010070770A1 (ja) * | 2008-12-19 | 2010-06-24 | 富士通株式会社 | 音声帯域拡張装置及び音声帯域拡張方法 |
CA3162807C (en) | 2009-01-16 | 2024-04-23 | Dolby International Ab | Cross product enhanced harmonic transposition |
CA2749239C (en) | 2009-01-28 | 2017-06-06 | Dolby International Ab | Improved harmonic transposition |
ES2826324T3 (es) | 2009-01-28 | 2021-05-18 | Dolby Int Ab | Transposición armónica mejorada |
KR101441474B1 (ko) * | 2009-02-16 | 2014-09-17 | 한국전자통신연구원 | 적응적 정현파 펄스 코딩을 이용한 오디오 신호의 인코딩 및 디코딩 방법 및 장치 |
KR101661374B1 (ko) * | 2009-02-26 | 2016-09-29 | 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 | 부호화 장치, 복호 장치 및 이들 방법 |
CA2949616C (en) | 2009-03-17 | 2019-11-26 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
EP2239732A1 (en) | 2009-04-09 | 2010-10-13 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Apparatus and method for generating a synthesis audio signal and for encoding an audio signal |
RU2452044C1 (ru) | 2009-04-02 | 2012-05-27 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. | Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
CO6440537A2 (es) * | 2009-04-09 | 2012-05-15 | Fraunhofer Ges Forschung | Aparato y metodo para generar una señal de audio de sintesis y para codificar una señal de audio |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
KR101405022B1 (ko) * | 2009-09-18 | 2014-06-10 | 돌비 인터네셔널 에이비 | 입력 신호를 전위시키기 위한 시스템 및 방법, 상기 방법을 수행하는 소프트웨어 프로그램 및 컴퓨터 프로그램 제품을 포함하는 저장 매체 |
WO2011035813A1 (en) * | 2009-09-25 | 2011-03-31 | Nokia Corporation | Audio coding |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
CN102754159B (zh) | 2009-10-19 | 2016-08-24 | 杜比国际公司 | 指示音频对象的部分的元数据时间标记信息 |
JPWO2011048741A1 (ja) * | 2009-10-20 | 2013-03-07 | 日本電気株式会社 | マルチバンドコンプレッサ |
EP4276823B1 (en) * | 2009-10-21 | 2024-07-17 | Dolby International AB | Oversampling in a combined transposer filter bank |
US8326607B2 (en) * | 2010-01-11 | 2012-12-04 | Sony Ericsson Mobile Communications Ab | Method and arrangement for enhancing speech quality |
WO2011114192A1 (en) * | 2010-03-19 | 2011-09-22 | Nokia Corporation | Method and apparatus for audio coding |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
BR112012026502B1 (pt) * | 2010-04-16 | 2022-10-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V | Aparelho, método para gerar um sinal de banda larga usando extensão de largura de guiada e extensão de largura de banda cega |
US8538035B2 (en) | 2010-04-29 | 2013-09-17 | Audience, Inc. | Multi-microphone robust noise suppression |
US8473287B2 (en) | 2010-04-19 | 2013-06-25 | Audience, Inc. | Method for jointly optimizing noise reduction and voice quality in a mono or multi-microphone system |
US8798290B1 (en) | 2010-04-21 | 2014-08-05 | Audience, Inc. | Systems and methods for adaptive signal equalization |
US8781137B1 (en) | 2010-04-27 | 2014-07-15 | Audience, Inc. | Wind noise detection and suppression |
US9245538B1 (en) * | 2010-05-20 | 2016-01-26 | Audience, Inc. | Bandwidth enhancement of speech signals assisted by noise reduction |
US8958510B1 (en) * | 2010-06-10 | 2015-02-17 | Fredric J. Harris | Selectable bandwidth filter |
US8447596B2 (en) | 2010-07-12 | 2013-05-21 | Audience, Inc. | Monaural noise suppression based on computational auditory scene analysis |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
SG10201505469SA (en) | 2010-07-19 | 2015-08-28 | Dolby Int Ab | Processing of audio signals during high frequency reconstruction |
JP5707842B2 (ja) | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
EP2710588B1 (en) | 2011-05-19 | 2015-09-09 | Dolby Laboratories Licensing Corporation | Forensic detection of parametric audio coding schemes |
EP3288033B1 (en) * | 2012-02-23 | 2019-04-10 | Dolby International AB | Methods and systems for efficient recovery of high frequency audio content |
CN106847303B (zh) * | 2012-03-29 | 2020-10-13 | 瑞典爱立信有限公司 | 支持谐波音频信号的带宽扩展的方法、设备和记录介质 |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
EP2704142B1 (en) * | 2012-08-27 | 2015-09-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for reproducing an audio signal, apparatus and method for generating a coded audio signal, computer program and coded audio signal |
CN103928031B (zh) | 2013-01-15 | 2016-03-30 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
WO2014115225A1 (ja) * | 2013-01-22 | 2014-07-31 | パナソニック株式会社 | 帯域幅拡張パラメータ生成装置、符号化装置、復号装置、帯域幅拡張パラメータ生成方法、符号化方法、および、復号方法 |
KR101771828B1 (ko) * | 2013-01-29 | 2017-08-25 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 오디오 인코더, 오디오 디코더, 인코딩된 오디오 정보를 제공하기 위한 방법, 디코딩된 오디오 정보를 제공하기 위한 방법, 컴퓨터 프로그램 및 신호 적응적 대역폭 확장을 이용한 인코딩된 표현 |
PT2951814T (pt) | 2013-01-29 | 2017-07-25 | Fraunhofer Ges Forschung | Ênfase de baixa frequência para codificação com base em lpc em domínio de frequência |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
CN110265047B (zh) * | 2013-04-05 | 2021-05-18 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
EP2830061A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
TWI557726B (zh) * | 2013-08-29 | 2016-11-11 | 杜比國際公司 | 用於決定音頻信號的高頻帶信號的主比例因子頻帶表之系統和方法 |
JP6531649B2 (ja) | 2013-09-19 | 2019-06-19 | ソニー株式会社 | 符号化装置および方法、復号化装置および方法、並びにプログラム |
CN104517611B (zh) | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
KR20160087827A (ko) * | 2013-11-22 | 2016-07-22 | 퀄컴 인코포레이티드 | 고대역 코딩에서의 선택적 위상 보상 |
US9524720B2 (en) * | 2013-12-15 | 2016-12-20 | Qualcomm Incorporated | Systems and methods of blind bandwidth extension |
BR112016014476B1 (pt) | 2013-12-27 | 2021-11-23 | Sony Corporation | Aparelho e método de decodificação, e, meio de armazenamento legível por computador |
US20150194157A1 (en) * | 2014-01-06 | 2015-07-09 | Nvidia Corporation | System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals |
CN110808056B (zh) | 2014-03-14 | 2023-10-17 | 瑞典爱立信有限公司 | 音频编码方法和装置 |
PL3550563T3 (pl) * | 2014-03-31 | 2024-07-08 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Enkoder, dekoder, sposób enkodowania, sposób dekodowania oraz powiązane programy |
EP2980792A1 (en) | 2014-07-28 | 2016-02-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an enhanced signal using independent noise-filling |
WO2016064730A1 (en) | 2014-10-20 | 2016-04-28 | Audimax, Llc | Systems, methods, and devices for intelligent speech recognition and processing |
TWI758146B (zh) | 2015-03-13 | 2022-03-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
EP3182411A1 (en) | 2015-12-14 | 2017-06-21 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for processing an encoded audio signal |
MX371223B (es) * | 2016-02-17 | 2020-01-09 | Fraunhofer Ges Forschung | Post-procesador, pre-procesador, codificador de audio, decodificador de audio y metodos relacionados para mejorar el procesamiento de transitorios. |
DE102016104665A1 (de) * | 2016-03-14 | 2017-09-14 | Ask Industries Gmbh | Verfahren und Vorrichtung zur Aufbereitung eines verlustbehaftet komprimierten Audiosignals |
US9666191B1 (en) * | 2016-03-17 | 2017-05-30 | Vocalzoom Systems Ltd. | Laser-based system and optical microphone having increased bandwidth |
JP6763194B2 (ja) * | 2016-05-10 | 2020-09-30 | 株式会社Jvcケンウッド | 符号化装置、復号装置、通信システム |
EP3288031A1 (en) * | 2016-08-23 | 2018-02-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using a compensation value |
JP6769299B2 (ja) * | 2016-12-27 | 2020-10-14 | 富士通株式会社 | オーディオ符号化装置およびオーディオ符号化方法 |
TW202341126A (zh) | 2017-03-23 | 2023-10-16 | 瑞典商都比國際公司 | 用於音訊信號之高頻重建的諧波轉置器的回溯相容整合 |
KR20180002888U (ko) | 2017-03-29 | 2018-10-10 | 박미숙 | 무좀 예방용 양말 |
US20190051286A1 (en) * | 2017-08-14 | 2019-02-14 | Microsoft Technology Licensing, Llc | Normalization of high band signals in network telephony communications |
EP3729427A1 (en) * | 2017-12-19 | 2020-10-28 | Dolby International AB | Methods and apparatus for unified speech and audio decoding qmf based harmonic transposer improvements |
EP3662469A4 (en) | 2018-04-25 | 2020-08-19 | Dolby International AB | INTEGRATION OF HIGH FREQUENCY RECONSTRUCTION TECHNIQUES WITH REDUCED POST-PROCESSING DELAY |
KR20210005164A (ko) * | 2018-04-25 | 2021-01-13 | 돌비 인터네셔널 에이비 | 고주파 오디오 재구성 기술의 통합 |
CN111766443B (zh) * | 2020-06-02 | 2022-11-01 | 江苏集萃移动通信技术研究所有限公司 | 基于窄带频谱缝合的分布式宽带电磁信号监测方法及系统 |
CN111916090B (zh) * | 2020-08-17 | 2024-03-05 | 北京百瑞互联技术股份有限公司 | 一种lc3编码器近奈奎斯特频率信号检测方法、检测器、存储介质及设备 |
CN117275446B (zh) * | 2023-11-21 | 2024-01-23 | 电子科技大学 | 一种基于声音事件检测的交互式有源噪声控制系统及方法 |
Family Cites Families (213)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US36478A (en) * | 1862-09-16 | Improved can or tank for coal-oil | ||
US3947827A (en) | 1974-05-29 | 1976-03-30 | Whittaker Corporation | Digital storage system for high frequency signals |
US4053711A (en) | 1976-04-26 | 1977-10-11 | Audio Pulse, Inc. | Simulation of reverberation in audio signals |
US4166924A (en) | 1977-05-12 | 1979-09-04 | Bell Telephone Laboratories, Incorporated | Removing reverberative echo components in speech signals |
FR2412987A1 (fr) | 1977-12-23 | 1979-07-20 | Ibm France | Procede de compression de donnees relatives au signal vocal et dispositif mettant en oeuvre ledit procede |
US4330689A (en) | 1980-01-28 | 1982-05-18 | The United States Of America As Represented By The Secretary Of The Navy | Multirate digital voice communication processor |
GB2100430B (en) | 1981-06-15 | 1985-11-27 | Atomic Energy Authority Uk | Improving the spatial resolution of ultrasonic time-of-flight measurement system |
DE3171311D1 (en) | 1981-07-28 | 1985-08-14 | Ibm | Voice coding method and arrangment for carrying out said method |
US4700390A (en) | 1983-03-17 | 1987-10-13 | Kenji Machida | Signal synthesizer |
US4667340A (en) | 1983-04-13 | 1987-05-19 | Texas Instruments Incorporated | Voice messaging system with pitch-congruent baseband coding |
US4672670A (en) | 1983-07-26 | 1987-06-09 | Advanced Micro Devices, Inc. | Apparatus and methods for coding, decoding, analyzing and synthesizing a signal |
US4700362A (en) | 1983-10-07 | 1987-10-13 | Dolby Laboratories Licensing Corporation | A-D encoder and D-A decoder system |
EP0139803B1 (fr) | 1983-10-28 | 1987-10-14 | International Business Machines Corporation | Procédé de reconstitution d'informations perdues dans un système de transmission numérique de la voix et système de transmission utilisant ledit procédé |
US4706287A (en) | 1984-10-17 | 1987-11-10 | Kintek, Inc. | Stereo generator |
US4885790A (en) | 1985-03-18 | 1989-12-05 | Massachusetts Institute Of Technology | Processing of acoustic waveforms |
US4748669A (en) | 1986-03-27 | 1988-05-31 | Hughes Aircraft Company | Stereo enhancement system |
EP0243562B1 (en) | 1986-04-30 | 1992-01-29 | International Business Machines Corporation | Improved voice coding process and device for implementing said process |
JPH0690209B2 (ja) | 1986-06-13 | 1994-11-14 | 株式会社島津製作所 | 反応管の攪拌装置 |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
GB8628046D0 (en) | 1986-11-24 | 1986-12-31 | British Telecomm | Transmission system |
US5054072A (en) | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5285520A (en) | 1988-03-02 | 1994-02-08 | Kokusai Denshin Denwa Kabushiki Kaisha | Predictive coding apparatus |
FR2628918B1 (fr) | 1988-03-15 | 1990-08-10 | France Etat | Dispositif annuleur d'echo a filtrage en sous-bandes de frequence |
US5127054A (en) * | 1988-04-29 | 1992-06-30 | Motorola, Inc. | Speech quality improvement for voice coders and synthesizers |
JPH0212299A (ja) | 1988-06-30 | 1990-01-17 | Toshiba Corp | 音場効果自動制御装置 |
JPH02177782A (ja) | 1988-12-28 | 1990-07-10 | Toshiba Corp | モノラルtv音声復調回路 |
US5297236A (en) | 1989-01-27 | 1994-03-22 | Dolby Laboratories Licensing Corporation | Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder |
DE68916944T2 (de) | 1989-04-11 | 1995-03-16 | Ibm | Verfahren zur schnellen Bestimmung der Grundfrequenz in Sprachcodierern mit langfristiger Prädiktion. |
CA2014935C (en) | 1989-05-04 | 1996-02-06 | James D. Johnston | Perceptually-adapted image coding system |
US5309526A (en) | 1989-05-04 | 1994-05-03 | At&T Bell Laboratories | Image processing system |
US5434948A (en) | 1989-06-15 | 1995-07-18 | British Telecommunications Public Limited Company | Polyphonic coding |
US5261027A (en) | 1989-06-28 | 1993-11-09 | Fujitsu Limited | Code excited linear prediction speech coding system |
US4974187A (en) | 1989-08-02 | 1990-11-27 | Aware, Inc. | Modular digital signal processing system |
US5054075A (en) | 1989-09-05 | 1991-10-01 | Motorola, Inc. | Subband decoding method and apparatus |
US4969040A (en) | 1989-10-26 | 1990-11-06 | Bell Communications Research, Inc. | Apparatus and method for differential sub-band coding of video signals |
JPH03214956A (ja) | 1990-01-19 | 1991-09-20 | Mitsubishi Electric Corp | テレビ会議装置 |
JPH03217782A (ja) | 1990-01-19 | 1991-09-25 | Matsushita Refrig Co Ltd | 冷蔵庫の棚装置 |
JPH0685607B2 (ja) | 1990-03-14 | 1994-10-26 | 関西電力株式会社 | 薬液注入防護工法 |
JP2906646B2 (ja) | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
US5293449A (en) | 1990-11-23 | 1994-03-08 | Comsat Corporation | Analysis-by-synthesis 2,4 kbps linear predictive speech codec |
US5632005A (en) | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
JP3158458B2 (ja) | 1991-01-31 | 2001-04-23 | 日本電気株式会社 | 階層表現された信号の符号化方式 |
GB9104186D0 (en) | 1991-02-28 | 1991-04-17 | British Aerospace | Apparatus for and method of digital signal processing |
US5235420A (en) | 1991-03-22 | 1993-08-10 | Bell Communications Research, Inc. | Multilayer universal video coder |
JP2990829B2 (ja) | 1991-03-29 | 1999-12-13 | ヤマハ株式会社 | 効果付与装置 |
JP3050978B2 (ja) | 1991-12-18 | 2000-06-12 | 沖電気工業株式会社 | 音声符号化方法 |
JPH05191885A (ja) | 1992-01-10 | 1993-07-30 | Clarion Co Ltd | 音響信号イコライザ回路 |
JP3500633B2 (ja) * | 1992-02-07 | 2004-02-23 | セイコーエプソン株式会社 | マイクロエレクトロニクス・デバイスのエミュレーション方法及びエミュレーション装置並びにシミュレーション装置 |
US5559891A (en) | 1992-02-13 | 1996-09-24 | Nokia Technology Gmbh | Device to be used for changing the acoustic properties of a room |
US5765127A (en) | 1992-03-18 | 1998-06-09 | Sony Corp | High efficiency encoding method |
GB9211756D0 (en) | 1992-06-03 | 1992-07-15 | Gerzon Michael A | Stereophonic directional dispersion method |
US5278909A (en) | 1992-06-08 | 1994-01-11 | International Business Machines Corporation | System and method for stereo digital audio compression with co-channel steering |
US5436940A (en) | 1992-06-11 | 1995-07-25 | Massachusetts Institute Of Technology | Quadrature mirror filter banks and method |
IT1257065B (it) | 1992-07-31 | 1996-01-05 | Sip | Codificatore a basso ritardo per segnali audio, utilizzante tecniche di analisi per sintesi. |
JPH0685607A (ja) | 1992-08-31 | 1994-03-25 | Alpine Electron Inc | 高域成分復元装置 |
US5408580A (en) | 1992-09-21 | 1995-04-18 | Aware, Inc. | Audio compression system employing multi-rate signal analysis |
JP2779886B2 (ja) | 1992-10-05 | 1998-07-23 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
FR2696874B1 (fr) | 1992-10-13 | 1994-12-09 | Thomson Csf | Modulateur d'onde électromagnétique à puits quantiques. |
JP3191457B2 (ja) * | 1992-10-31 | 2001-07-23 | ソニー株式会社 | 高能率符号化装置、ノイズスペクトル変更装置及び方法 |
CA2106440C (en) | 1992-11-30 | 1997-11-18 | Jelena Kovacevic | Method and apparatus for reducing correlated errors in subband coding systems with quantizers |
US5455888A (en) | 1992-12-04 | 1995-10-03 | Northern Telecom Limited | Speech bandwidth extension method and apparatus |
JPH06202629A (ja) | 1992-12-28 | 1994-07-22 | Yamaha Corp | 楽音の効果付与装置 |
JPH06215482A (ja) | 1993-01-13 | 1994-08-05 | Hitachi Micom Syst:Kk | オーディオ情報記録媒体、およびこのオーディオ情報記録媒体を用いる音場生成装置 |
JP3496230B2 (ja) | 1993-03-16 | 2004-02-09 | パイオニア株式会社 | 音場制御システム |
US5664059A (en) * | 1993-04-29 | 1997-09-02 | Panasonic Technologies, Inc. | Self-learning speaker adaptation based on spectral variation source decomposition |
JP3685812B2 (ja) | 1993-06-29 | 2005-08-24 | ソニー株式会社 | 音声信号送受信装置 |
US5463424A (en) | 1993-08-03 | 1995-10-31 | Dolby Laboratories Licensing Corporation | Multi-channel transmitter/receiver system providing matrix-decoding compatible signals |
US5581653A (en) | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
DE4331376C1 (de) | 1993-09-15 | 1994-11-10 | Fraunhofer Ges Forschung | Verfahren zum Bestimmen der zu wählenden Codierungsart für die Codierung von wenigstens zwei Signalen |
US5533052A (en) | 1993-10-15 | 1996-07-02 | Comsat Corporation | Adaptive predictive coding with transform domain quantization based on block size adaptation, backward adaptive power gain control, split bit-allocation and zero input response compensation |
JPH08506465A (ja) | 1993-11-26 | 1996-07-09 | フィリップス エレクトロニクス ネムローゼ フェン ノートシャップ | 伝送システム、該システム用の送信機及び受信機 |
JPH07160299A (ja) | 1993-12-06 | 1995-06-23 | Hitachi Denshi Ltd | 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式 |
JP3404837B2 (ja) | 1993-12-07 | 2003-05-12 | ソニー株式会社 | 多層符号化装置 |
JP2616549B2 (ja) | 1993-12-10 | 1997-06-04 | 日本電気株式会社 | 音声復号装置 |
KR960012475B1 (ko) | 1994-01-18 | 1996-09-20 | 대우전자 주식회사 | 디지탈 오디오 부호화장치의 채널별 비트 할당 장치 |
DE4409368A1 (de) | 1994-03-18 | 1995-09-21 | Fraunhofer Ges Forschung | Verfahren zum Codieren mehrerer Audiosignale |
KR960003455A (ko) | 1994-06-02 | 1996-01-26 | 윤종용 | 입체영상용 액정 셔터 안경 |
US5787387A (en) | 1994-07-11 | 1998-07-28 | Voxware, Inc. | Harmonic adaptive speech coding method and system |
KR100372905B1 (ko) | 1994-09-13 | 2003-05-01 | 애질런트 테크놀로지스, 인크. | 산화물영역보호장치 |
US6141446A (en) * | 1994-09-21 | 2000-10-31 | Ricoh Company, Ltd. | Compression and decompression system with reversible wavelets and lossy reconstruction |
JP3483958B2 (ja) | 1994-10-28 | 2004-01-06 | 三菱電機株式会社 | 広帯域音声復元装置及び広帯域音声復元方法及び音声伝送システム及び音声伝送方法 |
US5839102A (en) | 1994-11-30 | 1998-11-17 | Lucent Technologies Inc. | Speech coding parameter sequence reconstruction by sequence classification and interpolation |
JPH08162964A (ja) | 1994-12-08 | 1996-06-21 | Sony Corp | 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体 |
FR2729024A1 (fr) | 1994-12-30 | 1996-07-05 | Matra Communication | Annuleur d'echo acoustique avec filtrage en sous-bandes |
US5701390A (en) | 1995-02-22 | 1997-12-23 | Digital Voice Systems, Inc. | Synthesis of MBE-based coded speech using regenerated phase information |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
JP3139602B2 (ja) * | 1995-03-24 | 2001-03-05 | 日本電信電話株式会社 | 音響信号符号化方法及び復号化方法 |
JP3416331B2 (ja) | 1995-04-28 | 2003-06-16 | 松下電器産業株式会社 | 音声復号化装置 |
US5915235A (en) | 1995-04-28 | 1999-06-22 | Dejaco; Andrew P. | Adaptive equalizer preprocessor for mobile telephone speech coder to modify nonideal frequency response of acoustic transducer |
US5692050A (en) | 1995-06-15 | 1997-11-25 | Binaura Corporation | Method and apparatus for spatially enhancing stereo and monophonic signals |
DE19526366A1 (de) * | 1995-07-20 | 1997-01-23 | Bosch Gmbh Robert | Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen |
JPH0946233A (ja) | 1995-07-31 | 1997-02-14 | Kokusai Electric Co Ltd | 音声符号化方法とその装置、音声復号方法とその装置 |
JPH0955778A (ja) | 1995-08-15 | 1997-02-25 | Fujitsu Ltd | 音声信号の広帯域化装置 |
US5774837A (en) | 1995-09-13 | 1998-06-30 | Voxware, Inc. | Speech coding system and method using voicing probability determination |
JP3301473B2 (ja) | 1995-09-27 | 2002-07-15 | 日本電信電話株式会社 | 広帯域音声信号復元方法 |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
US5687191A (en) | 1995-12-06 | 1997-11-11 | Solana Technology Development Corporation | Post-compression hidden data transport |
US5732189A (en) | 1995-12-22 | 1998-03-24 | Lucent Technologies Inc. | Audio signal coding with a signal adaptive filterbank |
TW307960B (en) | 1996-02-15 | 1997-06-11 | Philips Electronics Nv | Reduced complexity signal transmission system |
JP3519859B2 (ja) | 1996-03-26 | 2004-04-19 | 三菱電機株式会社 | 符号器及び復号器 |
EP0798866A2 (en) * | 1996-03-27 | 1997-10-01 | Kabushiki Kaisha Toshiba | Digital data processing system |
JP3529542B2 (ja) | 1996-04-08 | 2004-05-24 | 株式会社東芝 | 信号の伝送/記録/受信/再生方法と装置及び記録媒体 |
US5848164A (en) | 1996-04-30 | 1998-12-08 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for effects processing on audio subband data |
DE19628292B4 (de) | 1996-07-12 | 2007-08-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten |
DE19628293C1 (de) | 1996-07-12 | 1997-12-11 | Fraunhofer Ges Forschung | Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion |
US5951235A (en) * | 1996-08-08 | 1999-09-14 | Jerr-Dan Corporation | Advanced rollback wheel-lift |
CA2184541A1 (en) | 1996-08-30 | 1998-03-01 | Tet Hin Yeap | Method and apparatus for wavelet modulation of signals for transmission and/or storage |
GB2317537B (en) | 1996-09-19 | 2000-05-17 | Matra Marconi Space | Digital signal processing apparatus for frequency demultiplexing or multiplexing |
JP3707153B2 (ja) * | 1996-09-24 | 2005-10-19 | ソニー株式会社 | ベクトル量子化方法、音声符号化方法及び装置 |
JPH10124088A (ja) * | 1996-10-24 | 1998-05-15 | Sony Corp | 音声帯域幅拡張装置及び方法 |
US5875122A (en) | 1996-12-17 | 1999-02-23 | Intel Corporation | Integrated systolic architecture for decomposition and reconstruction of signals using wavelet transforms |
US5886276A (en) | 1997-01-16 | 1999-03-23 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for multiresolution scalable audio signal encoding |
US6345246B1 (en) | 1997-02-05 | 2002-02-05 | Nippon Telegraph And Telephone Corporation | Apparatus and method for efficiently coding plural channels of an acoustic signal at low bit rates |
JP4326031B2 (ja) | 1997-02-06 | 2009-09-02 | ソニー株式会社 | 帯域合成フィルタバンク及びフィルタリング方法並びに復号化装置 |
US5862228A (en) | 1997-02-21 | 1999-01-19 | Dolby Laboratories Licensing Corporation | Audio matrix encoding |
US6236731B1 (en) | 1997-04-16 | 2001-05-22 | Dspfactory Ltd. | Filterbank structure and method for filtering and separating an information signal into different bands, particularly for audio signal in hearing aids |
IL120788A (en) * | 1997-05-06 | 2000-07-16 | Audiocodes Ltd | Systems and methods for encoding and decoding speech for lossy transmission networks |
US6370504B1 (en) | 1997-05-29 | 2002-04-09 | University Of Washington | Speech recognition on MPEG/Audio encoded files |
SE512719C2 (sv) | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
KR20000068538A (ko) | 1997-07-11 | 2000-11-25 | 이데이 노부유끼 | 정보 복호 방법 및 장치, 정보 부호화 방법 및 장치, 및 제공매체 |
DE19730129C2 (de) * | 1997-07-14 | 2002-03-07 | Fraunhofer Ges Forschung | Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals |
US5890125A (en) | 1997-07-16 | 1999-03-30 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US6144937A (en) | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
US6124895A (en) | 1997-10-17 | 2000-09-26 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment |
KR100335609B1 (ko) * | 1997-11-20 | 2002-10-04 | 삼성전자 주식회사 | 비트율조절이가능한오디오부호화/복호화방법및장치 |
KR100335611B1 (ko) | 1997-11-20 | 2002-10-09 | 삼성전자 주식회사 | 비트율 조절이 가능한 스테레오 오디오 부호화/복호화 방법 및 장치 |
US20010040930A1 (en) | 1997-12-19 | 2001-11-15 | Duane L. Abbey | Multi-band direct sampling receiver |
KR100304092B1 (ko) | 1998-03-11 | 2001-09-26 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치 |
JPH11262100A (ja) | 1998-03-13 | 1999-09-24 | Matsushita Electric Ind Co Ltd | オーディオ信号の符号化/復号方法および装置 |
US6351730B2 (en) | 1998-03-30 | 2002-02-26 | Lucent Technologies Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
KR100474826B1 (ko) | 1998-05-09 | 2005-05-16 | 삼성전자주식회사 | 음성부호화기에서의주파수이동법을이용한다중밴드의유성화도결정방법및그장치 |
US6782132B1 (en) * | 1998-08-12 | 2004-08-24 | Pixonics, Inc. | Video coding and reconstruction apparatus and methods |
JP3354880B2 (ja) | 1998-09-04 | 2002-12-09 | 日本電信電話株式会社 | 情報多重化方法、情報抽出方法および装置 |
JP3352406B2 (ja) * | 1998-09-17 | 2002-12-03 | 松下電器産業株式会社 | オーディオ信号の符号化及び復号方法及び装置 |
US7272556B1 (en) * | 1998-09-23 | 2007-09-18 | Lucent Technologies Inc. | Scalable and embedded codec for speech and audio signals |
JP2000099061A (ja) | 1998-09-25 | 2000-04-07 | Sony Corp | 効果音付加装置 |
JP4193243B2 (ja) * | 1998-10-07 | 2008-12-10 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体 |
US6353808B1 (en) * | 1998-10-22 | 2002-03-05 | Sony Corporation | Apparatus and method for encoding a signal as well as apparatus and method for decoding a signal |
CA2252170A1 (en) * | 1998-10-27 | 2000-04-27 | Bruno Bessette | A method and device for high quality coding of wideband speech and audio signals |
GB2344036B (en) | 1998-11-23 | 2004-01-21 | Mitel Corp | Single-sided subband filters |
US6507658B1 (en) | 1999-01-27 | 2003-01-14 | Kind Of Loud Technologies, Llc | Surround sound panner |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
SE9903552D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Efficient spectral envelope coding using dynamic scalefactor grouping and time/frequency switching |
US6496795B1 (en) | 1999-05-05 | 2002-12-17 | Microsoft Corporation | Modulated complex lapped transform for integrated signal enhancement and coding |
JP2000267699A (ja) | 1999-03-19 | 2000-09-29 | Nippon Telegr & Teleph Corp <Ntt> | 音響信号符号化方法および装置、そのプログラム記録媒体、および音響信号復号装置 |
US6363338B1 (en) | 1999-04-12 | 2002-03-26 | Dolby Laboratories Licensing Corporation | Quantization in perceptual audio coders with compensation for synthesis filter noise spreading |
US6937665B1 (en) | 1999-04-19 | 2005-08-30 | Interuniversitaire Micron Elektronica Centrum | Method and apparatus for multi-user transmission |
US6539357B1 (en) | 1999-04-29 | 2003-03-25 | Agere Systems Inc. | Technique for parametric coding of a signal containing information |
US6298322B1 (en) * | 1999-05-06 | 2001-10-02 | Eric Lindemann | Encoding and synthesis of tonal audio signals using dominant sinusoids and a vector-quantized residual tonal signal |
US6426977B1 (en) | 1999-06-04 | 2002-07-30 | Atlantic Aerospace Electronics Corporation | System and method for applying and removing Gaussian covering functions |
US6226616B1 (en) | 1999-06-21 | 2001-05-01 | Digital Theater Systems, Inc. | Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility |
WO2001008306A1 (en) | 1999-07-27 | 2001-02-01 | Koninklijke Philips Electronics N.V. | Filtering device |
JP4639441B2 (ja) | 1999-09-01 | 2011-02-23 | ソニー株式会社 | ディジタル信号処理装置および処理方法、並びにディジタル信号記録装置および記録方法 |
DE19947098A1 (de) | 1999-09-30 | 2000-11-09 | Siemens Ag | Verfahren zur Ermittlung der Kurbelwellenstellung |
US6978236B1 (en) * | 1999-10-01 | 2005-12-20 | Coding Technologies Ab | Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching |
DE19947877C2 (de) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
KR100675309B1 (ko) * | 1999-11-16 | 2007-01-29 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 광대역 오디오 송신 시스템, 송신기, 수신기, 코딩 디바이스, 디코딩 디바이스와, 송신 시스템에서 사용하기 위한 코딩 방법 및 디코딩 방법 |
CA2290037A1 (en) * | 1999-11-18 | 2001-05-18 | Voiceage Corporation | Gain-smoothing amplifier device and method in codecs for wideband speech and audio signals |
US6947509B1 (en) | 1999-11-30 | 2005-09-20 | Verance Corporation | Oversampled filter bank for subband processing |
JP2001184090A (ja) | 1999-12-27 | 2001-07-06 | Fuji Techno Enterprise:Kk | 信号符号化装置,及び信号復号化装置,並びに信号符号化プログラムを記録したコンピュータ読み取り可能な記録媒体,及び信号復号化プログラムを記録したコンピュータ読み取り可能な記録媒体 |
EP1114814A3 (en) * | 1999-12-29 | 2003-01-22 | Haldor Topsoe A/S | Method for the reduction of iodine compounds from a process stream |
KR100359821B1 (ko) * | 2000-01-20 | 2002-11-07 | 엘지전자 주식회사 | 움직임 보상 적응형 영상 압축과 복원방법 및 그 장치와디코더 |
US6732070B1 (en) | 2000-02-16 | 2004-05-04 | Nokia Mobile Phones, Ltd. | Wideband speech codec using a higher sampling rate in analysis and synthesis filtering than in excitation searching |
EP1139336A3 (en) * | 2000-03-30 | 2004-01-02 | Matsushita Electric Industrial Co., Ltd. | Determination of quantizaion coefficients for a subband audio encoder |
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
SE0001926D0 (sv) * | 2000-05-23 | 2000-05-23 | Lars Liljeryd | Improved spectral translation/folding in the subband domain |
US6718300B1 (en) | 2000-06-02 | 2004-04-06 | Agere Systems Inc. | Method and apparatus for reducing aliasing in cascaded filter banks |
US6879652B1 (en) | 2000-07-14 | 2005-04-12 | Nielsen Media Research, Inc. | Method for encoding an input signal |
WO2002007481A2 (en) | 2000-07-19 | 2002-01-24 | Koninklijke Philips Electronics N.V. | Multi-channel stereo converter for deriving a stereo surround and/or audio centre signal |
US20020040299A1 (en) * | 2000-07-31 | 2002-04-04 | Kenichi Makino | Apparatus and method for performing orthogonal transform, apparatus and method for performing inverse orthogonal transform, apparatus and method for performing transform encoding, and apparatus and method for encoding data |
WO2002013572A2 (en) | 2000-08-07 | 2002-02-14 | Audia Technology, Inc. | Method and apparatus for filtering and compressing sound signals |
US6674876B1 (en) * | 2000-09-14 | 2004-01-06 | Digimarc Corporation | Watermarking in the time-frequency domain |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
SE0004187D0 (sv) * | 2000-11-15 | 2000-11-15 | Coding Technologies Sweden Ab | Enhancing the performance of coding systems that use high frequency reconstruction methods |
EP1211636A1 (en) | 2000-11-29 | 2002-06-05 | STMicroelectronics S.r.l. | Filtering device and method for reducing noise in electrical signals, in particular acoustic signals and images |
JP4649735B2 (ja) | 2000-12-14 | 2011-03-16 | ソニー株式会社 | 符号化装置および方法、並びに記録媒体 |
US7930170B2 (en) | 2001-01-11 | 2011-04-19 | Sasken Communication Technologies Limited | Computationally efficient audio coder |
US6931373B1 (en) | 2001-02-13 | 2005-08-16 | Hughes Electronics Corporation | Prototype waveform phase modeling for a frequency domain interpolative speech codec system |
SE0101175D0 (sv) | 2001-04-02 | 2001-04-02 | Coding Technologies Sweden Ab | Aliasing reduction using complex-exponential-modulated filterbanks |
US6722114B1 (en) * | 2001-05-01 | 2004-04-20 | James Terry Poole | Safe lawn mower blade alternative system |
US7356464B2 (en) | 2001-05-11 | 2008-04-08 | Koninklijke Philips Electronics, N.V. | Method and device for estimating signal power in compressed audio using scale factors |
US6473013B1 (en) | 2001-06-20 | 2002-10-29 | Scott R. Velazquez | Parallel processing analog and digital converter |
US6879955B2 (en) * | 2001-06-29 | 2005-04-12 | Microsoft Corporation | Signal modification based on continuous time warping for low bit rate CELP coding |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
CA2354808A1 (en) | 2001-08-07 | 2003-02-07 | King Tam | Sub-band adaptive signal processing in an oversampled filterbank |
CA2354755A1 (en) | 2001-08-07 | 2003-02-07 | Dspfactory Ltd. | Sound intelligibilty enhancement using a psychoacoustic model and an oversampled filterbank |
CA2354858A1 (en) | 2001-08-08 | 2003-02-08 | Dspfactory Ltd. | Subband directional audio signal processing using an oversampled filterbank |
EP1292036B1 (en) * | 2001-08-23 | 2012-08-01 | Nippon Telegraph And Telephone Corporation | Digital signal decoding methods and apparatuses |
US7362818B1 (en) | 2001-08-30 | 2008-04-22 | Nortel Networks Limited | Amplitude and phase comparator for microwave power amplifier |
US6988066B2 (en) | 2001-10-04 | 2006-01-17 | At&T Corp. | Method of bandwidth extension for narrow-band speech |
US6895375B2 (en) | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
EP1440432B1 (en) | 2001-11-02 | 2005-05-04 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device |
DE60202881T2 (de) | 2001-11-29 | 2006-01-19 | Coding Technologies Ab | Wiederherstellung von hochfrequenzkomponenten |
US7095907B1 (en) | 2002-01-10 | 2006-08-22 | Ricoh Co., Ltd. | Content and display device dependent creation of smaller representation of images |
US6771177B2 (en) | 2002-01-14 | 2004-08-03 | David Gene Alderman | Warning device for food storage appliances |
US20100042406A1 (en) | 2002-03-04 | 2010-02-18 | James David Johnston | Audio signal processing using improved perceptual model |
US20030215013A1 (en) * | 2002-04-10 | 2003-11-20 | Budnikov Dmitry N. | Audio encoder with adaptive short window grouping |
US6904146B2 (en) | 2002-05-03 | 2005-06-07 | Acoustic Technology, Inc. | Full duplex echo cancelling circuit |
CN1328707C (zh) | 2002-07-19 | 2007-07-25 | 日本电气株式会社 | 音频解码设备以及解码方法 |
EP1527442B1 (en) | 2002-08-01 | 2006-04-05 | Matsushita Electric Industrial Co., Ltd. | Audio decoding apparatus and audio decoding method based on spectral band replication |
JP3861770B2 (ja) * | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US6792057B2 (en) | 2002-08-29 | 2004-09-14 | Bae Systems Information And Electronic Systems Integration Inc | Partial band reconstruction of frequency channelized filters |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
KR100728428B1 (ko) * | 2002-09-19 | 2007-06-13 | 마츠시타 덴끼 산교 가부시키가이샤 | 오디오 디코딩 장치 및 오디오 디코딩 방법 |
US7191136B2 (en) * | 2002-10-01 | 2007-03-13 | Ibiquity Digital Corporation | Efficient coding of high frequency signal information in a signal using a linear/non-linear prediction model based on a low pass baseband |
US7191235B1 (en) * | 2002-11-26 | 2007-03-13 | Cisco Technology, Inc. | System and method for communicating data in a loadbalancing environment |
US20040252772A1 (en) | 2002-12-31 | 2004-12-16 | Markku Renfors | Filter bank based signal processing |
US20040162866A1 (en) | 2003-02-19 | 2004-08-19 | Malvar Henrique S. | System and method for producing fast modulated complex lapped transforms |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
US7318035B2 (en) | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
US7447317B2 (en) * | 2003-10-02 | 2008-11-04 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V | Compatible multi-channel coding/decoding by weighting the downmix channel |
US6982377B2 (en) | 2003-12-18 | 2006-01-03 | Texas Instruments Incorporated | Time-scale modification of music signals based on polyphase filterbanks and constrained time-domain processing |
JP5754899B2 (ja) * | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
-
2002
- 2002-11-28 DE DE60202881T patent/DE60202881T2/de not_active Expired - Lifetime
- 2002-11-28 US US10/497,450 patent/US7469206B2/en active Active
- 2002-11-28 PT PT02787866T patent/PT1423847E/pt unknown
- 2002-11-28 WO PCT/EP2002/013462 patent/WO2003046891A1/en active Application Filing
- 2002-11-28 CN CNB028208404A patent/CN1279512C/zh not_active Expired - Lifetime
- 2002-11-28 AU AU2002352182A patent/AU2002352182A1/en not_active Abandoned
- 2002-11-28 AT AT02787866T patent/ATE288617T1/de active
- 2002-11-28 EP EP02787866A patent/EP1423847B1/en not_active Expired - Lifetime
- 2002-11-28 KR KR1020047007036A patent/KR100648760B1/ko active IP Right Grant
- 2002-11-28 JP JP2003548234A patent/JP3870193B2/ja not_active Expired - Lifetime
- 2002-11-28 ES ES02787866T patent/ES2237706T3/es not_active Expired - Lifetime
-
2004
- 2004-07-16 HK HK04105234A patent/HK1062350A1/xx not_active IP Right Cessation
-
2008
- 2008-11-19 US US12/273,782 patent/US8112284B2/en not_active Expired - Fee Related
-
2009
- 2009-06-29 US US12/494,085 patent/US8019612B2/en not_active Expired - Fee Related
-
2011
- 2011-08-09 US US13/206,440 patent/US8447621B2/en not_active Expired - Lifetime
-
2013
- 2013-04-18 US US13/865,450 patent/US9431020B2/en not_active Expired - Lifetime
-
2016
- 2016-04-20 US US15/133,410 patent/US9818417B2/en not_active Expired - Lifetime
- 2016-08-18 US US15/240,727 patent/US10403295B2/en not_active Expired - Fee Related
-
2017
- 2017-03-08 US US15/452,936 patent/US9792923B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,954 patent/US9761237B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,918 patent/US9779746B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,948 patent/US9761236B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,909 patent/US9812142B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,897 patent/US9818418B2/en not_active Expired - Lifetime
- 2017-03-08 US US15/452,890 patent/US9761234B2/en not_active Expired - Lifetime
-
2019
- 2019-08-29 US US16/556,016 patent/US11238876B2/en not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2237706T3 (es) | Reconstruccion de componentes de alta frecuencia. | |
ES2226779T3 (es) | Mejora del rendimiento perceptivo de los metodos de codificacion sbr y hfr relacionados mediante una adicion de ruido de fondo adaptativo y una limitacion de la sustitucion de ruido. | |
ES2625895T3 (es) | Método y dispositivo para la ocultación eficiente del borrado de tramas en códecs de voz basados en la predicción lineal | |
RU2449387C2 (ru) | Способ и устройство для обработки сигнала | |
PL208846B1 (pl) | Sposób przetwarzania sygnału akustycznego w urządzeniu elektronicznym i sposób generowania odtworzonego sygnału akustycznego w urządzeniu elektronicznym | |
KR20080103088A (ko) | 디코더 및 대응 디바이스에서 디지털 신호의 반향들의 안전한 구별과 감쇠를 위한 방법 | |
JP4622164B2 (ja) | 音響信号符号化方法及び装置 | |
US20100121632A1 (en) | Stereo audio encoding device, stereo audio decoding device, and their method | |
JP2000114975A (ja) | 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体 |