ES2259158T3 - Metodo y aparato decodificador audio. - Google Patents
Metodo y aparato decodificador audio.Info
- Publication number
- ES2259158T3 ES2259158T3 ES03797574T ES03797574T ES2259158T3 ES 2259158 T3 ES2259158 T3 ES 2259158T3 ES 03797574 T ES03797574 T ES 03797574T ES 03797574 T ES03797574 T ES 03797574T ES 2259158 T3 ES2259158 T3 ES 2259158T3
- Authority
- ES
- Spain
- Prior art keywords
- band
- signal
- sub
- overlap
- gain
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 72
- 238000001514 detection method Methods 0.000 claims description 60
- 238000009826 distribution Methods 0.000 claims description 41
- 230000015572 biosynthetic process Effects 0.000 claims description 30
- 238000003786 synthesis reaction Methods 0.000 claims description 30
- 238000004458 analytical method Methods 0.000 claims description 19
- 230000001105 regulatory effect Effects 0.000 claims description 17
- 230000005236 sound signal Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 10
- 238000001914 filtration Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000002194 synthesizing effect Effects 0.000 claims 1
- 230000015556 catabolic process Effects 0.000 abstract description 19
- 238000006731 degradation reaction Methods 0.000 abstract description 19
- 230000002829 reductive effect Effects 0.000 abstract description 2
- 230000008569 process Effects 0.000 description 23
- 230000000694 effects Effects 0.000 description 16
- 238000010586 diagram Methods 0.000 description 9
- 230000006978 adaptation Effects 0.000 description 8
- 230000008859 change Effects 0.000 description 8
- 238000009499 grossing Methods 0.000 description 7
- 230000001174 ascending effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 3
- 230000000670 limiting effect Effects 0.000 description 3
- 230000000873 masking effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000002411 adverse Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Stereo-Broadcasting Methods (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
Abstract
Un aparato decodificador audio para decodificar una señal audio de banda ancha de un tren de bits conteniendo información codificada para una señal audio de banda estrecha, incluyendo dicho aparato: un demultiplexor de tren de bits (101) que puede operar para demultiplexar la información codificada del tren de bits; un decodificador (107) que puede operar para decodificar la señal audio de banda estrecha de la información codificada demultiplexada; un banco de filtros de análisis (103) que puede operar para dividir la señal audio de banda estrecha decodificada en múltiples señales de sub-banda que componen una primera señal de sub-banda; un expansor de banda (104) que puede operar para generar una segunda señal de sub-banda a partir de la primera señal de sub-banda, componiéndose la segunda señal de sub-banda de múltiples señales de sub-banda teniendo cada una una banda de frecuencia más alta que la banda de frecuencia de la primera señal de sub-banda; un supresor de solapamiento (313) quepuede operar para regular una ganancia en base a un grado de solapamiento en las señales de sub-banda de la segunda señal de sub-banda para suprimir los componentes de solapamiento que se producen en las señales de sub-banda de la segunda señal de sub-banda; y un banco de filtros de síntesis de cálculo de valor real (105) que puede operar para sintetizar la primera señal de sub-banda y la segunda señal de sub-banda para obtener la señal audio de banda ancha.
Description
Método y aparato decodificador audio.
La presente invención se refiere a un aparato
decodificador y método de decodificación para un sistema de
expansión de anchura de banda audio para generar una señal audio de
banda ancha a partir de una señal audio de banda estrecha utilizando
una cantidad pequeña de información adicional, y se refiere a
tecnología que permite decodificar una señal audio de alta calidad
con pocos cálculos.
La codificación por división de anchura de banda
es un método común de codificar una señal audio a una baja tasa de
bits logrando al mismo tiempo una señal de reproducción de alta
calidad. Esto se realiza dividiendo una señal audio de entrada en
señales para múltiples bandas de frecuencia
(sub-bandas) usando un filtro de división de banda,
o convirtiendo la señal de entrada a una señal de dominio de
frecuencia usando una transformada Fourier u otro algoritmo de
conversión de tiempo-frecuencia, dividiendo después
la señal en múltiples sub-bandas en el dominio de
frecuencia, y asignando un bit de codificación apropiado a cada una
de las divisiones de anchura de banda. la razón por la que una
señal de reproducción de alta calidad se puede obtener a partir de
datos de baja tasa de bits usando codificación por división de
anchura de banda es que durante el proceso de codificación la señal
se procesa en base a características de detección acústicas
humanas.
La sensibilidad auditiva humana a una frecuencia
de aproximadamente 10 kHz o mayor disminuye en general, y los bajos
niveles de sonido son difíciles de oír. Además, el fenómeno llamado
"enmascaramiento de frecuencia" es conocido. Debido al
enmascarado de frecuencia, cuando hay un sonido de nivel alto en una
banda de frecuencia particular, los sonidos de nivel bajo en bandas
de frecuencia contiguas difícilmente son audibles. Asignar bits y
señales de codificación que son difíciles de detectar debido a tales
características auditivas no tiene sustancialmente ningún efecto en
la calidad de la señal de reproducción, y por lo tanto codificar
dichas señales carece de sentido. A la inversa, tomando los bits de
código asignados a esta banda sin sentido desde el punto de vista
audible y reasignando los bits a sub-bandas
sensibles desde el punto de vista audible, se puede codificar con
gran detalle señales sensibles desde el punto de vista audible,
mejorando por lo tanto efectivamente la calidad de la señal de
reproducción.
Un ejemplo de dicha codificación usando división
de banda es MPEG-4 AAC (ISO/IEC
14496-3) por estándar internacional, que permite
codificación de alta calidad de una señal estéreo de banda ancha de
16 kHz o más a una tasa de bits de aproximadamente 96 Kbps. Otro
ejemplo se halla en
WO-A-02/41301.
Si la tasa de bits se disminuye, por ejemplo, a
aproximadamente 48 Kbps, solamente una anchura de banda de 10 kHz o
más corta se puede codificar con alta calidad, dando lugar a sonido
silenciado. Un método de compensar la calidad de sonido degradada
que resulta de dicha limitación de anchura de banda se denomina SBR
(replicación de banda espectral) y se describe en la Especificación
del Sistema Radio Digital Mundial (DRM) (ETSI TS 101 980) publicada
por el Instituto Europeo de Normas de Telecomunicaciones (ETSI).
También se describe tecnología similar, por ejemplo, en los
documentos de la convención AES (Audio Engineering Society) 5553,
5559, 5560 (112th Convention, 10-13 Mayo 2002,
Munich, Alemania).
SBR pretende compensar las señales de banda de
alta frecuencia (denominadas componentes de frecuencia alta) que se
pierden por el proceso de codificación audio tal como AAC o un
proceso de limitación de banda equivalente. Las señales en bandas de
frecuencia inferiores a la banda SBR compensada (también llamadas
componentes de baja frecuencia) se deben transmitir por otros
medios. La información para generar un componente de frecuencia
pseudo-alta en base a los componentes de baja
frecuencia transmitidos por otros medios se contiene en los datos
codificados SBR, y la degradación audio debida a limitación de banda
se puede compensar añadiendo este componente de frecuencia
pseudo-alta a los componentes de baja
frecuencia.
La figura 7 es un diagrama esquemático de un
decodificador para expansión de banda SBR según la técnica anterior.
El tren de bits de entrada 106 se separa en información de
componentes de baja frecuencia 107, información de componentes de
alta frecuencia 108, e información añadida 109. La información de
componentes de baja frecuencia 107 es, por ejemplo, información
codificada usando MPEG-4 AAC u otro método de
codificación, y es decodificada para generar una señal de tiempo que
representa el componente de baja frecuencia. Esta señal de tiempo
que representa el componente de baja frecuencia es dividida en
múltiples sub-bandas por el banco de filtros de
análisis 103.
El banco de filtros de análisis 103 es
generalmente un banco de filtros que utiliza coeficientes de valor
complejo, y la señal de sub-banda dividida se
representa como una señal de valor complejo. El expansor de banda
104 compensa el componente de alta frecuencia perdido debido a
limitación de anchura de banda copiando señales de
sub-banda de baja frecuencia que representan
componentes de baja frecuencia a sub-bandas de alta
frecuencia. La información de componentes de alta frecuencia 108
introducida en el expansor de banda 104 contiene información de
ganancia para la sub-banda de alta frecuencia
compensada de manera que se regule la ganancia para cada
sub-banda de alta frecuencia generada.
La señal de sub-banda de alta
frecuencia generada por el expansor de banda 104 es introducida
posteriormente con la señal de sub-banda de baja
frecuencia en el banco de filtros de síntesis 105 para síntesis de
banda, y se genera la señal de salida 110. Dado que las señales de
sub-banda introducidas en el banco de filtros de
síntesis 105 son generalmente señales de valor complejo, se usa un
banco de filtros de coeficiente de valor complejo como el banco de
filtros de síntesis 105.
El decodificador configurado como antes para
expansión de banda requiere muchas operaciones en el proceso de
decodificación, puesto que dos bancos de filtros incluyendo el banco
de filtros de análisis y el banco de filtros de síntesis realizan
cálculos de valor complejo. Por consiguiente, cuando el
decodificador se implementa usando circuitos integrados, existe el
problema de que aumenta el consumo de potencia y disminuye el tiempo
de reproducción que es posible con una capacidad dada de la fuente
de alimentación.
Las señales decodificadas que salen realmente
del banco de filtros de síntesis son señales de valor real, y así el
banco de filtros de síntesis se puede configurar con bancos de
filtros de valor real para reducir el número de operaciones
realizadas para decodificar. Sin embargo, dado que las
características de un banco de filtros de síntesis (un bando de
filtros de síntesis de coeficiente de valor real) que solamente
realiza operaciones de valor real difieren de las de un banco de
filtros de síntesis (un bando de filtros de síntesis de coeficiente
de valor real) que realiza operaciones de valor complejo como en la
técnica anterior, el banco de filtros de síntesis de valor complejo
no puede ser sustituido simplemente por un banco de filtros de
síntesis de valor real.
Las figuras 8A a 8E muestran las características
de un banco de filtros de coeficiente de valor complejo y un banco
de filtros de coeficiente de valor real. Una señal de tono para
cualquier frecuencia dada tiene un solo espectro lineal como se
representa en la figura 8A. Cuando una señal de entrada conteniendo
esta señal de tono 201 es dividida en múltiples
sub-bandas por el banco de filtros de análisis, el
espectro lineal que denota la señal de tono 201 se contiene en una
sola señal de sub-banda particular. Idealmente, las
señales contenidas en la sub-banda m, por ejemplo,
denotan solamente señales en la banda de frecuencias de m\pi/M a
(m+1)\pi/M.
Con un banco de filtros de análisis real, sin
embargo, las señales de sub-bandas adyacentes a una
sub-banda dada se contienen en la
sub-banda dada según la característica de frecuencia
del filtro de división de banda. La figura 8B muestra un ejemplo de
un banco de filtros de coeficiente de valor complejo utilizado como
el banco de filtros de análisis. En este caso la señal de tono 201
aparece como una señal de valor complejo, y se contiene en señal de
sub-banda m 203 representada por la línea continua
en la figura, y en la señal de sub-banda
m-1 204 representada por la línea de trazos.
Obsérvese que la señal de tono contenida en ambas
sub-bandas ocupa la misma posición en el eje de
frecuencia. El proceso de generación de señal de
sub-banda de alta frecuencia copia ambas señales de
sub-banda a una sub-banda de alta
frecuencia y ajusta la ganancia de cada sub-banda,
pero si la ganancia difiere para cada sub-banda, la
señal de tono 201 también tendrá una amplitud diferente en cada
sub-banda.
Este cambio en la amplitud de la señal de tono
permanece como error de señal después de la filtración de síntesis,
pero dado que las señales de tono ocupan la misma posición en el eje
de frecuencia en ambas señales de sub-banda, el
efecto de este error de señal aparece solamente como un cambio de
amplitud en la señal de tono 201 con el método convencional usando
un banco de filtros de coeficiente de valor complejo como el filtro
de síntesis. Por lo tanto, este error tiene poco efecto en la
calidad de señal salida.
Sin embargo, cuando se usa un banco de filtros
de coeficiente de valor real como el filtro de síntesis, la señal de
sub-banda de valor complejo enviada por el banco de
filtros de coeficiente de valor complejo de análisis debe
convertirse primero en una señal de sub-banda de
valor real. Esto se puede hacer, por ejemplo, girando el eje de
valor real y el eje de valor imaginario de la señal de
sub-banda de valor complejo (\pi/4), una operación
que es la misma que derivar una DCT de una DFT. La forma de las
señales contenidas en la sub-banda cambia con este
proceso de conversión a una señal de sub-banda de
valor real.
La figura 8C muestra el cambio en la señal de
sub-banda (m-1) indicada por la
línea de trazos. El espectro de las señales contenidas en la
sub-banda (m-1) es simétrico al eje
del límite de sub-banda 202 como resultado de la
conversión a una señal de sub-banda de valor real.
Por lo tanto, una señal denominada un "componente de imagen" de
la señal de tono 201 contenida en la señal de
sub-banda de valor complejo original aparece en una
posición simétrica al límite de sub-banda 202. Un
componente de imagen similar 205 también aparece para señales en la
sub-banda m, y en la medida en que no hay cambio en
la ganancia de la sub-banda (m-1) y
la sub-banda m, estos componentes de imagen se
cancelan entre sí en el proceso de filtración de síntesis y no
aparecen en la señal de salida.
Sin embargo, como se representa en la figura 8D,
cuando hay una diferencia de ganancia 206 en cada
sub-banda en el proceso de generación de señal de
sub-banda de alta frecuencia, el componente de
imagen 205 no se cancela completamente y aparece como una señal de
error, llamada solapamiento, en la señal de salida. Como se
representa en la figura 8E, este componente de solapamiento 207
aparece donde no debería haber normalmente una señal (es decir, en
una posición simétrica a la señal de tono original a través del
límite de sub-banda 202), y así tiene un gran
efecto en la calidad de sonido de la señal de salida. En particular,
cuando la señal de tono está cerca del límite de
sub-banda donde la atenuación por el filtro de
división de banda es insuficiente, aumenta la amplitud del
componente de solapamiento generado, produciendo así una degradación
significativa en la calidad de sonido de la señal de salida.
La presente invención se dirige por lo tanto a
resolver estos problemas de la técnica anterior, y proporciona
tecnología para reducir el número de operaciones realizadas en el
proceso de decodificación utilizando un banco de filtros de
coeficiente de síntesis de valor real, suprimir el solapamiento, y
mejorar la calidad de sonido de la señal de
salida.
salida.
Un aparato decodificador audio según la
invención es un aparato para decodificar una señal audio de banda
ancha de un tren de bits conteniendo información codificada para una
señal audio de banda estrecha.
Según la invención, se facilita un aparato
decodificador audio como se expone en la reivindicación 1, un método
de decodificación audio como se expone en la reivindicación 15, y un
programa de ordenador como se expone en la reivindicación 29.
En un segundo aspecto de la invención, el
aparato incluye: un demultiplexor de tren de bits que demultiplexa
información codificada del tren de bits, un decodificador que
decodifica una señal audio de banda estrecha de la información
codificada demultiplexada; un banco de filtros de análisis que
divide la señal audio de banda estrecha decodificada en múltiples
primeras señales de sub-banda; un expansor de banda
que genera múltiples segundas señales de sub-banda
de al menos una primera señal de sub-banda, teniendo
cada segunda señal de sub-banda una banda de
frecuencia más alta que la banda de frecuencia de las primeras
señales de sub-banda; un detector de solapamiento
que detecta un grado de aparición de componentes de solapamiento en
las múltiples segundas señales de sub-banda
generadas por el expansor de banda; un supresor de solapamiento que
ajusta una ganancia de la segunda señal de sub-banda
en base al nivel detectado de componentes de solapamiento para
suprimir los componentes de solapamiento; y un banco de filtros de
síntesis de cálculo de valor real que sintetiza la primera señal de
sub-banda y la segunda señal de
sub-banda para obtener una señal audio de banda
ancha.
Así formada, nuestra invención suprime el
solapamiento en la señal de sub-banda de valor real
debido a que se aplica una ganancia diferente a cada
sub-banda de alta frecuencia en el proceso que
genera señales de sub-banda de alta frecuencia a
partir de señales de sub-banda de baja frecuencia, y
así suprime la degradación audio debida a solapamiento.
La figura 1 es un diagrama esquemático de
bloques que representa un ejemplo de un aparato decodificador audio
según la presente invención (primera realización).
La figura 2 es un diagrama esquemático de
bloques que representa un ejemplo de un aparato decodificador audio
según la presente invención (segunda realización).
La figura 3 describe un ejemplo de un método
para detectar solapamiento en un aparato decodificador audio según
la presente invención.
La figura 4A y la figura 4B describen un método
para detectar solapamiento en un aparato decodificador audio según
la presente invención.
La figura 5 es un diagrama esquemático de
bloques que representa un ejemplo de un aparato decodificador audio
según la presente invención (cuarta realización).
La figura 6 es un diagrama esquemático de
bloques que representa un ejemplo de un aparato decodificador audio
según la presente invención (quinta realización).
La figura 7 es un diagrama esquemático de
bloques que representa un aparato decodificador audio según la
técnica anterior.
Y las figuras 8A a 8E son vistas para describir
cómo se producen componentes de solapamiento.
A continuación se describen realizaciones
preferidas de un aparato decodificador audio y método de
decodificación audio según la presente invención con referencia a
las figuras acompañantes.
Realización
1
La figura 1 es un diagrama esquemático de
bloques que representa un aparato decodificador según una primera
realización de la presente invención.
Este aparato decodificador tiene un
demultiplexor de tren de bits 101, decodificador de baja frecuencia
102, banco de filtros de análisis 103, expansor de banda (medios
expansores de banda) 104, banco de filtros de síntesis 105, supresor
de solapamiento 113, y generador de señal adicional 111.
El demultiplexor de tren de bits 101 recibe un
tren de bits de entrada 106 y demultiplexa el tren de bits 106 a
información de componentes de baja frecuencia 107, información de
componentes de alta frecuencia 108, e información de señal adicional
109. La información de componentes de baja frecuencia 107 ha sido
codificada usando el método de codificación MPEG-4
AAC, por ejemplo. El decodificador de baja frecuencia 102 decodifica
información de componentes de baja frecuencia 107 y genera una señal
de tiempo que representa el componente de baja
frecuencia.
frecuencia.
La señal de tiempo resultante que representa el
componente de baja frecuencia se divide después en múltiples
sub-bandas (M) por el banco de filtros de análisis
103, e introduce en el expansor de banda 104. El banco de filtros de
análisis 103 es un banco de filtros de coeficiente de valor
complejo, y las señales de sub-banda producidas por
el banco de filtros de análisis 103 se representan por señales de
valor complejo.
El expansor de banda 104 copia la señal de
sub-banda de baja frecuencia que representa el
componente de baja frecuencia a una sub-banda de
alta frecuencia para compensar los componentes de frecuencia alta
perdidos por limitación de anchura de banda. La información de
componentes de alta frecuencia 108 introducida en el expansor de
banda 104 contiene información de ganancia para la
sub-banda de alta frecuencia a compensar, y la
ganancia se regula para cada sub-banda de alta
frecuencia generada.
El generador de señal adicional 111 genera una
señal adicional de ganancia controlada 112 según la información
añadida 109 y la añade a cada señal de sub-banda de
alta frecuencia. Una señal de tono sinusoidal o señal de ruido se
usa como la señal adicional generada por el generador de señal
adicional 111.
La señal de sub-banda de alta
frecuencia generada por el expansor de banda 104 se introduce con la
señal de sub-banda de baja frecuencia en el banco de
filtros de síntesis 105 para síntesis de banda, dando lugar a una
señal de salida 110. Este banco de filtros de síntesis 105 es un
banco de filtros de coeficiente de valor real. El número de
sub-bandas usado en el banco de filtros de síntesis
105 no tiene que coincidir con el número de
sub-bandas en el banco de filtros de análisis 103.
Por ejemplo, si en la figura 1 N = 2M, la frecuencia de muestreo de
la señal de salida será dos veces la frecuencia de muestreo de la
señal de tiempo introducida en el banco de filtros de
análisis.
análisis.
Dado que solamente se contiene información
relativa a control de ganancia en la información de componentes de
alta frecuencia 108 o información de señal adicional 109, se puede
usar una tasa de bits sumamente baja en comparación con la
información de componentes de baja frecuencia 107 conteniendo
información de espectro. Por lo tanto, esta configuración es
adecuada para codificar una señal de banda ancha a una baja tasa de
bits.
El aparato decodificador representado en la
figura 1 también tiene un supresor de solapamiento 113. El supresor
de solapamiento 113 introduce la información de componentes de alta
frecuencia 108 y ajusta la información de ganancia en los datos de
componente de alta frecuencia para suprimir el solapamiento por el
banco de filtros de coeficiente de síntesis de valor real 105. El
expansor de banda 104 usa la ganancia ajustada para generar las
señales de sub-banda de alta frecuencia.
Las señales de sub-banda
introducidas en el banco de filtros de síntesis 105 en esta
realización deben ser señales de valor real, pero la conversión de
una señal de valor complejo a una señal de valor real se puede hacer
fácilmente por una operación de rotación de fase usando un método
conocido en general en la técnica.
La operación del supresor de solapamiento 113 se
describe con detalle a continuación.
Como se ha descrito anteriormente, cuando se usa
un banco de filtros de coeficiente de valor real como el banco de
filtros de síntesis, una causa de solapamiento es que las señales de
sub-banda adyacentes se regulan con diferentes
niveles de ganancia en el proceso de generación de señal de alta
frecuencia. Si se utiliza la misma ganancia para todas las señales
de sub-banda adyacentes, el componente de
solapamiento puede ser eliminado completamente. En este caso, sin
embargo, la información de ganancia transmitida como el componente
de alta frecuencia no se refleja, la ganancia de componente de alta
frecuencia no coincide, y se degrada la calidad de señal salida. Por
lo tanto, el supresor de solapamiento 113 debe referenciar la
información de ganancia transmitida como la información de
componentes de alta frecuencia para regular la ganancia de manera
que los componentes de solapamiento se reducen a un nivel inaudible,
evitando por ello la degradación audio producida por componentes de
solapamiento y la degradación audio producida por ganancia
desadaptada en los componentes de frecuencia
alta.
alta.
En base al hecho de que los componentes de
solapamiento aumentan cuando aumenta la diferencia de ganancia entre
sub-bandas adyacentes, el supresor de solapamiento
113 en esta realización de la presente invención establece un límite
a la diferencia de ganancia entre sub-bandas
adyacentes para reducir el efecto del componente de solapamiento
resultante.
Por ejemplo, el supresor de solapamiento 113
ajusta g[m] para que todo m cumpla las relaciones
siguientes
g[m]
\leq
a*g[m-1]
g[m]
\leq
a*g[m+1]
donde
g[m-1], g[m], y g[m+1] son la
ganancia para tres sub-bandas consecutivas
m-1, m, m+1, y "a" determina el límite superior
para la relación de ganancia entre sub-bandas
adyacentes y es aproximadamente 2,0. El valor del coeficiente
"a" puede ser el mismo para todas las
sub-bandas m, o se puede usar un "a" diferente
para diferentes sub-bandas m. Por ejemplo, se puede
aplicar un "a" relativamente bajo a sub-bandas
de baja frecuencia donde el efecto de solapamiento audible es
grande, y se puede aplicar un "a" relativamente alto a
sub-bandas de alta frecuencia donde los efectos de
solapamiento son relativamente
débiles.
Este ajuste de ganancia suprime el efecto del
componente de solapamiento y así mejora la calidad de sonido audible
porque limita la diferencia de ganancia entre
sub-bandas adyacentes. Además, la distribución de
ganancia de señales de sub-banda de componente de
alta frecuencia difiere de la distribución de ganancia en base a la
información de ganancia transmitida, pero las
sub-bandas afectadas son solamente las
sub-bandas donde la relación de ganancia a la
sub-banda adyacente es considerablemente alta.
Además, dado que también se mantiene la misma relación de ganancia
de sub-banda en los niveles de ganancia ajustados,
se puede suprimir la degradación de la calidad de sonido debida a
una desadaptación de ganancia en las señales de
sub-banda de alta frecuencia.
Además de limitar la relación de ganancia entre
sub-bandas adyacentes, el ajuste de ganancia podría
ajustar la ganancia usando la ganancia media de múltiples
sub-bandas. El uso de la ganancia media de tres
sub-bandas se describe después a modo de ejemplo. En
este caso la ganancia g'[m] para la sub-banda m
después de ajuste de ganancia se puede obtener para cumplir la
relación siguiente
g'[m] =
(g[m-1] + g[m] +
g[m+1])/3
donde
g[m-1], g[m], y g[m+1] son la
ganancia para tres sub-bandas consecutivas
m-1, m, m+1 recibidas como los componentes de
frecuencia
alta.
Además, dado que la ganancia ajustada
g'[m-1] para la sub-banda
m-1 se puede usar para ajustar secuencialmente el
nivel de ganancia partiendo de la sub-banda de baja
frecuencia, la ganancia g'[m] se puede obtener de la ecuación
siguiente:
g'[m] =
(g'[m-1] + g[m] +
g[m+1])/3
Dado que las variaciones de ganancia entre
sub-bandas se puede suavizar y la diferencia de
ganancia entre sub-bandas adyacentes se puede
reducir regulando la ganancia como se ha descrito anteriormente, los
componentes de solapamiento se pueden suprimir y la calidad de
sonido audible se puede mejorar. Además, este proceso de suavizado
hace la distribución de ganancia de las señales de
sub-banda de alta frecuencia diferente de la
distribución de ganancia en base a la información de ganancia
transmitida, pero la forma de la distribución de ganancia antes del
suavizado se retiene después del suavizado, y también se puede
suprimir la degradación audio debida a desadaptación de ganancia en
las señales de sub-banda de alta frecuencia.
Se deberá observar que se utiliza una simple
media de la ganancia de múltiples sub-bandas en el
proceso de suavizado de ganancia antes descrito, pero se podría usar
una media ponderada por lo que se aplica un coeficiente de peso
predeterminado por vez primera a cada nivel de ganancia antes de
calcular la media.
Para evitar que el nivel de ganancia sea
demasiado alto como resultado del proceso de suavizado aunque el
nivel de ganancia original fuese muy bajo, también es posible,
cuando el nivel de ganancia original es inferior a un valor umbral
predeterminado, no aplicar suavizado y usar el parámetro de ganancia
original no ajustado.
Realización
2
La figura 2 es un dibujo esquemático de un
aparato decodificador según una segunda realización de la presente
invención. Esta realización difiere de la configuración representada
en la figura 1 en la adición de unos medios de detección de
solapamiento (detector de solapamiento) 315 para detectar
sub-bandas donde hay una alta probabilidad de que se
introduzcan componentes de solapamiento. Los datos de detección 316
salidos del detector de solapamiento 315 se introducen en el
supresor de solapamiento 313 que después ajusta la ganancia de los
componentes de frecuencia alta en base a los datos de detección
316.
La operación del aparato decodificador según
esta segunda realización es la misma que la de la primera
realización a excepción de lo referente al detector de solapamiento
315 y el supresor de solapamiento 313. Por lo tanto, solamente la
operación del detector de solapamiento 315 y el supresor de
solapamiento 313 se describe más adelante.
En primer lugar se describe el principio
operativo del detector de solapamiento 315.
El solapamiento no puede ser evitado lógicamente
en la medida en que se utilizan señales de sub-banda
de valor real, pero la cantidad de degradación audio producida por
solapamiento difiere en gran medida según la característica de las
señales contenidas en la señal de sub-banda. Como se
describe con referencia a la figura 8, los componentes de
solapamiento aparecen en una posición diferente de la señal
original, pero si las señales originales en la misma zona son
intensas, el efecto de los componentes de solapamiento se enmascara
y los componentes de solapamiento tienen menos efecto práctico en la
calidad del sonido. A la inversa, si los componentes de solapamiento
aparecen donde no había originalmente una señal, solamente los
componentes de solapamiento serán audibles y su efecto en la calidad
del sonido es grande. Por lo tanto, es posible conocer cuánto es el
efecto de los componentes de solapamiento por la intensidad de la
señal detectora en torno a donde aparecen los componentes de
solapamiento.
solapamiento.
Sin embargo, la distribución de frecuencias de
las señales de sub-banda se debe determinar usando
una transformada Fourier u otro proceso de conversión de frecuencia,
por ejemplo, para detectar la posición de los componentes de
solapamiento a generar y la intensidad de las señales circundantes
originales. El problema es que esta operación no es práctica debido
a los cálculos requeridos. Por lo tanto, nuestra invención usa un
método de detectar el efecto de solapamiento con pocos cálculos
utilizando un parámetro que denota la pendiente de distribución de
frecuencias de la señal de sub-banda. Una premisa de
este método es que se ignorará el efecto de señales (señales de
ruido) con una ancha distribución de frecuencias en una
sub-banda dada, porque aunque se produce
solapamiento, el efecto es pequeño debido al fenómeno de
enmascaramiento descrito anteriormente.
La relación entre la posición de una señal de
tono y cualesquiera componentes de solapamiento resultantes es como
la descrita anteriormente con referencia a la figura 8 para señales
(señales de tono) con una distribución de frecuencias limitada, y el
efecto de solapamiento cuando la señal de tono está cerca del límite
de sub-banda es grande.
La figura 3 muestra la relación entre la
posición de señal de tono y la pendiente de la distribución de
frecuencias de la sub-banda conteniendo la señal de
tono. En la figura 3 la señal de tono 401 y su imagen 402 se
contienen en la señal de sub-banda
m-1 403 y la señal de sub-banda m
404, y la señal de tono 401 y la imagen 402 están situadas
simétricamente en el límite de sub-banda 405.
Cuando la señal de tono 401 está cerca del
límite de sub-banda 405, tanto la señal de tono 401
como su imagen 402 están en el lado de alta frecuencia de la
sub-banda m-1. Por lo tanto, la
pendiente de distribución de frecuencias 406 de la
sub-banda m-1 es positiva. Si la
señal de tono 401 está desviada al lado de alta frecuencia desde el
límite de sub-banda 405, su imagen 402 se mueve en
la dirección contraria (es decir, en la dirección de baja
frecuencia), la pendiente de la distribución de frecuencias de
sub-banda m-1 resulta más gradual y
eventualmente es negativa. La pendiente de la distribución de
frecuencias 407 de sub-banda m cambia igualmente de
negativa a positiva. Esto significa que si la pendiente de la
distribución de frecuencias para sub-banda
m-1 es positiva y la pendiente de la distribución de
frecuencias para sub-banda m es negativa, una señal
de tono y su imagen simétrica están presentes probablemente cerca
del límite de sub-banda 405.
Se puede usar un coeficiente de predicción
lineal (LPC) y un coeficiente de reflexión como parámetros que
pueden ser calculados fácilmente y denotan la pendiente de la
distribución de frecuencias de la señal de
sub-banda. El coeficiente de reflexión de primer
orden obtenido por la ecuación siguiente se usa como este parámetro
a modo de ejemplo.
k1[m] =
\frac{-\sum\limits_{i} \{x(m,i)\cdot x\text{*} (m,i
-1)\}}{\sum\limits_{i} \{x(m,i)\cdot x\text{*}
(m,i)\}}
donde x(m,i) denota la señal
de sub-banda m e i denota la muestra de tiempo, y
x*(m,i) denota el conjugado complejo de x(m,i) y k1[m]
denota el coeficiente de reflexión de primer orden de
sub-banda
m.
Dado que el coeficiente de reflexión primario es
positivo cuando la pendiente de la distribución de frecuencias es
positiva y es negativo cuando la pendiente es negativa, se puede
determinar que la probabilidad de solapamiento que tiene lugar en el
límite entre sub-bandas m-1 y m es
alta si k1[m-1] es positivo y k[m] es
negativo.
Sin embargo, si se usa un QMF común (filtro de
espejo en cuadratura) como el filtro de división de
sub-banda, la distribución de frecuencias se
invierte entre sub-bandas pares y
sub-bandas impares debido a las características del
filtro. Considerando esto, las condiciones para detectar
solapamiento se pueden establecer como sigue.
- Cuando m es par:
- k1[m-1] < 0, y k1[m] < 0
- Cuando m es impar:
- k1[m-1] > 0, y k1[m] > 0
\newpage
Esta condición se denomina a continuación
"condición de detección 1". La condición de detección 1 define
las condiciones usadas para detectar si hay solapamiento entre dos
sub-bandas adyacentes. Cuando se aplique la
condición de detección 1, el solapamiento no será detectado dos
veces para dos sub-bandas consecutivas m y m+1,
porque las condiciones no se puede cumplir simultáneamente para m
par y m impar.
La banda de paso de un QMF se esparce en general
en tres sub-bandas, es decir, la
sub-banda deseada y las sub-bandas a
cada lado. En este caso, si hay una señal de tono cerca del centro
de la sub-banda deseada, o hay una señal de tono en
ambas bandas de frecuencia alta y baja de la
sub-banda deseada, aparecerá un componente de imagen
en las sub-bandas en cada lado de la
sub-banda deseada.
Las figuras 4A y 4B muestran la distribución de
frecuencias cuando hay una señal de tono en las bandas de frecuencia
baja y alta de una sub-banda dada. En la figura 4A
hay señales de tono 501 y 502 en ambas bandas de frecuencia baja y
alta de la sub-banda m-1, y hay
señales de tono 511 y 512 en la figura 4B. Los componentes de imagen
de señales de tono 501 y 511 en la banda de frecuencia baja de la
sub-banda m-1 aparecen como señales
503 y 513, respectivamente, en la sub-banda
m-2. Los componentes de imagen de las señales de
tono 502, 512 en la banda de frecuencia alta de la
sub-banda m-1 aparecen como señales
504 y 514, respectivamente, en la sub-banda m.
Como representan la distribución de frecuencias
506 en la figura 4A y la distribución de frecuencias 516 en la
figura 4B, la pendiente de la distribución de frecuencias de
sub-banda m-1 se determina por la
relación de energía de las señales de tono de frecuencia baja y
alta. Por lo tanto, no es posible detectar solapamiento a través de
tres sub-bandas usando la condición de detección 1,
que se aplica a detectar solapamiento entre dos
sub-bandas usando el signo del coeficiente de
reflexión de la sub-banda m-1. Por
otra parte, en la sub-banda m-2 y
la sub-banda m, el signo de la pendiente de la
distribución de frecuencias se determina estable por los componentes
de imagen, representados por las distribuciones de frecuencia 505 y
507 en la figura 4A y las distribuciones de frecuencia 515 y 517 en
la figura 4B, independientemente de la relación de energía entre las
señales de tono de frecuencia baja y alta en la
sub-banda m-1.
Esto se puede aplicar para establecer
condiciones para detectar solapamiento a través de tres
sub-bandas usando los coeficientes de reflexión de
sub-banda m-2 y
sub-banda m.
- Cuando m es par:
- k1[m-2] > 0 y k1[m] < 0
- Cuando m es impar:
- k1[m-2] < 0 y k1[m] > 0
Esto se denomina a continuación "condición de
detección 2".
Sin embargo, el solapamiento a través de tres
sub-bandas resulta un problema cuando la pendiente
de la distribución de frecuencias en la sub-banda
m-2 y la sub-banda m es alta, y los
errores de detección aumentan cuando solamente se aplica la
condición de detección 2. La pendiente de la distribución de
frecuencias en las sub-bandas m-2 y
m cambia dependiendo de la relación de energía entre las señales de
tono en las bandas de frecuencia baja y alta de la
sub-banda m-1.
Es decir, si la energía de la señal de tono en
la banda de frecuencia baja de la sub-banda
m-1 es baja en comparación con la energía de la
señal de tono en la banda de frecuencia alta (el caso mostrado en la
figura 4A), el valor absoluto del coeficiente de reflexión
k1[m-2] para la sub-banda
m-2 será menor que el valor absoluto de coeficiente
de reflexión k1[m] de la sub-banda m. A la
inversa, cuando la energía de la señal de tono de baja frecuencia en
la sub-banda m-1 es mayor que la
energía de la señal de tono de alta frecuencia (el caso mostrado en
la figura 4B), el valor absoluto del coeficiente de reflexión
k1[m-2] de la sub-banda
m-2 es mayor que el valor absoluto de coeficiente de
reflexión k1[m] de la sub-banda m. Esta
característica se denomina a continuación "característica
1".
Por lo tanto, es deseable considerar
simultáneamente la pendiente de la distribución de frecuencias en la
sub-banda m-2 y la
sub-banda m. Además, usando el hecho de que el valor
absoluto del coeficiente de reflexión es de 0 a 1, las condiciones
para detectar solapamiento a través de tres
sub-bandas preferiblemente cumplen primero la
condición de detección 2 anterior, y también cumplen las condiciones
siguientes.
- Cuando m es par:
- k1[m-2]k1[m] > T
- Cuando m es impar:
- k1[m]-k1[m-2] > T
donde T es un valor umbral
predeterminado, tal como un valor de aproximadamente T = 1,0. Esto
se denomina a continuación "condición de detección 3". La banda
de detección de condición de detección 3 es más estrecha que la de
la condición de detección 2. Obsérvese que a causa de la
condición
-1
<kl[m] <
1
referente al rango del coeficiente
de reflexión, las condiciones no solapan en tres
sub-bandas consecutivas m, m+1, y m+2 cuando se
aplica la condición de detección 2 o la condición de detección 3, y
así el solapamiento no será detectado en tres
sub-bandas consecutivas. Además, el solapamiento no
será detectado en tres sub-bandas consecutivas
aunque la condición de detección 1 se utilice en unión con la
condición de detección 2 o la condición de detección 3. También será
obvio que las condiciones de detección de solapamiento se pueden
establecer para tres sub-bandas consecutivas usando
los coeficientes de reflexión para las sub-bandas
m-2, m-1, y
m.
El número de sub-banda donde las
condiciones de detección son verdaderas es enviado desde el detector
de solapamiento 315 como datos de detección de solapamiento 316. El
supresor de solapamiento 313 ajusta después la ganancia solamente
para la sub-banda indicada por los datos de
detección 316 para limitar el solapamiento. Por ejemplo, si los
datos de detección 316 indican aparición de solapamiento a través de
dos sub-bandas según la condición de detección 1,
la ganancia se puede ajustar adaptando la ganancia en las
sub-bandas m-1 y m, o limitando la
diferencia de ganancia o la relación de ganancia entre las dos
sub-bandas a un valor umbral predeterminado o menos.
Cuando se establece el mismo nivel de ganancia para ambas
sub-bandas, la ganancia se podría establecer al
nivel de ganancia más bajo de las dos sub-bandas, al
nivel de ganancia más alto, o a un nivel medio entre los niveles de
ganancia alto y bajo (tal como la media).
Para evitar errores de detección por el detector
de solapamiento 315, el supresor de solapamiento 313 podría aplicar
una combinación de métodos. Por ejemplo, el supresor de solapamiento
313 podría aplicar adaptación de ganancia a las
sub-bandas donde se detecta solapamiento, y aplicar
limitación de ganancia a las otras sub-bandas para
limitar la diferencia de ganancia o la relación de ganancia a o por
debajo de un valor umbral predeterminado.
Además, cuando los datos de detección 316
indican aparición de solapamiento a través de tres
sub-bandas en base a la condición de detección 2 o
la condición de detección 3, el supresor de solapamiento 313 podría
ajustar la ganancia haciendo coincidir el nivel de ganancia para las
tres sub-bandas. Alternativamente, un método de
adaptación de ganancia de dos sub-bandas como se ha
descrito anteriormente se podría aplicar en orden ascendente de la
sub-banda m-2, es decir, después de
ajustar la ganancia para las sub-bandas
m-2 y m-1, el nivel de ganancia y
la ganancia para sub-banda m pueden ser adaptados.
Esto también se podría aplicar en orden descendente para adaptar la
ganancia entre dos sub-bandas comenzando en la
sub-banda m. También alternativamente, se podría
aplicar adaptación de ganancia de dos sub-bandas en
orden ascendente y orden descendente como se ha indicado
anteriormente, y después se podría determinar y aplicar la media de
ambos niveles de ganancia. Cuando se establezca el mismo nivel de
ganancia para dos sub-bandas, la ganancia se podría
establecer al nivel de ganancia más bajo, al nivel de ganancia más
alto, o a un nivel medio entre los niveles de ganancia alto y bajo
(tal como la media).
Además alternativamente, la diferencia de
ganancia o relación de ganancia entre las dos
sub-bandas se podría establecer a un valor umbral
predeterminado o menos en lugar de poner el mismo nivel de ganancia
para ambas sub-bandas.
También alternativamente, para evitar errores de
detección por el detector de solapamiento 315, el supresor de
solapamiento 313 podría aplicar una combinación de métodos. Por
ejemplo, el supresor de solapamiento 313 podría aplicar adaptación
de ganancia a sub-bandas donde se detecte
solapamiento, y aplicar limitación de ganancia a las otras
sub-bandas para limitar la diferencia de ganancia o
relación de ganancia a o por debajo de un valor umbral
predeterminado.
Con la configuración anterior, se regula la
ganancia solamente para las sub-bandas en las que el
solapamiento afecta a la calidad del sonido, y el nivel de ganancia
indicado en el tren de bits recibido se puede usar para otras
sub-bandas. Por lo tanto, se puede evitar la calidad
de sonido degradada debido a solapamiento, y también se puede evitar
la degradación audio debida a ganancia desadaptada. Por ejemplo,
cuando el supresor de solapamiento 313 usa un método como se ha
descrito anteriormente para adaptación de ganancia, la ganancia se
puede ajustar al nivel de ganancia transmitida en una unidad de al
menos dos sub-bandas si el detector de solapamiento
315 aplica la condición de detección 1, y se puede ajustar al nivel
de ganancia recibido en una unidad de al menos cuatro
sub-bandas si el detector de solapamiento 315 usa la
condición de detección 2 o la condición de detección 3.
Se deberá observar que el parámetro que denota
la pendiente de la distribución de frecuencias de las señales de
sub-banda se podría determinar calculando múltiples
parámetros con relación a la base de tiempo y suavizando después
estos parámetros.
Además, cuando el coeficiente de predicción
lineal o el coeficiente de reflexión utilizado como el parámetro que
denota la pendiente de la distribución de frecuencias de señal de
sub-banda se usa como un parámetro intermedio en
unos medios convencionales de expansión de banda, todos o parte de
estos parámetros se pueden compartir, reduciendo por ello el número
de operaciones necesarias para el procesado.
Realización
3
El detector de solapamiento 315 en la segunda
realización anterior compara un valor umbral predeterminado con los
coeficientes de reflexión de cada sub-banda, y en
base a la relación entre estos valores detecta y envía como un valor
binario si se produce o no solapamiento. Cuando el valor de
evaluación cambia cerca del valor umbral usando un método de
detección de valor binario, el valor de detección de solapamiento
para aparición/no aparición cambia frecuentemente. Esto complica el
seguimiento para regular o no regular la ganancia, y puede afectar
adversamente a la calidad del sonido.
Por lo tanto, el detector de solapamiento 315 en
la presente realización detecta el grado de aparición de
solapamiento. Es decir, en vez de usar un valor binario para indicar
simplemente si se detecta o no solapamiento, la aparición de
solapamiento la indica un valor continuo que denota el grado de
aparición de solapamiento. La ganancia se ajusta después en base a
este valor continuo para lograr una transición suave. Se pueden
suprimir los cambios bruscos en la ganancia producido por el cambio
del ajuste y no ajuste de ganancia, y se puede reducir así la
degradación resultante de la calidad del sonido. Se deberá observar
que la configuración de un aparato decodificador audio según esta
tercera realización es la misma que la de la segunda realización
mostrada en la figura 2.
El valor que denota el grado de aparición de
solapamiento se describe a continuación.
Al detectar solapamiento entre dos
sub-bandas, el grado de solapamiento d[m] en
la sub-banda m se puede calcular a partir de la
relación siguiente.
\vskip1.000000\baselineskip
- i)
- Cuando m es par y k1[m]<q, k1[m-1]<q:
- \quad
- Si \; k1[m] > k1[m-1],
- \quad
- d[m] = (-k1[m]+q)/p
- \quad
- Si \; k1[m] \leq k1[m-1],
- \quad
- d[m] = (-k1[m-1]+q)/p
\vskip1.000000\baselineskip
- ii)
- Cuando m es impar y k1[m]>-q, kl[m-1]>-q:
- \quad
- Si \; k1[m] > k1[m-1],
- \quad
- d[m] = (k1[m-1]+q)/p
- \quad
- Si \; k1[m] \leq k1[m-1],
- \quad
- d[m]=(k1[m]+q)/p
\vskip1.000000\baselineskip
- iii)
- De otro modo: d[m] = 0
donde p y q son valores umbral
predeterminados, y preferiblemente p = q = aproximadamente 0,25. El
límite superior de d[m] también se limita preferiblemente a
1,0.
\vskip1.000000\baselineskip
Las ganancias g[m] y
g[m-1] para la sub-banda m y
la sub-banda m-1 se regulan como
sigue usando el grado de solapamiento d[m].
\vskip1.000000\baselineskip
- Cuando
- g[m] > g[m-1],
- \quad
- g[m]=(1,0-d[m]) \cdot g[m]+d[m] \cdot g[m-1]
- Cuando
- g[m] < g[m-1],
- \quad
- g[m-1]=(1,0-d[m]) \cdot g[m-1] + d[m] \cdot g[m]
\vskip1.000000\baselineskip
Cuando la detección de solapamiento entre tres
sub-bandas que usan la condición de detección 2 o la
condición de detección 3 se combina con la detección de solapamiento
entre dos sub-bandas que usan la condición de
detección 1, el grado de aparición de solapamiento d[m] se
puede calcular usando el método siguiente.
En primer lugar, d[m] se establece a 0,0
para todo m. Después, d[m] y d[m-1] se
determinan para m aplicando el método siguiente en orden
ascendente.
En primer lugar, si la condición de detección 1
es verdadera, d[m] = 1,0. En segundo lugar, el grado de
solapamiento d[m] se establece como sigue solamente si la
condición de detección 2 o la condición de detección 3 es
verda-
dera.
dera.
\newpage
- i)
- Cuando m es par:
- \quad
- Si \; d[m]=0,0,
- \quad
- d[m] = (k1[m-2]-k1[m]-T)/s
- \quad
- Si \; d[m-1]=0,0,
- \quad
- d[m-1] = (k1[m-2]-k1[m]-T)/s
\vskip1.000000\baselineskip
- ii)
- Cuando m es impar:
- \quad
- Si \; d[m]=0,0,
- \quad
- d[m] = (k1[m]-k1[m-2]-T)/s
- \quad
- Si \; d[m-1]=0,0,
- \quad
- d[m-1] = (k1[m]-k1[m-2]-T)/s
donde T y s son valores umbral
predeterminados, y preferiblemente T = 0,8 y s = 0,4
aproximadamente. El límite superior de d[m] también se limita
preferiblemente a
1,0.
El grado de aparición de solapamiento
d[m] también se puede calcular usando el método
siguiente.
En primer lugar, d[m] se establece a 0,0
para todo m. Después, d[m] y d[m-1] se
determinan para m aplicando el método siguiente en orden
ascendente.
En primer lugar, si la condición de detección 1
es verdadera, d[m] = 1,0. En segundo término, los grados de
aparición de solapamiento d[m] y
d[m-1] se establecen como sigue solamente si
la condición de detección 2 o la condición de detección 3 es
verdadera.
\vskip1.000000\baselineskip
- i)
- Cuando m es par:
- \quad
- Si \; d[m]=0,0,
- \quad
- d[m]=(k1[m-2]-k1[m]abs(k1[m-1]))
- \quad
- Si \; d[m-1]=0,0,
- \quad
- d[m-1] = (k1[m-2]-k1[m]-abs(k1[m-1]))
\vskip1.000000\baselineskip
- ii)
- Cuando m es impar:
- \quad
- Si \; d[m]=0,0,
- \quad
- d[m]=(k1[m]-k1[m-2]-abs(k1[m-1]))
- \quad
- Si \; d[m-1]=0,0,
- \quad
- d[m-1]=(k1[m]-k1[m-2]-abs(k1[m-1]))
Obsérvese que abs ( ) denota una función que
proporciona un valor absoluto.
Cuando se aplica, por ejemplo, adaptación de
ganancia entre dos sub-bandas en orden ascendente
como se ha descrito anteriormente para regular la ganancia entre
tres sub-bandas según el grado de aparición de
solapamiento d[m], la ganancia g[m] y
g[m-1] para las sub-bandas m
y m-1 se puede ajustar como sigue.
\vskip1.000000\baselineskip
- Cuando
- g[m] > g[m-1]:
- \quad
- g[m]=(1,0-d[m]) \cdot g[m]+d[m] \cdot g[m-1]
- Cuando
- g[m] < g[m-1]:
- \quad
- g[m-1]=(1,0-d[m]) \cdot g[m-1]+d[m] \cdot g[m]
Regulando la ganancia usando el grado de
aparición de solapamiento d[m] determinado como se ha
descrito anteriormente, se puede suprimir la degradación audio
producida por cambio del proceso de ajuste de ganancia cuando la
ganancia se regula en base a un valor binario que indica simplemente
si se produce o no solapamiento.
Además, en consideración de la característica 1
descrita con referencia a la figura 4A y la figura 4B, para reducir
múltiples distorsiones de solapamiento en sub-bandas
sucesivas, la característica 1 se puede usar para calcular el grado
de aparición de solapamiento d[m] para regular la
ganancia.
Más específicamente, en el caso mostrado en la
figura 4A, la amplitud de la imagen componente en la
sub-banda m es mayor que la amplitud de la imagen
componente de la sub-banda m-2, y
así el grado de aparición de solapamiento es mayor en la
sub-banda m que en la sub-banda
m-2. A la inversa, en el caso mostrado en la figura
4B, el grado de aparición de solapamiento es mayor en la
sub-banda m-2 que en la
sub-banda m. Por lo tanto, es posible reducir la
distorsión de solapamiento según el grado de la distorsión
estableciendo el grado de aparición de solapamiento d[m] con
consideración a esta característica 1. El grado de aparición de
solapamiento d[m] establecido según esta característica se
puede obtener de las ecuaciones siguientes.
d[m]=1-k1[m-1]
\cdot k1[m-1]
o
d[m]=1-abs(k1[m-1])
Se prefiere este método porque el grado de
aparición de solapamiento d[m] pasa a 1 (o máximo) cuando
k1[m-1] =
0. Esto es debido a que cuando la amplitud de los tonos de baja frecuencia y los tonos de alta frecuencia en la sub-banda m-1 en la figura 4A y la figura 4B es la misma, la pendiente de la distribución de frecuencias para la sub-banda m-1 resulta cero, es decir, el coeficiente de reflexión k1[m-1] pasa a 0, los componentes de imagen en la sub-banda m-2 y la sub-banda m están al mismo nivel, y así el grado de aparición de solapamiento debe ser el mismo para
ambos.
0. Esto es debido a que cuando la amplitud de los tonos de baja frecuencia y los tonos de alta frecuencia en la sub-banda m-1 en la figura 4A y la figura 4B es la misma, la pendiente de la distribución de frecuencias para la sub-banda m-1 resulta cero, es decir, el coeficiente de reflexión k1[m-1] pasa a 0, los componentes de imagen en la sub-banda m-2 y la sub-banda m están al mismo nivel, y así el grado de aparición de solapamiento debe ser el mismo para
ambos.
A continuación se describe un ejemplo de un
método para calcular el grado de aparición de solapamiento
d[m] en base a la prioridad determinada por la característica
1. Obsérvese que el método descrito a continuación usa tanto
detección de solapamiento sobre tres sub-bandas en
base a la condición de detección 2 o la condición de detección 3,
como detección de solapamiento entre dos sub-bandas
en base a la condición de detección 1.
El grado de aparición de solapamiento
d[m] se determina primero a partir de la ecuación
siguiente.
\vskip1.000000\baselineskip
- i)
- Cuando m es par:
- \quad
- si k1[m]<0 y k1[m-1]<0,
- \quad
- d[m]=S,
- \quad
- si k1[m]<0 y k1[m-1]<0 y k1[m-2]>0,
- \quad
- d[m-1]=1-k1[m-1] \cdot k1[m-1],
- \quad
- si k1[m]<0 y k1[m-1] \geq 0 y k1[m-2]>0,
- \quad
- d[m]=1-k1[m-1] \cdot k1[m-1]
\vskip1.000000\baselineskip
- ii)
- Cuando m es impar:
- \quad
- Si k1[m]>0 y k1[m-1]>0,
- \quad
- d[m]=S,
- \quad
- Si k1[m]>0 y k1[m-1]>0 y k1[m-2]<0,
- \quad
- d[m-1]=1-k1[m-1] \cdot k1[m-1],
- \quad
- Si k1[m]>0 y k1[m-1] \leq 0 y k1[m-2]<0,
- \quad
- d[m]=1-k1[m-1] \cdot k1[m-1]
\vskip1.000000\baselineskip
- iii)
- De otro modo: d[m]=0
donde S es un valor predeterminado
y preferiblemente S = 1,0 aproximadamente. Obsérvese que el valor S
se puede establecer apropiadamente usando el coeficiente de
reflexión en la sub-banda deseada. Si, por ejemplo,
se aplica adaptación de ganancia entre dos
sub-bandas en orden ascendente como se ha descrito
anteriormente como el método antes descrito para regular la ganancia
entre tres sub-bandas según el grado de aparición de
solapamiento d[m], la ganancia g[m] y
g[m-1] para las sub-bandas m
y m-1 se puede ajustar como
sigue.
- Cuando
- g[m] > g[m-1]:
- \quad
- g[m]=(1,0-d[m])\cdotg[m]+d[m]\cdotg[m-1]
- Cuando
- g[m] < g[m-1]:
- \quad
- g[m-1]=(1,0-d[m])\cdotg[m-1]+d[m]g[m]
Se deberá notar que cualquier característica se
puede usar como el valor d[m] que denota el grado de
aparición de solapamiento a condición de que cambie suavemente la
cantidad máxima de ajuste de ganancia cuando se produzca
solapamiento y la cantidad mínima de ajuste de ganancia cuando no se
produzca solapamiento según el grado de aparición de
solapamiento.
Además, múltiples valores que denotan el grado
de aparición de solapamiento referenciado a la base de tiempo se
pueden calcular y suavizar para uso como grado d[m] de
aparición de solapamiento.
Realización
4
La figura 5 es un diagrama esquemático de
bloques que representa un aparato decodificador según una cuarta
realización de la presente invención. Este aparato decodificador
difiere del aparato decodificador en las realizaciones segunda y
tercera antes descritas en que la información de componentes de alta
frecuencia 108 del demultiplexor de tren de bits 101 se introduce en
el detector de solapamiento además de la señal de
sub-banda de baja frecuencia 617 del banco de
filtros de análisis 103.
Esta configuración permite al detector de
solapamiento 615 detectar solapamiento usando tanto la señal de
sub-banda de baja frecuencia 617 como información de
ganancia contenida en la información de componentes de alta
frecuencia 108.
Como se ha descrito anteriormente, el
solapamiento resulta un problema cuando la diferencia de ganancia
entre sub-bandas adyacentes es grande. Además, si
los niveles de señal originales cerca de donde se produce
solapamiento son bajos, solamente el componente de solapamiento será
audible, dando lugar así a una degradación significativa de la
calidad del sonido.
Por lo tanto, en consideración a este hecho, el
detector de solapamiento 615 de esta realización referencia la
información de ganancia en la información de componentes de alta
frecuencia 108 para detectar sub-bandas donde la
diferencia de ganancia entre sub-bandas adyacentes
es mayor que un nivel predeterminado, después referencia la señal de
sub-banda de baja frecuencia a copiar a la
sub-banda detectada, y evalúa el nivel de cada
sub-banda de baja frecuencia. Si como resultado de
esta evaluación la diferencia de nivel entre una
sub-banda dada y una subbanda adyacente es mayor o
igual a un valor umbral predeterminado, se determina que dicha
sub-banda es una sub-banda donde
probablemente se produce solapamiento. La energía de señal de
sub-banda, amplitud máxima, amplitud total, amplitud
media, u otro valor se podría usar para indicar el nivel de cada
sub-banda.
El detector de solapamiento 615 envía el número
de las sub-bandas que cumplen las condiciones
anteriores como los datos de detección de solapamiento 616. El
supresor de solapamiento 613 ajusta después la ganancia solamente
para las sub-bandas indicadas por los datos de
detección de solapamiento 616 para suprimir el solapamiento.
La ganancia se puede ajustar estableciendo el
mismo nivel de ganancia para las sub-bandas
adyacentes, o limitando la diferencia de ganancia o la relación de
ganancia entre las sub-bandas a un valor umbral
predeterminado o menos. Cuando se establece el mismo nivel de
ganancia para ambas sub-bandas, la ganancia se
podría establecer al nivel de ganancia más bajo de las dos
sub-bandas, al nivel de ganancia más alto, o a un
nivel medio entre los niveles de ganancia alto y bajo (tal como la
media).
Además, se podría usar una combinación de
métodos para evitar errores de detección por el detector de
solapamiento 615. Por ejemplo, se podría aplicar adaptación de
ganancia a sub-bandas donde se detecta solapamiento,
y se podría aplicar limitación de ganancia a las otras
sub-bandas para limitar la diferencia de ganancia o
relación de ganancia a o por debajo de un valor predeterminado.
Esta configuración ajusta así solamente la
ganancia para sub-bandas en las que se espera
solapamiento que afecta a la calidad del sonido, y usa el nivel de
ganancia indicado en el tren de bits recibido para otras
sub-bandas. Por lo tanto, se puede evitar la calidad
de sonido degradada debido a solapamiento, y también se puede evitar
la degradación audio debida a ganancia desadaptada.
Realización
5
Los aparatos decodificadores audio descritos
anteriormente en las realizaciones primera a cuarta suponen que la
información de ganancia para sub-bandas de alta
frecuencia se contiene en los datos de componente de alta
frecuencia, y ajustan directamente solamente dicha información de
ganancia. Sin embargo, se puede transmitir información de ganancia
enviando la información de ganancia real, o enviando la energía de
la señal de sub-banda de alta frecuencia
decodificada. El proceso de decodificación en este caso obtiene
información de ganancia determinando la relación entre energía de
señal después de la decodificación y la energía de señal de la
sub-banda de baja frecuencia a copiar a la
sub-banda de alta frecuencia. Sin embargo, esto
requiere calcular la ganancia de la señal de
sub-banda de alta frecuencia antes del proceso para
eliminar el solapamiento. Por lo tanto, esta realización de la
invención describe un aparato decodificador audio provisto de un
método de transmisión de información de ganancia que transmite el
nivel energético después de la decodificación de
sub-banda de alta frecuencia.
La figura 6 es un diagrama esquemático de
bloques de un aparato decodificador audio según esta realización de
la invención. Como se representa en la figura, este aparato
decodificador audio añade una calculadora de ganancia 718 para
calcular la ganancia para una señal de sub-banda de
alta frecuencia antes del proceso para eliminar solapamiento a la
configuración del aparato decodificador representado en la primera
realización.
La información 108 transmitida para decodificar
el nivel de ganancia de la sub-banda de alta
frecuencia incluye dos valores: la energía R de la
sub-banda de alta frecuencia después de decodificar,
y la relación Q entre la energía R y la energía añadida por la señal
adicional. La calculadora de ganancia 718 es idéntica a una parte de
cálculo de ganancia del expansor de banda 104. Esta calculadora de
ganancia 718 calcula la ganancia g para la sub-banda
de alta frecuencia a partir de estos dos valores, es decir, energía
R y relación Q, y la energía E de la señal de
sub-banda de baja frecuencia 617.
g =
sqrt(R/E/(1+Q))
donde sqrt denota un operador de
raíz
cuadrada.
La información de ganancia 719 así calculada
para cada sub-banda se envía después al supresor de
solapamiento 713 junto con la otra información de alta frecuencia
para eliminar el solapamiento por el mismo proceso descrito en la
primera realización. Se deberá observar que esta información de
ganancia 720 se envía con la información de señal adicional al
generador de señal adicional 711. Esta configuración permite que el
supresor de solapamiento (medios extractores) de la presente
invención también se pueda aplicar cuando se transmitan valores de
energía de sub-banda de alta frecuencia en lugar de
información de ganancia de sub-banda de alta
frecuencia.
Además, incluso cuando se transmiten valores de
energía de sub-banda de alta frecuencia, el supresor
de solapamiento de esta realización también puede ser aplicado a las
realizaciones segunda a cuarta calculando la ganancia de señal de
sub-banda de alta frecuencia antes de quitar el
solapamiento, e introduciendo la ganancia de
sub-banda de alta frecuencia calculada en el
supresor de solapamiento 113.
Se deberá observar que, dado que la energía de
señal de sub-banda de baja frecuencia se puede usar
en esta realización de la invención, la ganancia g entre dos
sub-bandas adyacentes se puede ajustar como
sigue.
La energía total Et[m] de las
sub-bandas m-1 y m antes del ajuste
de ganancia se calcula en primer lugar usando la ecuación
Et[m] =
g[m]^{2}\cdot E[m] + g[m - 1]^{2} \cdot
E[m -
1]
donde g[m-1]
y g[m] son la ganancia de sub-bandas
m-1 y m antes del ajuste de ganancia, y
E[m-1] y E[m] son la energía de las
señales de sub-banda de baja frecuencia
correspondientes,
respectivamente.
A continuación se estable la energía total
Et[m] como la energía deseada, y se calcula la ganancia a la
energía de referencia (es decir, energía de señal de
sub-banda de baja frecuencia) necesaria para obtener
la energía deseada. Dado que esta ganancia se expresa como la raíz
cuadrada de la relación de energía deseada y energía de referencia,
la ganancia media Gt[m] de la sub-banda
m-1 y sub-banda m se calcula usando
la ecuación siguiente.
Gt[m] =
sqrt(Et[m]/(E[m] + E[m -
1]))
La ganancia g'[m] de la
sub-banda m después del ajuste de ganancia se
calcula después usando esta ganancia media Gt[m] y el grado
de aparición de solapamiento d[m] en la
sub-banda m.
g'[m] =
d[m]\cdot Gt[m] + (1,0 - d[m]) \cdot
g[m]
\newpage
La energía de la sub-banda m
cambia como resultado de este ajuste de ganancia. La ganancia
g'[m-1] de la sub-banda
m-1 después del ajuste se puede calcular a partir de
la ecuación siguiente para evitar que la energía total Et[m]
de la sub-banda m-1 y la
sub-banda m cambien porque la energía de la
sub-banda m-1 es igual a
Et[m] menos la energía de la sub-banda m.
g'[m - 1] =
sqrt((Et[m] - g'[m]^{2} - E[m])/E[m -
1])
Si la ganancia de la sub-banda
m-1 y la sub-banda m se regula como
se ha descrito anteriormente, la energía total de las
sub-bandas m-1 y m antes del ajuste
de ganancia y la energía total de las sub-bandas
m-1 y m después del ajuste de ganancia serán las
mismas. En otros términos, la degradación audio producida por un
cambio en la energía de señal que acompaña al ajuste de ganancia se
puede evitar porque la ganancia de cada sub-banda se
puede ajustar sin cambiar la energía total de las dos
sub-bandas.
Además, la energía total Et[m] de las
sub-bandas m-1 y m se calcula
solamente a partir de señales copiadas de las
sub-bandas de baja frecuencia correspondientes, y no
contiene componentes de energía denotados por la relación de energía
Q y añadidos por las señales adicionales. Por lo tanto, se puede
evitar una degradación de la calidad del sonido porque la
distribución de energía de las señales de sub-bandas
copiadas de la sub-banda de baja frecuencia se puede
mantener sin quedar afectada por las señales adicionales.
Cuando se aplica este método de ajuste de
ganancia sobre tres sub-bandas, se calcula un valor
de g[l]^{2}\cdotE[l] para cada
sub-banda l (l = m-2,
m-1, m) para ponerlo al mismo nivel de ganancia, y
la suma de los tres valores después se usa como Et[m]. Como
al regular ganancia entre dos sub-bandas, la
ganancia media Gt[m] se obtiene de la ecuación siguiente, y
el ajuste de ganancia establece la ganancia de la
sub-banda deseada para que coincida con
Gt[m].
Gt[m] =
sqrt(Et[m]/(E[m - 2] + E[m - 1] +
E[m]))
Este método también se utiliza cuando el número
de sub-bandas para el que se regula la ganancia, es
4 o más.
Obsérvese también que este proceso de ajuste de
ganancia de dos sub-bandas se puede aplicar en orden
ascendente o descendente como se ha descrito anteriormente con
referencia al supresor de solapamiento 113.
La ganancia se puede ajustar alternativamente
usando el grado de aparición de solapamiento d[m] para dos o
más sub-bandas como sigue. Suponiendo, por ejemplo,
que la ganancia se regula sobre tres sub-bandas, la
energía se calcula para cada una de las sub-bandas
m-2, m-1, m para las que se ha de
ajustar la ganancia y la energía total Et[m] se obtiene como
sigue.
Et[m] =
g[m - 2]^{2} \cdot E[m - 2] + g[m - 1]^{2}
\cdot E[m - 1] + g[m]^{2} \cdot
E[m]
El cuadrado de la ganancia media G2t[m]
se calcula después a partir de la ecuación siguiente usando esta
energía total Et[m].
G2t[m]
= Et[m]/(E[m - 2] + E[m - 1] +
E[m])
Usando G2t[m], la ganancia de la
sub-banda deseada l (l = m-2,
m-1, m) se calcula después provisionalmente como
sigue. Obsérvese que la ganancia se interpola usando el cuadrado en
esta realización.
g2[l] =
f[l] \cdot G2t[m] + (1,0 - f[l]) \cdot
g[l]^{2}
donde f[l] es el mayor de
d[l] y d[l+1]. La energía total E't[m] Usando
esta ganancia provisional g2[L] se obtiene como
sigue.
E't[m]
= g2[m - 2] - E[m - 2] + g2[m - 1] \cdot
E[m - 1] + g2[m] \cdot
E[m].
Obsérvese que la energía total E't[m] no
es necesariamente igual a la energía total Et[m] descrita
anteriormente. Por lo tanto, para evitar que la energía total cambie
debido a ajuste de ganancia, la ganancia ajustada g'[l] de
sub-banda deseada l (l = m-2,
m-1, m) se puede poner a:
g'[l] =
sqrt(b \cdot
g2[1])
b =
Et[m]/E't[m].
Este método también se puede utilizar si el
número de sub-bandas de ganancia ajustada es 2 o 4 o
más.
Si se utiliza este método de ajuste de ganancia,
como cuando la ganancia se regula entre dos
sub-bandas, la energía total antes del ajuste de
ganancia y la energía total después del ajuste de ganancia serán las
mismas incluso cuando la ganancia se regule usando el grado de
aparición de solapamiento d[m] sobre más de dos
sub-bandas. Esto significa que la degradación de la
calidad de sonido que resulta de un cambio en energía de señal que
acompaña al ajuste de ganancia se puede evitar porque la ganancia de
cada sub-banda se puede ajustar sin cambiar la
energía de señal total. Como cuando la ganancia se regula sobre dos
sub-bandas como se ha descrito anteriormente, la
calidad del sonido tampoco queda afectada por señales
adicionales.
La configuración del aparato decodificador audio
descrita en las realizaciones anteriores también se puede utilizar
cuando señales de valor complejo de sub-banda de
baja frecuencia salidas del banco de filtros de análisis 103 se
convierten en señales de sub-banda de valor real de
baja frecuencia en el expansor de banda 104, y señales de
sub-banda de alta frecuencia se generan por una
operación con números reales. El proceso de detección de
solapamiento también se puede aplicar a señales de
sub-banda de valor real de baja frecuencia
convertidas en el expansor de banda 104. Ambos casos se pueden
lograr sin cambiar la configuración o el método de procesado del
aparato decodificador audio según la presente invención convirtiendo
la señal tratada de una señal de valor complejo a una señal de valor
real, es decir, una señal donde la parte imaginaria de la señal de
valor complejo es 0. Esta configuración reduce el número de
operaciones realizadas por el expansor de banda 104 utilizando
operaciones con números reales aplicando al mismo tiempo un proceso
de extracción de solapamiento a las señales de
sub-banda de alta frecuencia de valor real
generadas. Por lo tanto, se puede evitar la degradación de la
calidad del sonido debida a solapamiento.
Además, la configuración de un aparato
decodificador audio descrito anteriormente también se puede aplicar
cuando el banco de filtros de análisis 103 es un banco de filtros de
coeficiente de valor real. Las señales de sub-banda
que resultan de la división de banda por el banco de filtros de
análisis de coeficiente de valor real 103 son señales de valor real,
y así el solapamiento resulta un problema durante la generación de
señales de sub-banda de alta frecuencia de la misma
manera que cuando una señal de valor complejo se convierte en una
señal de valor real. Se puede evitar que se produzca solapamiento y
por lo tanto la degradación en la calidad del sonido producido por
el solapamiento se puede evitar utilizando la configuración de un
aparato decodificador audio descrito en cualquiera de las
realizaciones anteriores. El número de operaciones realizadas se
puede reducir en gran medida con esta configuración porque todas las
operaciones de decodificación se realizan con operaciones con
números reales.
El proceso realizado por el aparato
decodificador audio descrito en las realizaciones anteriores de la
invención también se puede lograr con un programa de software
codificado en un lenguaje de programación predeterminado. Esta
aplicación de software también puede ser grabada en un medio de
grabación de datos legible por ordenador para distribución.
Aunque la presente invención se ha descrito en
conexión con sus realizaciones especificadas, otras muchas
modificaciones, correcciones y aplicaciones son evidentes a los
expertos en la materia. Por lo tanto, la presente invención no se
limita por la descripción aquí expuesta, sino que se limita
solamente al alcance de las reivindicaciones anexas.
Se observará además que la presente invención se
refiere a la Publicación de patente japonesa
2002-300490 presentada el 15 de octubre de 2002.
Claims (30)
1. Un aparato decodificador audio para
decodificar una señal audio de banda ancha de un tren de bits
conteniendo información codificada para una señal audio de banda
estrecha, incluyendo dicho aparato:
un demultiplexor de tren de bits (101) que puede
operar para demultiplexar la información codificada del tren de
bits;
un decodificador (107) que puede operar para
decodificar la señal audio de banda estrecha de la información
codificada demultiplexada;
un banco de filtros de análisis (103) que puede
operar para dividir la señal audio de banda estrecha decodificada en
múltiples señales de sub-banda que componen una
primera señal de sub-banda;
un expansor de banda (104) que puede operar para
generar una segunda señal de sub-banda a partir de
la primera señal de sub-banda, componiéndose la
segunda señal de sub-banda de múltiples señales de
sub-banda teniendo cada una una banda de frecuencia
más alta que la banda de frecuencia de la primera señal de
sub-banda;
un supresor de solapamiento (313) que puede
operar para regular una ganancia en base a un grado de solapamiento
en las señales de sub-banda de la segunda señal de
sub-banda para suprimir los componentes de
solapamiento que se producen en las señales de
sub-banda de la segunda señal de
sub-banda; y
un banco de filtros de síntesis de cálculo de
valor real (105) que puede operar para sintetizar la primera señal
de sub-banda y la segunda señal de
sub-banda para obtener la señal audio de banda
ancha.
2. El aparato decodificador audio de la
reivindicación 1, incluyendo además
un detector de solapamiento (315) que puede
operar para detectar un grado de solapamiento en las señales de
sub-banda de la segunda señal de
sub-banda generada por el expansor de banda (104);
y
donde el supresor de solapamiento (313) puede
operar para regular la ganancia de las señales de
sub-banda de la segunda señal de
sub-banda en base al grado de solapamiento detectado
por el detector de solapamiento (315).
3. El aparato decodificador audio según se
reivindica en la reivindicación 2, donde los componentes de
solapamiento contienen al menos componentes que se suprimen después
de la síntesis realizada por un banco de filtros de síntesis (105)
que realiza un cálculo de valor complejo.
4. El aparato decodificador audio según se
reivindica en la reivindicación 2, donde la primera señal de
sub-banda es una señal de sub-banda
de baja frecuencia, y la segunda señal de sub-banda
es una señal de sub-banda de alta frecuencia.
5. El aparato decodificador audio según se
reivindica en la reivindicación 4, donde el detector de solapamiento
(315) usa un parámetro que denota una pendiente de una distribución
de frecuencias de las señales de sub-banda de la
primera señal de sub-banda para detectar el grado de
solapamiento.
6. El aparato decodificador audio según se
reivindica en la reivindicación 5, donde el detector de solapamiento
(315) evalúa un parámetro que denota una pendiente de una
distribución de frecuencias en cada una de dos señales de
sub-banda adyacentes de las señales de
sub-banda de la primera señal de
sub-banda, y detecta el grado de solapamiento en las
dos señales de sub-banda adyacentes.
7. El aparato decodificador audio según se
reivindica en la reivindicación 5, donde el detector de solapamiento
(315) evalúa un parámetro que denota una pendiente de una
distribución de frecuencias en cada una de tres señales de
sub-banda adyacentes de las señales de
sub-banda de la primera señal de
sub-banda, y detecta el grado de solapamiento en las
tres señales de sub-banda adyacentes.
8. El aparato decodificador audio según se
reivindica en la reivindicación 5, donde el parámetro que denota la
pendiente de la distribución de frecuencias es un coeficiente de
reflexión.
9. El aparato decodificador audio según se
reivindica en la reivindicación 2, donde:
el tren de bits contiene información adicional
usada para habilitar banda estrecha a banda ancha,
la información adicional contiene información de
componentes de alta frecuencia que describe una característica de
una señal a una banda de frecuencia más alta que la banda de
frecuencia de la primera señal de sub-banda; y
el demultiplexor de tren de bits (101) puede
operar además para demultiplexar la información adicional del tren
de bits; y
el expansor de banda (104) puede operar para
generar la segunda señal de sub-banda compuesta de
las múltiples señales de sub-banda teniendo cada una
una banda de frecuencia más alta que la banda de frecuencia de la
primera señal de sub-banda, a partir de la primera
señal de sub-banda y la información de componentes
de alta frecuencia contenida en la información adicional.
10. El aparato decodificador audio según se
reivindica en la reivindicación 9, donde la información de
componentes de alta frecuencia contiene información de ganancia para
una banda de frecuencia más alta que la banda de frecuencia de las
primeras señales de sub-banda;
el expansor de banda (104) puede operar para
generar la segunda señal de sub-banda a partir de la
primera señal de sub-banda en base a la información
de ganancia; y
el supresor de solapamiento (313) puede operar
para regular la ganancia de las señales de sub-banda
de la segunda señal de sub-banda en base al grado de
solapamiento detectado por el detector de solapamiento y la
información de ganancia para suprimir los componentes de
solapamiento.
11. El aparato decodificador audio según se
reivindica en la reivindicación 9, donde la información de
componentes de alta frecuencia contiene información de energía para
señales a una banda de frecuencia más alta que la banda de
frecuencia de las primeras señales de sub-banda;
el expansor de banda (104) puede operar para
generar la segunda señal de sub-banda a partir de la
primera señal de sub-banda en base a información de
ganancia calculada a partir de la información de energía; y
el supresor de solapamiento (313) puede operar
para regular la ganancia de las señales de sub-banda
de la segunda señal de sub-banda en base al grado de
solapamiento detectado por el detector de solapamiento (315) y la
información de ganancia para suprimir los componentes de
solapamiento.
12. El aparato decodificador audio según se
reivindica en la reivindicación 11, donde el supresor de
solapamiento (313) puede operar para regular la ganancia de las
señales de sub-banda de la segunda señal de
sub-banda de manera que la energía total de la
segunda señal de sub-banda con ganancia ajustada sea
igual a una energía total proporcionada por la información de
energía de una segunda señal de sub-banda
correspondiente.
13. El aparato decodificador audio según se
reivindica en la reivindicación 11, donde el expansor de banda (104)
puede operar para añadir una señal adicional a la segunda señal de
sub-banda generada;
la información de energía contiene la energía R
de la segunda señal de sub-banda y la relación Q
entre la energía R y una energía de la señal adicional; y
el expansor de banda (104) puede operar para
calcular la energía E de la primera señal de
sub-banda, y calcula la ganancia g de una segunda
señal de sub-banda correspondiente en base a la
energía R, la energía E, y la energía de la señal adicional
representada por la relación de energía Q.
14. El aparato decodificador audio según se
reivindica en la reivindicación 13, donde la ganancia g de la
segunda señal de sub-banda es
d =
sqrt{R/E/(1+Q)}
donde sqrt es un operador de raíz
cuadrada.
15. Un método de decodificación audio para
decodificar una señal audio de banda ancha de un tren de bits
conteniendo información codificada para una señal audio de banda
estrecha, incluyendo dicho método:
demultiplexar la información codificada del tren
de bits;
decodificar la señal audio de banda estrecha a
partir de la información codificada demultiplexada;
dividir la señal audio de banda estrecha
decodificada en múltiples señales de sub-banda que
componen una primera señal de sub-banda;
generar segundas señales de
sub-banda a partir de la primera señal de
sub-banda, componiéndose la segunda señal de
sub-banda de múltiples señales de
sub-banda teniendo cada una una banda de frecuencia
más alta que la banda de frecuencia de las primeras señales de
sub-banda;
regular una ganancia en base a un grado de
solapamiento en las señales de sub-banda de la
segunda señal de sub-banda para suprimir componentes
de solapamiento que se producen en señales de
sub-banda de la segunda señal de
sub-banda; y
sintetizar la primera señal de
sub-banda y la segunda señal de
sub-banda usando un cálculo de filtración de valor
real para obtener la señal audio de banda ancha.
16. El método de decodificación audio de la
reivindicación 15, incluyendo además:
detectar un grado de solapamiento en cada una de
las múltiples señales de sub-banda generadas de la
segunda señal de sub-banda, antes de generar la
segunda señal de sub-banda; y
regular una ganancia de las señales de
sub-banda de la segunda señal de
sub-banda en base al grado de solapamiento
detectado.
17. El método de decodificación audio según se
reivindica en la reivindicación 16, donde componentes de
solapamiento contienen al menos componentes que se suprimen después
de sintetizar con un cálculo de filtración de valor complejo.
18. El método de decodificación audio según se
reivindica en la reivindicación 16, donde la primera señal de
sub-banda es una señal de sub-banda
de baja frecuencia, y la segunda señal de sub-banda
es una señal de sub-banda de alta frecuencia.
19. El método de decodificación audio según se
reivindica en la reivindicación 18, donde en la detección del grado
de solapamiento, se utiliza un parámetro que denota una pendiente de
una distribución de frecuencias de las señales de
sub-banda de la primera señal de
sub-banda para detectar el grado de
solapamiento.
20. El método de decodificación audio según se
reivindica en la reivindicación 19, donde en la detección del grado
de solapamiento, se evalúa un parámetro que denota una pendiente de
una distribución de frecuencias en cada una de dos señales de
sub-banda adyacentes de las señales de
sub-banda de la primera señal de
sub-banda para detectar el grado de solapamiento en
las dos señales de sub-banda adyacentes.
21. El método de decodificación audio según se
reivindica en la reivindicación 19, donde en la detección del grado
de solapamiento, se evalúa un parámetro que denota una pendiente de
una distribución de frecuencias en cada una de tres señales de
sub-banda adyacentes de las señales de
sub-banda de la primera señal de
sub-banda para detectar el grado de solapamiento en
las tres señales de sub-banda adyacentes.
22. El método de decodificación audio según se
reivindica en la reivindicación 19, donde el parámetro que denota la
pendiente de la distribución de frecuencias es un coeficiente de
reflexión.
23. El método de decodificación audio según se
reivindica en la reivindicación 16, donde
el tren de bits contiene información adicional
usada para habilitar banda estrecha a banda ancha;
la información adicional contiene información de
componentes de alta frecuencia que describen una característica de
una señal en una banda de frecuencia más alta que la banda de
frecuencia de la primera señal de sub-banda; y
al demultiplexar información codificada, la
información adicional es demultiplexada del tren de bits; y
en la generación de la segunda señal de
sub-banda, la segunda señal de
sub-banda compuesta de las múltiples señales de
sub-banda teniendo cada una una banda de frecuencia
más alta que la banda de frecuencia de las primeras señales de
sub-banda se genera a partir de al menos una primera
señal de sub-banda y la información de componentes
de alta frecuencia contenida en la información adicional.
24. El método de decodificación audio según se
reivindica en la reivindicación 23, donde la información de
componentes de alta frecuencia contiene información de ganancia para
una banda de frecuencia más alta que la banda de frecuencia de las
primeras señales de sub-banda;
en la generación de la segunda señal de
sub-banda, la segunda señal de
sub-banda se genera a partir de la primera señal de
sub-banda en base a la información de ganancia;
y
en la regulación de la ganancia, la ganancia de
las señales de sub-banda de la segunda señal de
sub-banda se regula en base al grado de solapamiento
detectado y la información de ganancia para suprimir los componentes
de solapamiento.
25. El método de decodificación audio según se
reivindica en la reivindicación 23, donde la información de
componentes de alta frecuencia contiene información de energía para
señales a una banda de frecuencia más alta que la banda de
frecuencia de la primera señal de sub-banda;
en la generación de la segunda señal de
sub-banda, la segunda señal de
sub-banda se genera a partir de la primera señal de
sub-banda en base a información de ganancia
calculada a partir de la información de energía; y
en la regulación de la ganancia, la ganancia de
las señales de sub-banda de la segunda señal de
sub-banda se regula en base al grado de solapamiento
detectado y la información de ganancia para suprimir los componentes
de solapamiento.
26. El método de decodificación audio según se
reivindica en la reivindicación 25, donde en la regulación de la
ganancia, la ganancia de las señales de sub-banda de
la segunda señal de sub-banda se regula de manera
que una energía total de la segunda señal de
sub-banda con ganancia ajustada sea igual a una
energía total proporcionada por la información de energía de una
segunda señal de sub-banda correspondiente.
27. El método de decodificación audio según se
reivindica en la reivindicación 25, donde la generación de la
segunda señal de sub-banda incluye añadir una señal
adicional a la segunda señal de sub-banda
generada;
la información de energía contiene energía R de
la segunda señal de sub-banda y la relación Q entre
la energía R y una energía de la señal adicional; y
la generación de la segunda señal de
sub-banda incluye además; calcular la energía E de
la primera señal de sub-banda, y calcular la
ganancia g de una segunda señal de sub-banda
correspondiente en base a la energía R, la energía E, y la energía
de la señal adicional representada por la relación de energía Q.
28. El método de decodificación audio según se
reivindica en la reivindicación 27, donde la ganancia g de la
segunda señal de sub-banda es
g =
sqrt{R/E/(1+Q)}
donde sqrt es un operador de raíz
cuadrada.
29. Un programa de ordenador codificado en un
lenguaje de programación que ejecuta cada uno de los pasos del
método de decodificación audio según cualquiera de las
reivindicaciones 15 a 28, cuando este programa de ordenador se
ejecuta en un ordenador.
30. Un medio de registro de datos que almacena
el programa según la reivindicación 29.
Applications Claiming Priority (6)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002273557 | 2002-09-19 | ||
JP2002-273557 | 2002-09-19 | ||
JP2002-283722 | 2002-09-27 | ||
JP2002283722 | 2002-09-27 | ||
JP2002-300490 | 2002-10-15 | ||
JP2002300490 | 2002-10-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2259158T3 true ES2259158T3 (es) | 2006-09-16 |
Family
ID=32034073
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES03797574T Expired - Lifetime ES2259158T3 (es) | 2002-09-19 | 2003-09-11 | Metodo y aparato decodificador audio. |
Country Status (14)
Country | Link |
---|---|
US (1) | US7069212B2 (es) |
EP (1) | EP1543307B1 (es) |
JP (1) | JP3646939B1 (es) |
KR (1) | KR100728428B1 (es) |
CN (1) | CN100492492C (es) |
AT (1) | ATE318405T1 (es) |
AU (1) | AU2003260958A1 (es) |
BR (1) | BRPI0306434B1 (es) |
CA (1) | CA2469674C (es) |
DE (1) | DE60303689T2 (es) |
ES (1) | ES2259158T3 (es) |
HK (1) | HK1074877A1 (es) |
TW (1) | TWI313856B (es) |
WO (1) | WO2004027368A1 (es) |
Families Citing this family (121)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7742927B2 (en) * | 2000-04-18 | 2010-06-22 | France Telecom | Spectral enhancing method and device |
DE10121532A1 (de) * | 2001-05-03 | 2002-11-07 | Siemens Ag | Verfahren und Vorrichtung zur automatischen Differenzierung und/oder Detektion akustischer Signale |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
ES2237706T3 (es) * | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP4741476B2 (ja) * | 2004-04-23 | 2011-08-03 | パナソニック株式会社 | 符号化装置 |
EP1744139B1 (en) * | 2004-05-14 | 2015-11-11 | Panasonic Intellectual Property Corporation of America | Decoding apparatus and method thereof |
CN101656077B (zh) * | 2004-05-14 | 2012-08-29 | 松下电器产业株式会社 | 音频编码装置、音频编码方法以及通信终端和基站装置 |
ATE394774T1 (de) | 2004-05-19 | 2008-05-15 | Matsushita Electric Ind Co Ltd | Kodierungs-, dekodierungsvorrichtung und methode dafür |
PL1810281T3 (pl) * | 2004-11-02 | 2020-07-27 | Koninklijke Philips N.V. | Kodowanie i dekodowanie sygnałów audio z wykorzystaniem banków filtrów o wartościach zespolonych |
CN101076853B (zh) * | 2004-12-10 | 2010-10-13 | 松下电器产业株式会社 | 宽带编码装置、宽带线谱对预测装置、频带可扩展编码装置以及宽带编码方法 |
JP5224017B2 (ja) * | 2005-01-11 | 2013-07-03 | 日本電気株式会社 | オーディオ符号化装置、オーディオ符号化方法およびオーディオ符号化プログラム |
DE602006009215D1 (de) * | 2005-01-14 | 2009-10-29 | Panasonic Corp | Audioumschaltungsvorrichtung und -methode |
JP5129115B2 (ja) * | 2005-04-01 | 2013-01-23 | クゥアルコム・インコーポレイテッド | 高帯域バーストの抑制のためのシステム、方法、および装置 |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8086451B2 (en) * | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
TWI324336B (en) * | 2005-04-22 | 2010-05-01 | Qualcomm Inc | Method of signal processing and apparatus for gain factor smoothing |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
FR2888699A1 (fr) * | 2005-07-13 | 2007-01-19 | France Telecom | Dispositif de codage/decodage hierachique |
DE602006010712D1 (de) * | 2005-07-15 | 2010-01-07 | Panasonic Corp | Audiodekoder |
US8443026B2 (en) | 2005-09-16 | 2013-05-14 | Dolby International Ab | Partially complex modulated filter bank |
US7917561B2 (en) * | 2005-09-16 | 2011-03-29 | Coding Technologies Ab | Partially complex modulated filter bank |
JP4876574B2 (ja) * | 2005-12-26 | 2012-02-15 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
TWI311856B (en) * | 2006-01-04 | 2009-07-01 | Quanta Comp Inc | Synthesis subband filtering method and apparatus |
WO2007080211A1 (en) * | 2006-01-09 | 2007-07-19 | Nokia Corporation | Decoding of binaural audio signals |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
JP5185254B2 (ja) * | 2006-04-04 | 2013-04-17 | ドルビー ラボラトリーズ ライセンシング コーポレイション | Mdct領域におけるオーディオ信号音量測定と改良 |
US8000825B2 (en) | 2006-04-13 | 2011-08-16 | Immersion Corporation | System and method for automatically producing haptic events from a digital audio file |
US7979146B2 (en) * | 2006-04-13 | 2011-07-12 | Immersion Corporation | System and method for automatically producing haptic events from a digital audio signal |
US8378964B2 (en) | 2006-04-13 | 2013-02-19 | Immersion Corporation | System and method for automatically producing haptic events from a digital audio signal |
DE102006047197B3 (de) * | 2006-07-31 | 2008-01-31 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Verarbeiten eines reellen Subband-Signals zur Reduktion von Aliasing-Effekten |
EP2076901B8 (en) * | 2006-10-25 | 2017-08-16 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples |
WO2008062990A1 (en) | 2006-11-21 | 2008-05-29 | Samsung Electronics Co., Ltd. | Method, medium, and system scalably encoding/decoding audio/speech |
JP4967618B2 (ja) * | 2006-11-24 | 2012-07-04 | 富士通株式会社 | 復号化装置および復号化方法 |
KR101049143B1 (ko) | 2007-02-14 | 2011-07-15 | 엘지전자 주식회사 | 오브젝트 기반의 오디오 신호의 부호화/복호화 장치 및 방법 |
US20080208575A1 (en) * | 2007-02-27 | 2008-08-28 | Nokia Corporation | Split-band encoding and decoding of an audio signal |
JP4984983B2 (ja) * | 2007-03-09 | 2012-07-25 | 富士通株式会社 | 符号化装置および符号化方法 |
KR101355376B1 (ko) * | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101458930B (zh) * | 2007-12-12 | 2011-09-14 | 华为技术有限公司 | 带宽扩展中激励信号的生成及信号重建方法和装置 |
CN101329870B (zh) * | 2008-08-01 | 2012-12-12 | 威盛电子股份有限公司 | 音频解码器以及相关的电子装置以及抑制高频调制噪声的方法 |
US8352279B2 (en) | 2008-09-06 | 2013-01-08 | Huawei Technologies Co., Ltd. | Efficient temporal envelope coding approach by prediction between low band signal and high band signal |
EP2360687A4 (en) * | 2008-12-19 | 2012-07-11 | Fujitsu Ltd | VOICE BAND EXTENSION DEVICE AND VOICE BAND EXTENSION METHOD |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
US11657788B2 (en) * | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
AU2015264887B2 (en) * | 2009-05-27 | 2017-12-07 | Dolby International Ab | Efficient Combined Harmonic Transposition |
TWI643187B (zh) * | 2009-05-27 | 2018-12-01 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
AU2013263712B2 (en) * | 2009-05-27 | 2015-11-12 | Dolby International Ab | Efficient Combined Harmonic Transposition |
JP5754899B2 (ja) | 2009-10-07 | 2015-07-29 | ソニー株式会社 | 復号装置および方法、並びにプログラム |
JPWO2011048741A1 (ja) * | 2009-10-20 | 2013-03-07 | 日本電気株式会社 | マルチバンドコンプレッサ |
JP5345737B2 (ja) | 2009-10-21 | 2013-11-20 | ドルビー インターナショナル アーベー | 結合されたトランスポーザーフィルターバンクにおけるオーバーサンプリング |
UA102347C2 (ru) | 2010-01-19 | 2013-06-25 | Долби Интернешнл Аб | Усовершенствованное гармоническое преобразование на основе блока поддиапазонов |
EP2357649B1 (en) * | 2010-01-21 | 2012-12-19 | Electronics and Telecommunications Research Institute | Method and apparatus for decoding audio signal |
WO2011114192A1 (en) * | 2010-03-19 | 2011-09-22 | Nokia Corporation | Method and apparatus for audio coding |
JP5651980B2 (ja) | 2010-03-31 | 2015-01-14 | ソニー株式会社 | 復号装置、復号方法、およびプログラム |
JP5609737B2 (ja) | 2010-04-13 | 2014-10-22 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
JP5850216B2 (ja) | 2010-04-13 | 2016-02-03 | ソニー株式会社 | 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム |
CN103069484B (zh) * | 2010-04-14 | 2014-10-08 | 华为技术有限公司 | 时/频二维后处理 |
CA3027803C (en) * | 2010-07-19 | 2020-04-07 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
US9236063B2 (en) | 2010-07-30 | 2016-01-12 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for dynamic bit allocation |
JP6075743B2 (ja) | 2010-08-03 | 2017-02-08 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN103270553B (zh) | 2010-08-12 | 2015-08-12 | 弗兰霍菲尔运输应用研究公司 | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 |
US9208792B2 (en) | 2010-08-17 | 2015-12-08 | Qualcomm Incorporated | Systems, methods, apparatus, and computer-readable media for noise injection |
CA3067155C (en) * | 2010-09-16 | 2021-01-19 | Dolby International Ab | Cross product enhanced subband block based harmonic transposition |
JP5707842B2 (ja) * | 2010-10-15 | 2015-04-30 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、並びにプログラム |
FR2969804A1 (fr) * | 2010-12-23 | 2012-06-29 | France Telecom | Filtrage perfectionne dans le domaine transforme. |
JP5743137B2 (ja) | 2011-01-14 | 2015-07-01 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
JP5969513B2 (ja) | 2011-02-14 | 2016-08-17 | フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン | 不活性相の間のノイズ合成を用いるオーディオコーデック |
TWI488176B (zh) | 2011-02-14 | 2015-06-11 | Fraunhofer Ges Forschung | 音訊信號音軌脈衝位置之編碼與解碼技術 |
WO2012110478A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Information signal representation using lapped transform |
KR101551046B1 (ko) | 2011-02-14 | 2015-09-07 | 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. | 저-지연 통합 스피치 및 오디오 코딩에서 에러 은닉을 위한 장치 및 방법 |
WO2012110415A1 (en) | 2011-02-14 | 2012-08-23 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for processing a decoded audio signal in a spectral domain |
EP2676270B1 (en) | 2011-02-14 | 2017-02-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Coding a portion of an audio signal using a transient detection and a quality result |
BR112013020587B1 (pt) * | 2011-02-14 | 2021-03-09 | Fraunhofer-Gesellschaft Zur Forderung De Angewandten Forschung E.V. | esquema de codificação com base em previsão linear utilizando modelagem de ruído de domínio espectral |
EP2676265B1 (en) | 2011-02-14 | 2019-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding an audio signal using an aligned look-ahead portion |
GB2491173A (en) * | 2011-05-26 | 2012-11-28 | Skype | Setting gain applied to an audio signal based on direction of arrival (DOA) information |
GB2493327B (en) | 2011-07-05 | 2018-06-06 | Skype | Processing audio signals |
US9210506B1 (en) * | 2011-09-12 | 2015-12-08 | Audyssey Laboratories, Inc. | FFT bin based signal limiting |
GB2495278A (en) | 2011-09-30 | 2013-04-10 | Skype | Processing received signals from a range of receiving angles to reduce interference |
GB2495131A (en) | 2011-09-30 | 2013-04-03 | Skype | A mobile device includes a received-signal beamformer that adapts to motion of the mobile device |
GB2495130B (en) | 2011-09-30 | 2018-10-24 | Skype | Processing audio signals |
GB2495128B (en) | 2011-09-30 | 2018-04-04 | Skype | Processing signals |
GB2495129B (en) | 2011-09-30 | 2017-07-19 | Skype | Processing signals |
GB2495472B (en) | 2011-09-30 | 2019-07-03 | Skype | Processing audio signals |
GB2496660B (en) | 2011-11-18 | 2014-06-04 | Skype | Processing audio signals |
GB201120392D0 (en) | 2011-11-25 | 2012-01-11 | Skype Ltd | Processing signals |
GB2497343B (en) | 2011-12-08 | 2014-11-26 | Skype | Processing audio signals |
RU2725416C1 (ru) * | 2012-03-29 | 2020-07-02 | Телефонактиеболагет Лм Эрикссон (Пабл) | Расширение полосы частот гармонического аудиосигнала |
JP5997592B2 (ja) | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
KR101920029B1 (ko) * | 2012-08-03 | 2018-11-19 | 삼성전자주식회사 | 모바일 장치 및 제어방법 |
JP2014074782A (ja) * | 2012-10-03 | 2014-04-24 | Sony Corp | 音声送信装置、音声送信方法、音声受信装置および音声受信方法 |
CN103778918B (zh) * | 2012-10-26 | 2016-09-07 | 华为技术有限公司 | 音频信号的比特分配的方法和装置 |
FR3007563A1 (fr) * | 2013-06-25 | 2014-12-26 | France Telecom | Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences |
CN108364657B (zh) | 2013-07-16 | 2020-10-30 | 超清编解码有限公司 | 处理丢失帧的方法和解码器 |
US9875746B2 (en) | 2013-09-19 | 2018-01-23 | Sony Corporation | Encoding device and method, decoding device and method, and program |
CN104517610B (zh) * | 2013-09-26 | 2018-03-06 | 华为技术有限公司 | 频带扩展的方法及装置 |
CA3162763A1 (en) | 2013-12-27 | 2015-07-02 | Sony Corporation | Decoding apparatus and method, and program |
WO2015189533A1 (en) * | 2014-06-10 | 2015-12-17 | Meridian Audio Limited | Digital encapsulation of audio signals |
CN106683681B (zh) * | 2014-06-25 | 2020-09-25 | 华为技术有限公司 | 处理丢失帧的方法和装置 |
KR101641418B1 (ko) * | 2014-07-25 | 2016-07-20 | 포항공과대학교 산학협력단 | 청각 주목도에 기반한 햅틱 신호 생성 방법 및 이를 위한 장치 |
CN104269173B (zh) * | 2014-09-30 | 2018-03-13 | 武汉大学深圳研究院 | 切换模式的音频带宽扩展装置与方法 |
EP3067889A1 (en) | 2015-03-09 | 2016-09-14 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method and apparatus for signal-adaptive transform kernel switching in audio coding |
US10049684B2 (en) | 2015-04-05 | 2018-08-14 | Qualcomm Incorporated | Audio bandwidth selection |
CN108140396B (zh) * | 2015-09-22 | 2022-11-25 | 皇家飞利浦有限公司 | 音频信号处理 |
JP6210338B2 (ja) * | 2015-12-28 | 2017-10-11 | ソニー株式会社 | 信号処理装置および方法、並びにプログラム |
CN110050304B (zh) * | 2016-12-16 | 2022-11-29 | 瑞典爱立信有限公司 | 用于处理包络表示系数的方法、编码器和解码器 |
JP6769299B2 (ja) * | 2016-12-27 | 2020-10-14 | 富士通株式会社 | オーディオ符号化装置およびオーディオ符号化方法 |
US11540279B2 (en) * | 2019-07-12 | 2022-12-27 | Meteorcomm, Llc | Wide band sensing of transmissions in FDM signals containing multi-width channels |
US11916668B2 (en) | 2020-12-08 | 2024-02-27 | Meteorcomm, Llc | Soft decision differential demodulator for radios in wireless networks supporting train control |
CN113299313B (zh) * | 2021-01-28 | 2024-03-26 | 维沃移动通信有限公司 | 音频处理方法、装置及电子设备 |
CN113539277B (zh) * | 2021-09-17 | 2022-01-18 | 北京百瑞互联技术有限公司 | 一种保护听力的蓝牙音频解码方法、装置、介质及设备 |
CN114189410B (zh) * | 2021-12-13 | 2024-05-17 | 深圳市日声数码科技有限公司 | 一种车载数码广播音频接收系统 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4691292A (en) * | 1983-04-13 | 1987-09-01 | Rca Corporation | System for digital multiband filtering |
DE3510573A1 (de) * | 1985-03-23 | 1986-09-25 | Philips Patentverwaltung | Digitale analyse-synthese-filterbank mit maximaler taktreduktion |
JP2906646B2 (ja) * | 1990-11-09 | 1999-06-21 | 松下電器産業株式会社 | 音声帯域分割符号化装置 |
JPH04206035A (ja) * | 1990-11-30 | 1992-07-28 | Kogaku Denshi Kk | Cd―romおよびcd―romの再生システム |
FR2680924B1 (fr) * | 1991-09-03 | 1997-06-06 | France Telecom | Procede de filtrage adapte d'un signal transforme en sous-bandes, et dispositif de filtrage correspondant. |
US5508949A (en) * | 1993-12-29 | 1996-04-16 | Hewlett-Packard Company | Fast subband filtering in digital signal coding |
US5654952A (en) * | 1994-10-28 | 1997-08-05 | Sony Corporation | Digital signal encoding method and apparatus and recording medium |
JPH08162964A (ja) | 1994-12-08 | 1996-06-21 | Sony Corp | 情報圧縮装置及び方法、情報伸張装置及び方法、並びに記録媒体 |
EP0732687B2 (en) * | 1995-03-13 | 2005-10-12 | Matsushita Electric Industrial Co., Ltd. | Apparatus for expanding speech bandwidth |
JP2956548B2 (ja) | 1995-10-05 | 1999-10-04 | 松下電器産業株式会社 | 音声帯域拡大装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
JP3437421B2 (ja) | 1997-09-30 | 2003-08-18 | シャープ株式会社 | 楽音符号化装置及び楽音符号化方法並びに楽音符号化プログラムを記録した記録媒体 |
EP0957580B1 (en) | 1998-05-15 | 2008-04-02 | Thomson | Method and apparatus for sampling-rate conversion of audio signals |
EP0957579A1 (en) | 1998-05-15 | 1999-11-17 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for sampling-rate conversion of audio signals |
US6539355B1 (en) * | 1998-10-15 | 2003-03-25 | Sony Corporation | Signal band expanding method and apparatus and signal synthesis method and apparatus |
SE9903553D0 (sv) * | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
US6718300B1 (en) * | 2000-06-02 | 2004-04-06 | Agere Systems Inc. | Method and apparatus for reducing aliasing in cascaded filter banks |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
US6895375B2 (en) * | 2001-10-04 | 2005-05-17 | At&T Corp. | System for bandwidth extension of Narrow-band speech |
-
2003
- 2003-09-11 ES ES03797574T patent/ES2259158T3/es not_active Expired - Lifetime
- 2003-09-11 AU AU2003260958A patent/AU2003260958A1/en not_active Abandoned
- 2003-09-11 JP JP2004537550A patent/JP3646939B1/ja not_active Expired - Lifetime
- 2003-09-11 CN CNB038017792A patent/CN100492492C/zh not_active Expired - Lifetime
- 2003-09-11 DE DE60303689T patent/DE60303689T2/de not_active Expired - Lifetime
- 2003-09-11 KR KR1020047009424A patent/KR100728428B1/ko active IP Right Grant
- 2003-09-11 EP EP03797574A patent/EP1543307B1/en not_active Expired - Lifetime
- 2003-09-11 BR BRPI0306434-4A patent/BRPI0306434B1/pt active IP Right Grant
- 2003-09-11 AT AT03797574T patent/ATE318405T1/de not_active IP Right Cessation
- 2003-09-11 CA CA2469674A patent/CA2469674C/en not_active Expired - Lifetime
- 2003-09-11 WO PCT/JP2003/011601 patent/WO2004027368A1/en active IP Right Grant
- 2003-09-11 US US10/496,798 patent/US7069212B2/en not_active Expired - Lifetime
- 2003-09-18 TW TW092125788A patent/TWI313856B/zh not_active IP Right Cessation
-
2005
- 2005-10-10 HK HK05108972.0A patent/HK1074877A1/xx not_active IP Right Cessation
Also Published As
Publication number | Publication date |
---|---|
AU2003260958A1 (en) | 2004-04-08 |
BRPI0306434A8 (pt) | 2017-10-10 |
TWI313856B (en) | 2009-08-21 |
CN100492492C (zh) | 2009-05-27 |
JP3646939B1 (ja) | 2005-05-11 |
KR100728428B1 (ko) | 2007-06-13 |
JP2005520219A (ja) | 2005-07-07 |
ATE318405T1 (de) | 2006-03-15 |
EP1543307B1 (en) | 2006-02-22 |
HK1074877A1 (en) | 2005-11-25 |
CA2469674C (en) | 2012-04-24 |
DE60303689T2 (de) | 2006-10-19 |
TW200407846A (en) | 2004-05-16 |
KR20050042075A (ko) | 2005-05-04 |
CA2469674A1 (en) | 2004-04-01 |
BR0306434A (pt) | 2004-10-26 |
DE60303689D1 (de) | 2006-04-27 |
BRPI0306434B1 (pt) | 2018-06-12 |
EP1543307A1 (en) | 2005-06-22 |
WO2004027368A1 (en) | 2004-04-01 |
US20050149339A1 (en) | 2005-07-07 |
CN1606687A (zh) | 2005-04-13 |
US7069212B2 (en) | 2006-06-27 |
AU2003260958A8 (en) | 2004-04-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2259158T3 (es) | Metodo y aparato decodificador audio. | |
ES2677524T3 (es) | Decodificador y método para decodificar una señal de audio, codificador y método para codificar una señal de audio | |
ES2261974T3 (es) | Parato decodificador y metodo de decodificacion audio basado en una duplicacion de banda espectral. | |
ES2511390T3 (es) | Aparato, procedimiento y programa de computación para mezclar en forma ascendente una señal de audio con mezcla descendente utilizando una suavización de valor de fase | |
JP2022123060A (ja) | 符号化オーディオ信号を復号する復号装置および復号方法 | |
JP3579047B2 (ja) | オーディオ復号装置と復号方法およびプログラム | |
ES2434251T3 (es) | Método y aparato para generar una capa de mejora dentro de un sistema de codificación de audio de múltiples canales | |
ES2968886T3 (es) | Decodificador de extensión de audio de ancho de banda, procedimiento correspondiente y programa de ordenador | |
JP4934427B2 (ja) | 音声信号復号化装置及び音声信号符号化装置 | |
ES2273216T3 (es) | Codificacion de audio. | |
ES2316679T3 (es) | Cuantificacion y cuantificacion inversa para señales audio. | |
ES2247466T3 (es) | Mejora de codificacion de la fuente utilizando replicacion de la banda espectral. | |
US11705145B2 (en) | Apparatus and method for generating an enhanced signal using independent noise-filling | |
BRPI0520729B1 (pt) | Método para a codificação e decodificação de sinais de áudio, codificador para codificação e decodificador para decodificar sinais de áudio e sistema para compressão de áudio digital. | |
BR112015004556B1 (pt) | Aparelho e método para reproduzir um sinal de áudio, aparelho e método para gerar um sinal de áudio codificado | |
JP2003506763A (ja) | 高品質オーディオ用縮尺自在符号化方法 | |
US20140149124A1 (en) | Apparatus, medium and method to encode and decode high frequency signal | |
JP4313993B2 (ja) | オーディオ復号化装置およびオーディオ復号化方法 | |
BR112021007516A2 (pt) | codificador de áudio, processador de áudio e método para processar um sinal de áudio |