ES2218462T3 - Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. - Google Patents
Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia.Info
- Publication number
- ES2218462T3 ES2218462T3 ES01983888T ES01983888T ES2218462T3 ES 2218462 T3 ES2218462 T3 ES 2218462T3 ES 01983888 T ES01983888 T ES 01983888T ES 01983888 T ES01983888 T ES 01983888T ES 2218462 T3 ES2218462 T3 ES 2218462T3
- Authority
- ES
- Spain
- Prior art keywords
- frequency
- core
- signal
- crossover frequency
- envelope
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 238000000034 method Methods 0.000 title claims description 22
- 230000006872 improvement Effects 0.000 title description 3
- 230000005236 sound signal Effects 0.000 claims abstract description 23
- 230000003595 spectral effect Effects 0.000 claims description 18
- 238000005259 measurement Methods 0.000 claims description 10
- 230000017105 transposition Effects 0.000 claims description 4
- 230000008929 regeneration Effects 0.000 claims 5
- 238000011069 regeneration method Methods 0.000 claims 5
- 230000003111 delayed effect Effects 0.000 claims 2
- 230000001419 dependent effect Effects 0.000 abstract description 3
- 238000001514 detection method Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000010183 spectrum analysis Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007480 spreading Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Measuring Pulse, Heart Rate, Blood Pressure Or Blood Flow (AREA)
- Measurement And Recording Of Electrical Phenomena And Electrical Characteristics Of The Living Body (AREA)
- Optical Communication System (AREA)
- Surface Acoustic Wave Elements And Circuit Networks Thereof (AREA)
- Transmission Systems Not Characterized By The Medium Used For Transmission (AREA)
- Transmitters (AREA)
Abstract
Un aparato para codificar una señal de audio para obtener una señal de audio codificada para ser usada por un decodificador que tiene un módulo de reconstrucción de alta frecuencia para realizar una reconstrucción de alta frecuencia para un intervalo de frecuencia por encima de una frecuencia de cruce, comprendiendo el aparato: un codificador (502) de núcleo para codificar una banda de frecuencia más baja de la señal de audio hasta la frecuencia de cruce, en el que la frecuencia de cruce es variable y en el que el codificador de núcleo es accionable fotograma a fotograma en forma de bloques; y un módulo (504) de control de frecuencia de cruce para estimar, dependiendo de una medición del grado de dificultad para codificar la señal de audio mediante el codificador (502) de núcleo y/o dependiendo de una frontera entre un intervalo de frecuencia tonal y en forma de ruido de la señal de audio, una frecuencia de cruce que se ha de seleccionar mediante el codificador (502) de núcleo para un fotograma de una serie de fotogramas subsiguientes, de manera que la frecuencia de cruce es variable adaptativamente a lo largo del tiempo para la serie de fotogramas subsiguientes.
Description
Mejora del rendimiento de sistemas de cifrado que
usan métodos de reconstrucción de alta frecuencia.
La presente invención se refiere a sistemas
digitales de cifrado de audio que emplean métodos de reconstrucción
de alta frecuencia (HFR). Esto posibilita un rendimiento más
consistente de códec de núcleo y se consigue una calidad de audio
mejorada del sistema combinado de HFR y códec de núcleo.
Las técnicas de cifrado de fuente de audio se
pueden dividir en dos clases: cifrado de audio natural y cifrado de
voz. El cifrado de audio natural se usa comúnmente para música o
señales arbitrarias a tasas medias de transmisión de bites. Los
códeces de voz están limitados básicamente a reproducción de voz,
pero por otro lado se pueden usar a tasas de transmisión de bites
muy bajas. En ambas clases, la señal se separa generalmente en dos
componentes mayores de señal, una envolvente espectral y una
correspondiente señal residual. Los códeces que hacen uso de tal
división explotan el hecho de que la envolvente espectral se puede
cifrar mucho más eficientemente que la residual. En sistemas en los
que se usan métodos de reconstrucción de alta frecuencia, no se
transmite ninguna residual que corresponda a la banda alta. En su
lugar, se genera una banda alta en el lado de decodificador a
partir de la banda baja cubierta por el códec de núcleo y se da
forma hasta obtener la deseada envolvente espectral de banda alta.
En sistemas de HFR de dos extremos, tal como se divulga en la
solicitud internacional de patente WO98/57436, se transmiten datos
de envolvente que corresponden al intervalo superior de frecuencia,
mientras que, en sistemas de HFR de un extremo, la envolvente de
banda alta se deriva a partir de la banda baja. En cualquier caso,
los códeces de audio de la técnica anterior aplican una frecuencia
de cruce, invariable en el tiempo, entre el intervalo de frecuencia
del códec de núcleo y el intervalo de frecuencia de HFR. De este
modo, a una tasa de transmisión de bites dada, la frecuencia de
cruce se selecciona de tal manera que se consigue para material
típico de programa un buen intercambio entre artefactos
introducidos por el códec de núcleo y artefactos introducidos por
el sistema de HFR. Claramente, tal ajuste estático puede estar
lejos del óptimo para una señal particular: el códec de núcleo o
bien está sobrecargado, dando como resultado artefactos de banda
baja más altos de lo necesario, lo que inherente al método de HFR
también degrada la calidad de banda alta, o bien no está en uso a
su pleno potencial, es decir, se emplea un intervalo de frecuencia
de HFR más grande de lo necesario. Por consiguiente, el rendimiento
máximo del sistema conjunto de cifrado sólo se alcanza
ocasionalmente mediante sistemas de la técnica anterior. Además, no
se explota la posibilidad de alinear el cruce hasta transiciones
entre regiones con propiedades espectrales dispares, tales como
regiones tonal y en forma de ruido.
La presente invención proporciona un nuevo método
definido por las reivindicaciones independientes 6, 8 y un aparato
definido por las reivindicaciones independientes 1, 7 para la
mejora de sistemas de cifrado en los que se usan métodos de
reconstrucción de alta frecuencia (HFR). La invención parte del uso
tradicional de una frecuencia fija de cruce entre la banda baja, en
la que se usan esquemas de cifrado convencionales (tales como MPEG
Layer-3 o AAC), y la banda alta, en la que se usan
esquemas de cifrado de HFR, mediante la continua estimación y
aplicación de la frecuencia de cruce que produce el intercambio
óptimo entre artefactos introducidos por el códec de banda baja y el
sistema de HFR respectivamente. De acuerdo con la invención, la
elección se puede basar en una medición del grado de dificultad de
codificar una señal con el códec de núcleo, una detección de
demanda de bites de corta duración y un análisis espectral de
tonalidad o cualquier combinación de los mismos. La medición de
dificultad se puede derivar desde la entropía perceptual o la
distorsión relevante psicoacústicamente de códec de núcleo. Ya que
la elección óptima cambia frecuentemente a lo largo del tiempo, la
aplicación de una frecuencia variable de cruce tiene como resultado
una calidad de audio sustancialmente mejorada que también es menos
dependiente de las características materiales de programa. La
invención es aplicable a sistemas de HFR de un extremo y de dos
extremos.
La presente invención se describirá ahora a modo
de ejemplos ilustrativos, no limitando el alcance o el espíritu de
la invención, con referencia a los dibujos que se acompañan, en los
que:
La figura 1 es una gráfica que ilustra los
términos banda baja, banda alta y frecuencia de cruce.
La figura 2 es una gráfica que ilustra una
medición de carga de trabajo de códec de núcleo.
La figura 3 es una gráfica que ilustra
variaciones de demanda de bites de corta duración de un códec de
tasa de transmisión de bites constante.
La figura 4 es una gráfica que ilustra la
división de una señal en intervalos de frecuencia tonal y en forma
de ruido.
La figura 5 es un diagrama de bloques de un
codificador basado en HFR, perfeccionado por un módulo de control de
frecuencia de cruce.
La figura 6 es un diagrama de bloques, que
ilustra en detalle el módulo de control de frecuencia de cruce.
La figura 7 es un diagrama de bloques del
correspondiente decodificador basado en HFR.
Las realizaciones descritas posteriormente son
meramente ilustrativas para los principios de la presente invención.
Se entiende que para los expertos en la técnica serán evidentes
modificaciones y variaciones de las disposiciones y los detalles
descritos aquí. Se intenta, por lo tanto, estar limitado sólo por el
alcance de las inminentes reivindicaciones de patente y no por los
detalles específicos presentados aquí a modo de descripción y
explicación de las realizaciones.
En un sistema en el que la banda baja o intervalo
de baja frecuencia, 101 como se da en la figura 1, se codifica
mediante un códec de núcleo y la banda alta o intervalo de alta
frecuencia, 102, se cubre mediante un método de HFR adecuado, la
frontera entre los dos intervalos se puede definir como la
frecuencia de cruce, 103. Puesto que los esquemas de codificación
funcionan fotograma a fotograma, en forma de bloques, uno es libre
de cambiar la frecuencia de cruce para cada fotograma procesado. De
acuerdo con la presente invención, es posible establecer un
algoritmo de detección que adapta la frecuencia de cruce de tal
manera que se consigue la calidad óptima para el sistema combinado
de cifrado. La implantación del mismo se denomina aquí en lo
sucesivo módulo de control de frecuencia de cruce.
Teniendo en cuenta que la calidad de audio del
códec de núcleo también es la base para la calidad de la banda alta
reconstruida, es obvio que se desea una calidad de audio buena y
constante en el intervalo de banda baja. Bajando la frecuencia de
cruce, el intervalo de frecuencia con el que tiene que operar el
códec de núcleo es más pequeño, y de este modo más fácil de
codificar. De este modo, midiendo el grado de dificultad de
codificar un fotograma y ajustar la frecuencia de cruce de acuerdo
con ello, se puede conseguir una calidad más constante de audio del
codificador de núcleo.
Como ejemplo de cómo medir el grado de
dificultad, se puede usar la entropía perceptual [ISO/IEC
13818-7, Anexo B.2.1]: aquí se aplica un modelo
psicoacústico basado en un análisis espectral. Habitualmente, las
líneas espectrales del banco de filtro de análisis están agrupadas
en bandas, en las que el número de líneas en una banda depende de
la frecuencia central de banda y se escoge de acuerdo con la bien
conocida escala de Bark, persiguiendo una resolución de frecuencia
perceptualmente constante para todas las bandas. Usando un modelo
psicoacústico que explota efectos tales como el enmascaramiento
espectral o temporal, se obtienen umbrales de audibilidad para cada
banda. La entropía perceptual en una banda está dada entonces
por
(Ec. 1)e(b)=
\frac{1}{2}\sum\limits^{L(b)-1}_{i=0}log_{2}(r(i))+l
en la
que
r(i)=s(i)\frac{L(b)}{t(b)}
e i = índice de línea espectral en banda
actual,
s(i) = valor espectral de la línea i,
L(b) = número de líneas en banda
actual,
t(b) = umbral psicoacústico para banda
actual,
b = índice de banda,
l = número de líneas en banda actual de tal
manera que r(i)>1,0;
y sólo se usan en la suma términos tales que
r(i)>1,0.
Sumando las entropías perceptuales de todas las
bandas que tienen que ser cifradas en el intervalo de frecuencia de
banda baja, se obtiene una medición de la dificultad de
codificación para el fotograma actual.
Un enfoque similar es calcular la energía de
distorsión en el extremo del proceso de codificación de códec de
núcleo sumando la energía de distorsión de todas las bandas de
acuerdo con
(Ec.
2)n_{tot}=\sum\limits^{B-1}_{b=0}n(b)
en la
que
y n_{q}(b) = energía de ruido de
cuantización,
t(b) = umbral psicoacústico,
b = índice de banda,
B = número de bandas.
Además, la energía de distorsión se puede
ponderar mediante una curva de sonoridad, con el fin de ponderar la
verdadera distorsión con su relevancia psicoacústica. Como ejemplo,
la suma de la ecuación 2 se puede modificar a
(Ec.
3)n'_{tot}=\sum\limits^{B-1}_{b=0}(n(b))^{0,23}
en la que se usa una simplificación de una
función de sonoridad de acuerdo con Zwicker
["Psychoacoustics", Eberhard Zwicker y Hugo Fastl,
Springer-Verlag, Berlín
1990].
Se puede definir entonces una dificultad de
codificación o medición de carga de trabajo en función de la
distorsión total. La figura 2 da un ejemplo de la energía de
distorsión de un códec perceptual de audio, y una correspondiente
medición de carga de trabajo, en el que se ha usado una recurrencia
no lineal para calcular la carga de trabajo. Se puede observar que
la carga de trabajo muestra desviaciones altas a lo largo del tiempo
y es dependiente de las características del material de entrada.
La alta entropía perceptual o la alta energía de
distorsión indica que una señal es psicoacústicamente difícil de
cifrar con una tasa de transmisión de bites limitada, y es probable
que aparezcan artefactos audibles en la banda baja. En este caso,
el módulo de control de frecuencia de cruce señalizará el uso de una
frecuencia más baja de cruce con el fin de hacer más fácil que el
codificador perceptual de audio opere con la señal dada.
Simultáneamente, una baja entropía perceptual o una baja energía de
distorsión indica una señal fácil de cifrar. De este modo, la
frecuencia de cruce se escogerá más alta con el fin de permitir un
intervalo más amplio de frecuencia para la banda baja, reduciendo
por ello artefactos que es probable que se introduzcan en la banda
alta debido a las capacidades limitadas de cualquier método
existente de HFR. Ambos enfoques permiten también el uso de un
enfoque de análisis-por-síntesis
volviendo a codificar el fotograma actual si se ha señalizado en la
etapa de análisis un ajuste de la frecuencia de cruce. Sin embargo,
puesto que se usan transformadas de solapamiento en la mayoría de
códeces de audio del estado de la técnica, el rendimiento del
sistema se puede mejorar aplicando un aplanamiento de los parámetros
de entrada de análisis a lo largo del tiempo, con el fin de evitar
una conmutación demasiado frecuente de la frecuencia de cruce, que
causaría efectos de bloqueo. Si la verdadera implantación no
necesita ser optimizada en términos de retardo de procesamiento, el
algoritmo de detección se puede mejorar adicionalmente usando una
visión más adelantada en el tiempo, ofreciendo la posibilidad de
encontrar puntos en el tiempo en los que se pueden hacer
desplazamientos con un mínimo de artefactos de conmutación. Las
aplicaciones que no son en tiempo real representan un caso especial
de esto, en el que se puede analizar, si se desea, toda la fila que
ha de ser codificada.
En el caso de un códec de audio de tasa de
transmisión de bites constante (CBR), se puede usar como parámetro
adicional de entrada en la decisión de cruce un análisis de
variación de demanda de bites de corta duración: codificadores de
audio del estado de la técnica tales como el MPEG
Layer-3 o el MPEG-2 AAC usan una
técnica de depósito de bites con el fin de compensar desviaciones de
demanda de bites de pico de corta duración a partir del número
medio de bites disponibles por fotograma. La llenura de tal
depósito de bites indica si el codificador de núcleo es capaz o no
de operar bien con un fotograma entrante difícil de codificar. Un
ejemplo práctico del número de bites usados por fotograma y de la
llenura del depósito de bites a lo largo del tiempo se da en la
figura 3. De este modo, si la llenura del depósito de bites es alta,
el codificador de núcleo será capaz de manejar un fotograma difícil
y no hay necesidad de escoger una frecuencia más baja de cruce.
Simultáneamente, si la llenura del depósito de bites es baja, la
calidad resultante de audio se puede mejorar sustancialmente en los
fotogramas siguientes bajando la frecuencia de cruce, con el fin de
reducir la demanda de bites del codificador de núcleo, de tal
manera que el depósito de bites se puede llenar debido al intervalo
más pequeño de frecuencia que se tiene que codificar. De nuevo, una
visión muy adelantada puede mejorar el método de detección puesto
que el comportamiento de la llenura del depósito de bites se puede
predecir con mucha antelación.
Aparte de la dificultad de codificación del
fotograma actual, otro parámetro importante en el que basar la
elección de la frecuencia de cruce se describe como viene a
continuación: un gran número de señales de audio tales como voz o
algunos instrumentos de música muestran la propiedad de que el
intervalo espectral se puede dividir en un intervalo graduado o
tonal y un intervalo en forma de ruido. La figura 4 muestra el
espectro de una señal de entrada de audio en la que esta propiedad
es claramente evidente. Usando métodos de análisis de ruido y/o de
tonalidad en el dominio espectral, se pueden detectar dos
intervalos, que se pueden clasificar respectivamente como tonal y en
forma de ruido. La tonalidad se puede calcular como se da, por
ejemplo, en la norma AAC [ISO/IEC 13818-7: 1997
(E), págs. 96-98, sección B.2.1.4 "Steps in
threshold calculation"]. Otros algoritmos bien conocidos de
detección de ruido o de tonalidad, tales como la medición de
planicie espectral, también son adecuados para este propósito. De
este modo, la frecuencia de cruce entre estos intervalos se usa
como frecuencia de cruce en el contexto de la presente invención con
el fin de separar mejor los intervalos espectrales en forma de
ruido y tonal y alimentarlos separadamente al codificador de núcleo
y al método de HFR respectivamente. Por consiguiente, la calidad
global de audio del sistema combinado de códec se puede mejorar
sustancialmente en tales casos.
Claramente, los métodos anteriores son aplicables
igualmente a sistemas de HFR de dos extremos y de un extremo. En
este último caso, sólo se transmite una banda baja de anchura de
banda variable, codificada por el códec de núcleo. El decodificador
de HFR extrapola entonces una envolvente a partir de la frecuencia
de corte de banda baja y hacia arriba. Además, la presente invención
es aplicable a sistemas en los que la banda alta se genera mediante
métodos arbitrarios diferentes al que se usa para el cifrado de la
banda baja.
Adaptar la frecuencia de inicio de HFR a la
anchura de banda variable de la señal de banda baja sería una tarea
muy tediosa cuando se aplican métodos convencionales de
transposición tales como la traducción de frecuencia. Esos métodos
implican generalmente el filtrado de la señal de banda baja para
extraer una señal de paso banda o de paso bajo que
subsiguientemente se modula en el dominio de tiempo, causando un
desplazamiento de frecuencia. De este modo, una adaptación
incorporaría la conmutación de filtros de paso banda o de paso bajo
y cambios en la frecuencia de modulación. Además, un cambio de
filtro causa discontinuidades en la señal de salida, que incita al
uso de técnicas de formación de ventanas. Sin embargo, en un sistema
basado en bancos de filtro, el filtrado se consigue automáticamente
mediante la extracción de señales de sub- banda a partir de un
conjunto de bandas de filtro consecutivas. Se obtiene entonces un
equivalente a la modulación de dominio de tiempo, por medio del
reparcheamiento de las señales de sub-banda
extraídas dentro del banco de filtro. El reparcheamiento se adapta
fácilmente a la frecuencia de cruce variable y la formación de
ventanas antedicha es inherente al dominio de
sub-banda, de manera que el cambio de parámetros de
traducción se consigue con poca complejidad adicional.
La figura 5 muestra un ejemplo del lado de
codificador de un códec basado en HFR, perfeccionado de acuerdo con
la presente invención. La señal analógica de entrada se alimenta a
un convertidor A/D 501, que forma una señal digital. La señal
digital de audio se alimenta a un codificador 502 de núcleo, en el
que se realiza un cifrado de fuente. Además, la señal digital se
alimenta a un codificador 503 de envolvente de HFR. La salida del
codificador de envolvente de HFR representa los datos de envolvente
que cubren la banda alta 102 que empieza en la frecuencia 103 de
cruce como se ilustra en la figura 1. El número de bites que se
necesita para los datos de envolvente en el codificador de
envolvente se pasa al codificador de núcleo con el fin de ser
restados de los bites disponibles totales para un fotograma dado.
El codificador de núcleo codificará entonces el restante intervalo
de frecuencia de banda baja hasta la frecuencia de cruce. Como se
enseña mediante la presente invención, se añade un módulo 504 de
control de frecuencia de cruce al codificador. Una representación
de dominio de frecuencia y/o de tiempo de la señal de entrada, así
como señales de estado del códec de núcleo, se alimentan al módulo
de control de frecuencia de cruce. La salida del módulo 504, en
forma de elección óptima de la frecuencia de cruce, se alimenta a
los codificadores de envolvente y de núcleo con el fin de señalizar
los intervalos de frecuencia que se codificarán. El intervalo de
frecuencia para cada uno de los dos esquemas de cifrado también se
codifica por ejemplo mediante un eficiente esquema de consulta de
tablas. Si el intervalo de frecuencia entre dos fotogramas
subsiguientes no cambia, esto se puede señalizar mediante un único
bit con el fin de mantener el gasto de tasa de transmisión de bites
lo más pequeño posible. Por consiguiente, los intervalos de
frecuencia no tienen que ser transmitidos explícitamente en cada
fotograma. Los datos codificados de ambos codificadores se
alimentan entonces al multiplexor, formando una corriente de bites
en serie que se transmite o se almacena.
La figura 6 da un ejemplo de subsistemas dentro
del módulo 504 y 601, respectivamente, de control de frecuencia de
cruce. Un módulo 602 de análisis de mediciones de carga de trabajo
del codificador explora lo difícil que es para el codificador de
núcleo codificar el fotograma actual, usando, por ejemplo, el
enfoque de energía de distorsión o de entropía perceptual como se
describió anteriormente. Siempre que el códec de núcleo emplee un
depósito de bites, se puede incluir un módulo 603 de análisis de
llenura de memoria intermedia. Un módulo 604 de análisis de
tonalidad señaliza una frecuencia objetivo de cruce que corresponde
a la frecuencia de transición tonal/ruido cuando sea de aplicación.
Todos los parámetros de entrada al módulo conjunto 606 de decisión
se combinan y equilibran de acuerdo con la verdadera implantación de
los códeces de núcleo y de HFR usados cuando se calcula la
frecuencia de cruce a usar, con el fin de obtener el máximo
rendimiento global.
El correspondiente lado de decodificador se
muestra en la figura 7. El demultiplexor 701 separa las señales de
corriente de bites en datos de códec de núcleo, que se alimentan al
decodificador 702 de núcleo, y datos de envolvente, que se
alimentan al decodificador 703 de envolvente de HFR. El
decodificador de núcleo produce una señal que cubre el intervalo de
frecuencia de banda baja. Similarmente, el decodificador de
envolvente de HFR decodifica los datos en una representación de la
envolvente espectral para el intervalo de frecuencia de banda alta.
Los datos de envolvente decodificados se alimentan entonces al
módulo 704 de control de ganancia. La señal de banda baja procedente
del decodificador de núcleo se encamina al módulo 705 de
transposición, que, en base a la frecuencia de cruce, genera una
señal replicada de banda alta a partir de la banda baja. La señal
de banda alta se alimenta al módulo de control de ganancia con el
fin de ajustar la envolvente espectral de banda alta a la de la
envolvente transmitida. La salida es, de este modo, una señal
ajustada de envolvente, de audio de banda alta. Esta señal se suma
a la salida procedente de la unidad 706 de retardo, que se alimenta
con la señal de audio de banda baja mientras que el retardo
compensa el tiempo de procesamiento de la señal de banda alta.
Finalmente, la señal digital obtenida de banda ancha se convierte
en una señal analógica de audio en el convertidor D/A 707.
Claims (8)
1. Un aparato para codificar una señal de audio
para obtener una señal de audio codificada para ser usada por un
decodificador que tiene un módulo de reconstrucción de alta
frecuencia para realizar una reconstrucción de alta frecuencia para
un intervalo de frecuencia por encima de una frecuencia de cruce,
comprendiendo el aparato:
un codificador (502) de núcleo para codificar una
banda de frecuencia más baja de la señal de audio hasta la
frecuencia de cruce, en el que la frecuencia de cruce es variable y
en el que el codificador de núcleo es accionable fotograma a
fotograma en forma de bloques; y
un módulo (504) de control de frecuencia de cruce
para estimar, dependiendo de una medición del grado de dificultad
para codificar la señal de audio mediante el codificador (502) de
núcleo y/o dependiendo de una frontera entre un intervalo de
frecuencia tonal y en forma de ruido de la señal de audio, una
frecuencia de cruce que se ha de seleccionar mediante el codificador
(502) de núcleo para un fotograma de una serie de fotogramas
subsiguientes, de manera que la frecuencia de cruce es variable
adaptativamente a lo largo del tiempo para la serie de fotogramas
subsiguientes.
2. Un aparato de acuerdo con la reivindicación 1,
en el que la medición se basa en una entropía perceptual de la señal
de audio.
3. Un aparato de acuerdo con la reivindicación 1,
en el que la medición se basa en una energía de distorsión después
de codificar con el codificador de núcleo.
4. Un aparato de acuerdo con la reivindicación 1,
en el que la medición se basa en un estado de un depósito de bites
asociado con el codificador de núcleo.
5. Un aparato de acuerdo con las reivindicaciones
1-4, en el que cualquier combinación de entropía
perceptual, distorsión de codificador de núcleo y estado de
depósito de bites de codificador de núcleo se usa para obtener la
frecuencia de cruce que se ha de seleccionar mediante el
codificador (502) de núcleo para un fotograma.
6. Un método para codificar una señal de audio
para obtener una señal de audio codificada para ser usada por un
decodificador que tiene un módulo de reconstrucción de alta
frecuencia para realizar una reconstrucción de alta frecuencia para
un intervalo de frecuencia por encima de una frecuencia de cruce,
comprendiendo el método los siguientes pasos:
codificar en núcleo una banda de frecuencia más
baja de la señal de audio hasta una frecuencia de cruce, en el que
la frecuencia de cruce es variable y en el que la codificación de
núcleo tiene lugar fotograma a fotograma en forma de bloques; y
estimar, dependiendo de una medición del grado de
dificultad para codificar la señal de audio en el paso de
codificación de núcleo y/o dependiendo de una frontera entre un
intervalo de frecuencia tonal y en forma de ruido de la señal de
audio, una frecuencia de cruce que se ha de seleccionar en el paso
de codificación de núcleo para un fotograma de una serie de
fotogramas subsiguientes, de manera que la frecuencia de cruce se
varía adaptativamente a lo largo del tiempo para la serie de
fotogramas subsiguientes.
7. Un aparato para decodificar una señal de audio
codificada, habiendo sido codificada la señal de audio codificada
usando una frecuencia variable de cruce, incluyendo la señal de
audio codificada una información sobre una frecuencia de cruce que
es variable adaptativamente a lo largo del tiempo, comprendiendo el
aparato para decodi-
ficar:
ficar:
un demultiplexor (701) de corriente de bites para
extraer datos de decodificador de núcleo, datos de envolvente y la
información sobre la frecuencia variable de cruce;
un decodificador (702) de núcleo para recibir los
datos de decodificador de núcleo desde el demultiplexor de
corriente de bites y para emitir datos de banda baja que tienen una
frecuencia de cruce que varía oportunamente;
un decodificador (703) de envolvente de
regeneración de alta frecuencia para recibir los datos de envolvente
del demultiplexor (701) de corriente de bites y para producir una
salida de envolvente espectral;
un módulo (705) de transposición para recibir la
información sobre la frecuencia variable de cruce y para generar una
señal replicada de banda alta a partir de los datos de banda baja
en base a la información sobre la frecuencia variable de cruce;
un módulo (704) de control de ganancia que
responde al decodificador de envolvente de regeneración de alta
frecuencia para ajustar la señal replicada de banda alta a una
envolvente espectral emitida por el decodificador de envolvente de
regeneración de alta frecuencia para obtener una señal ajustada de
banda alta de envolvente; y
un sumador para sumar una versión retardada de
los datos de banda baja y la señal ajustada de banda alta de
envolvente para obtener una señal digital de banda ancha.
8. Un método para decodificar una señal de audio
codificada, habiendo sido codificada la señal de audio codificada
usando una frecuencia variable de cruce, incluyendo la señal de
audio codificada una información sobre una frecuencia de cruce que
es variable adaptativamente a lo largo del tiempo, comprendiendo el
método para decodificar los siguientes pasos:
extraer (701) datos de decodificador de núcleo,
datos de envolvente y la información sobre la frecuencia variable de
cruce a partir de la señal de audio codificada;
recibir los datos de decodificador de núcleo
desde un demultiplexor de corriente de bites y emitir datos de banda
baja que tienen una frecuencia de cruce que varía oportunamente por
medio de un decodificador (702) de núcleo;
recibir los datos de envolvente y producir una
salida de envolvente espectral por medio de un decodificador (703)
de envolvente de regeneración de alta frecuencia;
recibir la información sobre la frecuencia
variable de cruce y generar una señal replicada de banda alta a
partir de los datos de banda baja en base a la información sobre la
frecuencia variable de cruce por medio de un módulo (705) de
transposición;
ajustar la señal replicada de banda alta a una
envolvente espectral emitida por el decodificador (703) de
envolvente de regeneración de alta frecuencia para obtener una
señal ajustada de banda alta de envolvente, por medio de un módulo
(704) de control de ganancia; y
sumar una versión retardada de los datos de banda
baja y la señal ajustada de banda alta de envolvente para obtener
una señal digital de banda ancha.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SE0004187A SE0004187D0 (sv) | 2000-11-15 | 2000-11-15 | Enhancing the performance of coding systems that use high frequency reconstruction methods |
SE0004187 | 2000-11-15 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2218462T3 true ES2218462T3 (es) | 2004-11-16 |
Family
ID=20281835
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES01983888T Expired - Lifetime ES2218462T3 (es) | 2000-11-15 | 2001-11-14 | Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. |
Country Status (15)
Country | Link |
---|---|
US (1) | US7050972B2 (es) |
EP (1) | EP1334484B1 (es) |
JP (6) | JP3983668B2 (es) |
KR (1) | KR100551862B1 (es) |
CN (1) | CN1232950C (es) |
AT (1) | ATE267445T1 (es) |
AU (1) | AU2002215282A1 (es) |
DE (1) | DE60103424T2 (es) |
DK (1) | DK1334484T3 (es) |
ES (1) | ES2218462T3 (es) |
HK (1) | HK1058096A1 (es) |
PT (1) | PT1334484E (es) |
SE (1) | SE0004187D0 (es) |
TR (1) | TR200401631T4 (es) |
WO (1) | WO2002041302A1 (es) |
Families Citing this family (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
AUPR433901A0 (en) | 2001-04-10 | 2001-05-17 | Lake Technology Limited | High frequency signal construction method |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
EP1423847B1 (en) | 2001-11-29 | 2005-02-02 | Coding Technologies AB | Reconstruction of high frequency components |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US20030187663A1 (en) | 2002-03-28 | 2003-10-02 | Truman Michael Mead | Broadband frequency translation for high frequency regeneration |
KR100605824B1 (ko) | 2002-05-13 | 2006-07-31 | 삼성전자주식회사 | 부호분할다중접속 이동통신시스템의 방송서비스 방법 |
US7447631B2 (en) | 2002-06-17 | 2008-11-04 | Dolby Laboratories Licensing Corporation | Audio coding system using spectral hole filling |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7318027B2 (en) | 2003-02-06 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Conversion of synthesized spectral components for encoding and low-complexity transcoding |
FR2852172A1 (fr) * | 2003-03-04 | 2004-09-10 | France Telecom | Procede et dispositif de reconstruction spectrale d'un signal audio |
JP2004309921A (ja) * | 2003-04-09 | 2004-11-04 | Sony Corp | 符号化装置、符号化方法及びプログラム |
US7318035B2 (en) * | 2003-05-08 | 2008-01-08 | Dolby Laboratories Licensing Corporation | Audio coding systems and methods using spectral component coupling and spectral component regeneration |
DE10328777A1 (de) * | 2003-06-25 | 2005-01-27 | Coding Technologies Ab | Vorrichtung und Verfahren zum Codieren eines Audiosignals und Vorrichtung und Verfahren zum Decodieren eines codierten Audiosignals |
US20050004793A1 (en) * | 2003-07-03 | 2005-01-06 | Pasi Ojala | Signal adaptation for higher band coding in a codec utilizing band split coding |
US20050018796A1 (en) * | 2003-07-07 | 2005-01-27 | Sande Ravindra Kumar | Method of combining an analysis filter bank following a synthesis filter bank and structure therefor |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
DE102004009949B4 (de) | 2004-03-01 | 2006-03-09 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes |
BRPI0607646B1 (pt) | 2005-04-01 | 2021-05-25 | Qualcomm Incorporated | Método e equipamento para encodificação por divisão de banda de sinais de fala |
PL1875463T3 (pl) | 2005-04-22 | 2019-03-29 | Qualcomm Incorporated | Układy, sposoby i urządzenie do wygładzania współczynnika wzmocnienia |
DE602006011600D1 (de) * | 2005-04-28 | 2010-02-25 | Panasonic Corp | Audiocodierungseinrichtung und audiocodierungsverfahren |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US20080109215A1 (en) * | 2006-06-26 | 2008-05-08 | Chi-Min Liu | High frequency reconstruction by linear extrapolation |
US8214202B2 (en) * | 2006-09-13 | 2012-07-03 | Telefonaktiebolaget L M Ericsson (Publ) | Methods and arrangements for a speech/audio sender and receiver |
JP4918841B2 (ja) * | 2006-10-23 | 2012-04-18 | 富士通株式会社 | 符号化システム |
US8295507B2 (en) * | 2006-11-09 | 2012-10-23 | Sony Corporation | Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium |
KR101355376B1 (ko) | 2007-04-30 | 2014-01-23 | 삼성전자주식회사 | 고주파수 영역 부호화 및 복호화 방법 및 장치 |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
CN101939782B (zh) | 2007-08-27 | 2012-12-05 | 爱立信电话股份有限公司 | 噪声填充与带宽扩展之间的自适应过渡频率 |
KR101235830B1 (ko) * | 2007-12-06 | 2013-02-21 | 한국전자통신연구원 | 음성코덱의 품질향상장치 및 그 방법 |
EP2077551B1 (en) | 2008-01-04 | 2011-03-02 | Dolby Sweden AB | Audio encoder and decoder |
CN101281748B (zh) * | 2008-05-14 | 2011-06-15 | 武汉大学 | 用编码索引实现的空缺子带填充方法及编码索引生成方法 |
BRPI0910511B1 (pt) * | 2008-07-11 | 2021-06-01 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Aparelho e método para decodificar e codificar um sinal de áudio |
EP2304719B1 (en) | 2008-07-11 | 2017-07-26 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder, methods for providing an audio stream and computer program |
JP5551694B2 (ja) | 2008-07-11 | 2014-07-16 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | 多くのスペクトルエンベロープを計算するための装置および方法 |
MY153562A (en) | 2008-07-11 | 2015-02-27 | Fraunhofer Ges Forschung | Method and discriminator for classifying different segments of a signal |
US8326640B2 (en) * | 2008-08-26 | 2012-12-04 | Broadcom Corporation | Method and system for multi-band amplitude estimation and gain control in an audio CODEC |
JP2010079275A (ja) * | 2008-08-29 | 2010-04-08 | Sony Corp | 周波数帯域拡大装置及び方法、符号化装置及び方法、復号化装置及び方法、並びにプログラム |
EP2359366B1 (en) | 2008-12-15 | 2016-11-02 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio encoder and bandwidth extension decoder |
JP5446258B2 (ja) * | 2008-12-26 | 2014-03-19 | 富士通株式会社 | オーディオ符号化装置 |
EP2380172B1 (en) | 2009-01-16 | 2013-07-24 | Dolby International AB | Cross product enhanced harmonic transposition |
JP4977157B2 (ja) * | 2009-03-06 | 2012-07-18 | 株式会社エヌ・ティ・ティ・ドコモ | 音信号符号化方法、音信号復号方法、符号化装置、復号装置、音信号処理システム、音信号符号化プログラム、及び、音信号復号プログラム |
BRPI1009467B1 (pt) | 2009-03-17 | 2020-08-18 | Dolby International Ab | Sistema codificador, sistema decodificador, método para codificar um sinal estéreo para um sinal de fluxo de bits e método para decodificar um sinal de fluxo de bits para um sinal estéreo |
JP4932917B2 (ja) * | 2009-04-03 | 2012-05-16 | 株式会社エヌ・ティ・ティ・ドコモ | 音声復号装置、音声復号方法、及び音声復号プログラム |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
WO2011048010A1 (en) | 2009-10-19 | 2011-04-28 | Dolby International Ab | Metadata time marking information for indicating a section of an audio object |
EP2559032B1 (en) * | 2010-04-16 | 2019-01-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and computer program for generating a wideband signal using guided bandwidth extension and blind bandwidth extension |
US12002476B2 (en) | 2010-07-19 | 2024-06-04 | Dolby International Ab | Processing of audio signals during high frequency reconstruction |
ES2942867T3 (es) | 2010-07-19 | 2023-06-07 | Dolby Int Ab | Procesamiento de señales de audio durante la reconstrucción de alta frecuencia |
EP2466580A1 (en) * | 2010-12-14 | 2012-06-20 | Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. | Encoder and method for predictively encoding, decoder and method for decoding, system and method for predictively encoding and decoding and predictively encoded information signal |
CN102208188B (zh) | 2011-07-13 | 2013-04-17 | 华为技术有限公司 | 音频信号编解码方法和设备 |
US9437213B2 (en) * | 2012-03-05 | 2016-09-06 | Malaspina Labs (Barbados) Inc. | Voice signal enhancement |
CN108831501B (zh) | 2012-03-21 | 2023-01-10 | 三星电子株式会社 | 用于带宽扩展的高频编码/高频解码方法和设备 |
EP2682941A1 (de) * | 2012-07-02 | 2014-01-08 | Technische Universität Ilmenau | Vorrichtung, Verfahren und Computerprogramm für frei wählbare Frequenzverschiebungen in der Subband-Domäne |
JPWO2014068817A1 (ja) * | 2012-10-31 | 2016-09-08 | 株式会社ソシオネクスト | オーディオ信号符号化装置及びオーディオ信号復号装置 |
AU2014211520B2 (en) | 2013-01-29 | 2017-04-06 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Low-frequency emphasis for LPC-based coding in frequency domain |
JP6019266B2 (ja) * | 2013-04-05 | 2016-11-02 | ドルビー・インターナショナル・アーベー | ステレオ・オーディオ・エンコーダおよびデコーダ |
TWI546799B (zh) | 2013-04-05 | 2016-08-21 | 杜比國際公司 | 音頻編碼器及解碼器 |
CN117253498A (zh) * | 2013-04-05 | 2023-12-19 | 杜比国际公司 | 音频信号的解码方法和解码器、介质以及编码方法 |
JP6305694B2 (ja) * | 2013-05-31 | 2018-04-04 | クラリオン株式会社 | 信号処理装置及び信号処理方法 |
SG11201510513WA (en) * | 2013-06-21 | 2016-01-28 | Fraunhofer Ges Forschung | Method and apparatus for obtaining spectrum coefficients for a replacement frame of an audio signal, audio decoder, audio receiver and system for transmitting audio signals |
EP3291233B1 (en) | 2013-09-12 | 2019-10-16 | Dolby International AB | Time-alignment of qmf based processing data |
CN104681029B (zh) * | 2013-11-29 | 2018-06-05 | 华为技术有限公司 | 立体声相位参数的编码方法及装置 |
US20150194157A1 (en) * | 2014-01-06 | 2015-07-09 | Nvidia Corporation | System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals |
CA3016837C (en) * | 2016-03-07 | 2021-09-28 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Hybrid concealment method: combination of frequency and time domain packet loss concealment in audio codecs |
US11997339B2 (en) | 2020-01-15 | 2024-05-28 | Dolby International Ab | Adaptive streaming of media content with bitrate switching |
CN116348951A (zh) * | 2020-07-30 | 2023-06-27 | 弗劳恩霍夫应用研究促进协会 | 用于编码音频信号或用于解码经编码音频场景的设备、方法及计算机程序 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4158751A (en) * | 1978-02-06 | 1979-06-19 | Bode Harald E W | Analog speech encoder and decoder |
JPS595297A (ja) * | 1982-07-01 | 1984-01-12 | 日本電気株式会社 | 帯域分割型ボコ−ダ |
NL8700985A (nl) * | 1987-04-27 | 1988-11-16 | Philips Nv | Systeem voor sub-band codering van een digitaal audiosignaal. |
US5285498A (en) * | 1992-03-02 | 1994-02-08 | At&T Bell Laboratories | Method and apparatus for coding audio signals based on perceptual model |
JP3297750B2 (ja) * | 1992-03-18 | 2002-07-02 | ソニー株式会社 | 符号化方法 |
JP3218679B2 (ja) * | 1992-04-15 | 2001-10-15 | ソニー株式会社 | 高能率符号化方法 |
US5404377A (en) * | 1994-04-08 | 1995-04-04 | Moses; Donald W. | Simultaneous transmission of data and audio signals by means of perceptual coding |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
JP3557674B2 (ja) * | 1994-12-15 | 2004-08-25 | ソニー株式会社 | 高能率符号化方法及び装置 |
US5646961A (en) * | 1994-12-30 | 1997-07-08 | Lucent Technologies Inc. | Method for noise weighting filtering |
JPH09172376A (ja) * | 1995-12-20 | 1997-06-30 | Hitachi Ltd | 量子化ビット割当て装置 |
JP3255022B2 (ja) * | 1996-07-01 | 2002-02-12 | 日本電気株式会社 | 適応変換符号化方式および適応変換復号方式 |
US6490562B1 (en) * | 1997-04-09 | 2002-12-03 | Matsushita Electric Industrial Co., Ltd. | Method and system for analyzing voices |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
US5928342A (en) * | 1997-07-02 | 1999-07-27 | Creative Technology Ltd. | Audio effects processor integrated on a single chip with a multiport memory onto which multiple asynchronous digital sound samples can be concurrently loaded |
DE19730130C2 (de) * | 1997-07-14 | 2002-02-28 | Fraunhofer Ges Forschung | Verfahren zum Codieren eines Audiosignals |
US6385548B2 (en) * | 1997-12-12 | 2002-05-07 | Motorola, Inc. | Apparatus and method for detecting and characterizing signals in a communication system |
US6757395B1 (en) * | 2000-01-12 | 2004-06-29 | Sonic Innovations, Inc. | Noise reduction apparatus and method |
AU2001296459A1 (en) * | 2000-10-02 | 2002-04-15 | Clarity, L.L.C. | Audio visual speech processing |
-
2000
- 2000-11-15 SE SE0004187A patent/SE0004187D0/xx unknown
-
2001
- 2001-11-14 AU AU2002215282A patent/AU2002215282A1/en not_active Abandoned
- 2001-11-14 DK DK01983888T patent/DK1334484T3/da active
- 2001-11-14 DE DE60103424T patent/DE60103424T2/de not_active Expired - Lifetime
- 2001-11-14 AT AT01983888T patent/ATE267445T1/de active
- 2001-11-14 EP EP01983888A patent/EP1334484B1/en not_active Expired - Lifetime
- 2001-11-14 WO PCT/SE2001/002533 patent/WO2002041302A1/en active IP Right Grant
- 2001-11-14 JP JP2002543428A patent/JP3983668B2/ja not_active Expired - Fee Related
- 2001-11-14 ES ES01983888T patent/ES2218462T3/es not_active Expired - Lifetime
- 2001-11-14 CN CNB018189725A patent/CN1232950C/zh not_active Expired - Lifetime
- 2001-11-14 TR TR2004/01631T patent/TR200401631T4/xx unknown
- 2001-11-14 KR KR1020037006583A patent/KR100551862B1/ko active IP Right Grant
- 2001-11-14 PT PT01983888T patent/PT1334484E/pt unknown
- 2001-11-15 US US09/987,657 patent/US7050972B2/en not_active Expired - Lifetime
-
2003
- 2003-11-27 HK HK03108655A patent/HK1058096A1/xx not_active IP Right Cessation
-
2007
- 2007-05-30 JP JP2007142978A patent/JP4991397B2/ja not_active Expired - Lifetime
-
2011
- 2011-12-08 JP JP2011269144A patent/JP5933965B2/ja not_active Expired - Lifetime
-
2014
- 2014-01-09 JP JP2014002174A patent/JP6207404B2/ja not_active Expired - Lifetime
-
2016
- 2016-06-08 JP JP2016114496A patent/JP6368740B2/ja not_active Expired - Lifetime
-
2018
- 2018-07-09 JP JP2018129571A patent/JP6592148B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
HK1058096A1 (en) | 2004-04-30 |
KR20030076576A (ko) | 2003-09-26 |
JP6592148B2 (ja) | 2019-10-16 |
CN1232950C (zh) | 2005-12-21 |
JP2004514180A (ja) | 2004-05-13 |
CN1475010A (zh) | 2004-02-11 |
TR200401631T4 (tr) | 2004-09-21 |
DE60103424D1 (de) | 2004-06-24 |
WO2002041302A1 (en) | 2002-05-23 |
JP2018185530A (ja) | 2018-11-22 |
US20020103637A1 (en) | 2002-08-01 |
EP1334484A1 (en) | 2003-08-13 |
JP2012093774A (ja) | 2012-05-17 |
DE60103424T2 (de) | 2005-06-16 |
DK1334484T3 (da) | 2004-08-09 |
US7050972B2 (en) | 2006-05-23 |
EP1334484B1 (en) | 2004-05-19 |
JP2016189015A (ja) | 2016-11-04 |
JP2014089472A (ja) | 2014-05-15 |
KR100551862B1 (ko) | 2006-02-13 |
AU2002215282A1 (en) | 2002-05-27 |
JP4991397B2 (ja) | 2012-08-01 |
JP6207404B2 (ja) | 2017-10-04 |
JP6368740B2 (ja) | 2018-08-01 |
SE0004187D0 (sv) | 2000-11-15 |
PT1334484E (pt) | 2004-09-30 |
JP2007293354A (ja) | 2007-11-08 |
JP3983668B2 (ja) | 2007-09-26 |
ATE267445T1 (de) | 2004-06-15 |
JP5933965B2 (ja) | 2016-06-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
ES2218462T3 (es) | Mejora del rendimiento de sistemas de cifrado que usan metodos de reconstruccion de alta frecuencia. | |
KR100917464B1 (ko) | 대역 확장 기법을 이용한 디지털 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
JP5458189B2 (ja) | ノイズ補充と帯域拡張との間の遷移周波数の適合 | |
JP5593419B2 (ja) | 可逆マルチチャネル・オーディオ・コーデック | |
ES2307100T3 (es) | Metodos y aparatos de codificacion de audio mediante replicacion de banda espectral y reconstruccion de alta frecuencia que usan adicion adaptativa de un umbral minimo de ruido y limitacion de la sustitucion de ruido. | |
US20030215013A1 (en) | Audio encoder with adaptive short window grouping | |
EP1419501A1 (en) | An encoder programmed to add a data payload to a compressed digital audio frame | |
JP2002517019A (ja) | 信号の量子化変換係数をエントロピーエンコードするシステムと方法 | |
JP3964860B2 (ja) | ステレオオーディオの符号化方法、ステレオオーディオ符号化装置、ステレオオーディオの復号化方法、ステレオオーディオ復号化装置及びコンピュータで読み取り可能な記録媒体 | |
US20100121632A1 (en) | Stereo audio encoding device, stereo audio decoding device, and their method | |
US7444289B2 (en) | Audio decoding method and apparatus for reconstructing high frequency components with less computation | |
KR100923301B1 (ko) | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
KR100923300B1 (ko) | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
CN105261373A (zh) | 用于带宽扩展编码的自适应栅格构造方法和装置 | |
JPH09146593A (ja) | 音響信号符号化方法、音響信号復号化方法、音響信号符号化装置及び音響信号復号化装置 | |
ES2439693T3 (es) | Codificación de señales de múltiples canales | |
JP3352401B2 (ja) | オーディオ信号の符号化及び複号化方法及び装置 | |
Jbira et al. | Multi-layer scalable LPC audio format |