ES2324726T3 - Procedimiento para reducir el ruido de cuantificacion. - Google Patents
Procedimiento para reducir el ruido de cuantificacion. Download PDFInfo
- Publication number
- ES2324726T3 ES2324726T3 ES05790703T ES05790703T ES2324726T3 ES 2324726 T3 ES2324726 T3 ES 2324726T3 ES 05790703 T ES05790703 T ES 05790703T ES 05790703 T ES05790703 T ES 05790703T ES 2324726 T3 ES2324726 T3 ES 2324726T3
- Authority
- ES
- Spain
- Prior art keywords
- quantification
- devices
- tandem
- signals
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000011002 quantification Methods 0.000 title claims description 96
- 238000000034 method Methods 0.000 title claims description 37
- 238000013139 quantization Methods 0.000 claims abstract description 19
- 238000012545 processing Methods 0.000 claims abstract description 13
- 230000006835 compression Effects 0.000 claims description 28
- 238000007906 compression Methods 0.000 claims description 28
- 238000009826 distribution Methods 0.000 claims description 6
- 230000005236 sound signal Effects 0.000 claims description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 2
- 101710130550 Class E basic helix-loop-helix protein 40 Proteins 0.000 description 3
- 102100025314 Deleted in esophageal cancer 1 Human genes 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/85—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
- H04N19/89—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/40—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/46—Embedding additional information in the video signal during the compression process
- H04N19/467—Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/173—Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Peptides Or Proteins (AREA)
- Analogue/Digital Conversion (AREA)
Abstract
Procedimiento para reducir el ruido de cuantificación en tándem en un sistema (10; 300) que comprende una pluralidad de dispositivos (30, 70; 350, 370) de cuantificación acoplados en serie, caracterizándose el procedimiento por incluir las etapas de: (a) determinar zonas (290) de señal en las que tienen lugar errores de ruido en tándem para la cuantificación uniforme de la pluralidad de dispositivos (30, 70; 350, 370) de cuantificación; y (b) ajustar una característica de cuantificación no uniforme de al menos uno del uno o más dispositivos (30; 350) de cuantificación anteriores en el sistema (10; 300) para reducir el ruido en tándem que surge en el mismo desde dichas zonas de señal determinadas, no incluyendo dicho uno o más dispositivos (30; 350) de cuantificación anteriores un último dispositivo (70; 370) de cuantificación en serie en el sistema (10; 300).
Description
Procedimiento para reducir el ruido de
cuantificación.
La presente invención se refiere a
procedimientos para reducir el ruido de cuantificación; por ejemplo,
la invención se refiere más específicamente a procedimientos para
reducir el ruido de cuantificación en tándem que surge cuando una
pluralidad de fases de cuantificación de señal se acoplan entre sí
en una disposición en serie. Además, la presente invención se
refiere también a un aparato que puede hacerse funcionar para
implementar los procedimientos anteriormente mencionados. Además, la
presente invención se refiere a datos de salida cuantificados
generados mediante la ejecución de los procedimientos.
Los artefactos de codificación en tándem surgen
cuando los cuantificadores se acoplan en una disposición en serie.
Tales artefactos de codificación se encuentran, por ejemplo, cuando
se transcodifican señales multimedia, donde una componente dominante
de estos artefactos se conoce como "ruido de cuantificación en
tándem".
En la figura 1, se muestra un sistema de
producción de música actual indicado en general por 10. El sistema
10 comprende un almacén 20 de datos para proporcionar datos x de
contenido de programa modulados por codificación de impulsos (PCM)
indicados por 100. Asimismo, el sistema 10 comprende además un
primer codificador EN1 (Q_{1}) de cuantificación indicado por 30
que puede hacerse funcionar para proporcionar datos x_{b1}
codificados indicados por 110. El sistema 10 incluye un almacén AAC
de datos intermedio indicado por 40 para datos almacenados
comprimidos según una norma de compresión de AAC actual.
Adicionalmente, el sistema 10 comprende un decodificador DEC1
indicado por 50 para generar datos x_{1} decodificados indicados
por 120. El sistema 10 comprende también un incrustador WATMKEMB de
marca de agua indicado por 60. Por último, el sistema 10 incluye un
segundo codificador EN2(Q_{2}) de cuantificación indicado
por 70 para generar un flujo x_{b2} de bits de salida codificado
indicado por
130.
130.
En funcionamiento, el almacén 20 de datos
transmite los datos x 100 de contenido al codificador EN1(Q1)
30 que cuantifica y codifica los datos x 100 para generar los
correspondientes datos x_{b1} 110 codificados para su
almacenamiento en el almacén 40 de datos intermedio. En respuesta a
una petición de música por parte de un consumidor, el sistema 10
puede hacerse funcionar para ordenar al almacén 40 AAC intermedio
que transmita los correspondientes datos codificados de almacén como
un flujo de bits al decodificador DEC1 50. El decodificador DEC1 50
decodifica parcialmente el flujo de bits para generar los datos
x_{1} 120 que se introducen posteriormente en el incrustador 60
WATMKEMB de marca de agua que transmite los correspondientes datos
de contenido de marca de agua al segundo codificador
EN2(Q_{2}) 70 de cuantificación. El codificador
EN2(Q_{2}) 70 procesa los datos recibidos desde el
incrustador 60 WATMKEMB de marca de agua para generar el flujo
x_{b2} 130 de bits de salida decodificado para su suministro al
consumidor.
Un inconveniente del funcionamiento del sistema
10 anteriormente mencionado que conlleva la decodificación parcial
de datos codificados seguida de una recodificación posterior es la
introducción de artefactos en tándem en el flujo x_{b2} 130 de
bits de salida. Estos artefactos son errores provocados por dos o
más algoritmos de compresión de audio en cascada, concretamente los
codificadores 30, 70 en cascada cuando se implementan utilizando
software. Los artefactos en tándem, también conocidos como error en
tándem, se aprecian más fácilmente con referencia a la figura 2 en
la que dos gráficas indicadas por 200, 210 se corresponden con los
codificadores 30, 70 respectivamente. Las gráficas 200, 210 incluyen
ejes 250, 270 de abscisa respectivamente y ejes 260, 280 de
ordenadas de cuantificación respectivamente. Además, en este
ejemplo, los codificadores 30, 70 pueden hacerse funcionar para
emplear longitudes de palabras w1 = 3 bits y w2 = 2 bits
respectivamente. Para estos ejemplos de longitudes de palabra, el
sistema 10 puede hacerse funcionar para transcodificar a una tasa de
transmisión de bits inferior cuando se generan los datos x_{b2}
130 de salida.
Por tanto, la señal de entrada representada por
los datos x 100 se define como x \in [0,7] después de procesarse
en el primer codificador EN1 (Q_{1}) 30 para generar los datos
x_{b1} 110 codificados. Estos datos x_{b1} 110 codificados
pueden, por ejemplo, codificarse directamente además (sin marca de
agua) en el segundo codificador EN2 (Q_{2}) 70 para generar un
flujo y_{12} de bits de salida definido por la ecuación 1 (Ec.
1):
\vskip1.000000\baselineskip
\vskip1.000000\baselineskip
para la que un error e_{12} de
cuantificación promedio asociado viene dado por la ecuación 2 (Ec.
2):
\vskip1.000000\baselineskip
para N muestras. En comparación, el
error de cuantificación generado por el procesamiento de los datos x
directamente a través del segundo codificador EN2 (Q_{2}) 60 en el
que y_{2} = Q2(x) viene dado por la ecuación 3 (Ec.
3):
\vskip1.000000\baselineskip
En general, el error de cuantificación de
y_{2} es más pequeño que el de y_{12}, concretamente
e_{2}<e_{12}. Además, una diferencia entre los errores de
cuantificación de y_{12} y y_{2} se corresponde con el error
e_{t} en tándem anteriormente mencionado según la ecuación 4 (Ec.
4):
\vskip1.000000\baselineskip
Con referencia de nuevo a la figura 2, en el
sistema 10, se genera error en tándem en zonas sombreadas de la
gráfica 200, por ejemplo en una zona 290 sombreada,
concretamente:
\vskip1.000000\baselineskip
Por ejemplo, una señal x con amplitud 2,75 se
cuantifica primero por el primer codificador EN1 (Q_{1}) a una
amplitud 3, concretamente 3 = Q1 (2,75), y posteriormente en el
segundo codificador EN2 (Q_{2}) a una amplitud 4, concretamente 4
= Q2(Q1(2,75)). El error de cuantificación resultante
es 4-2,75=1,25. En comparación, utilizar sólo el
segundo codificador EN2 (Q_{2}) da como resultado un error
considerablemente más pequeño, concretamente
Q2(2,75)-2,75=0,75.
El aumento de error de cuantificación
correspondiente al ruido en tándem se reconoce generalmente como un
problema asociado a la transcodificación. Aparte de reducir la
relación señal/ruido de una señal, el ruido en tándem puede
oscurecer también características más imperceptibles de la señal,
por ejemplo, información de marca de agua de audio incluida dentro
de una señal de audio.
En la técnica anterior se han propuesto al menos
soluciones parciales al problema del ruido en tándem. Una primera
solución reduce el ruido en tándem mediante dos codificadores de
cuantificación en cascada, concretamente un primer codificador
seguido en secuencia por un segundo codificador. El primer
codificador se dispone para emplear una tasa de transmisión de bits
considerablemente más alta con respecto al el segundo codificador.
Tal reducción puede apreciarse a partir de la figura 2 en la que los
codificadores con tasas de transmisión altas se corresponden con
cuantificadores con longitudes de palabra mayores y asociados con
una resolución más alta, concretamente aumentando la resolución del
codificador 30. Aunque este enfoque es efectivo, tiene el
inconveniente de que el espacio de almacenamiento de datos requerido
en el almacén 40 AAC de datos intermedio para el x_{b1} 110 se
aumenta mucho más de lo necesario. Se conocen otros enfoques en los
que pueden utilizarse técnicas de modelación para predecir el ruido
en tándem y aplicar esta predicción para al menos compensar
parcialmente para reducir el ruido en tándem.
En una solicitud de patente europea publicada
n.º EP 1 359 762, se describe un sistema codificador/decodificador y
un procedimiento de codificación y decodificación de datos de
entrada en varios niveles diferentes de cuantificación. Los
diferentes niveles de cuantificación permiten la escalabilidad de la
relación señal/ruido (SNR). El sistema comprende varias unidades
cuantificadoras, en el que cada unidad cuantificadora funciona para
cuantificar los datos de entrada en un nivel de cuantificación
correspondiente. Además, cada cuantificador puede hacerse funcionar
para aplicar una función de cuantificación. En el sistema, para
conseguir una escalabilidad de SNR óptima, las unidades
cuantificadoras se disponen en un orden de procesamiento determinado
de modo que se minimiza un error cuadrático medio de un error de
predicción y de modo que el error de predicción de cuantificación
puede reconstruirse perfectamente.
En el artículo "Requantization For Transcoding
of MPEG-2 Intraframes" de WERNER; IEEE
Transactions On Image Processing, IEEE Service Center, Piscataway,
NJ, US, vol. 8, no. 2, febrero de 1999 (1999-02),
páginas 179-191, XP000831918 ISSN:
1057-7149 se comenta el ajuste óptimo de la etapa de
cuantificación para cuantificadores secuenciales.
Por tanto, a los inventores les preocupa el
problema técnico de concebir un procedimiento para reducir el ruido
de cuantificación en tándem en cuantificadores en cascada.
Un objetivo de la presente invención es
proporcionar un procedimiento para reducir el ruido de
cuantificación en tándem en cuantificadores en cascada o
codificadores de cuantificación en cascada.
Según un primer aspecto de la presente
invención, se prevé un procedimiento para reducir el ruido de
cuantificación en tándem en un sistema que comprende una pluralidad
de dispositivos de cuantificación acoplados en serie, incluyendo el
procedimiento las etapas de:
(a) determinar zonas de señal en las que tienen
lugar errores de ruido en tándem para la cuantificación uniforme de
la pluralidad de dispositivos de cuantificación; y
(b) ajustar una característica de cuantificación
no uniforme de al menos uno del uno o más dispositivos de
cuantificación anteriores en el sistema para reducir el ruido en
tándem que surge en el mismo desde dichas zonas de señal
determinadas, no incluyendo dicho uno o más dispositivos de
cuantificación anteriores un último dispositivo de cuantificación en
serie en el sistema.
La invención es ventajosa en el procedimiento
porque puede reducir el ruido de cuantificación en tándem en
configuraciones de cuantificación en cascada.
Opcionalmente, el procedimiento comprende una
etapa adicional de disponer que el sistema procese señales a través
de la serie de dispositivos de cuantificación, comprendiendo dichas
señales una o más de: señales de audio, señales de vídeo, señales de
imagen y señales portadoras de texto. El procedimiento es
beneficioso porque puede aplicarse a una amplia gama de diferentes
tipos de señal.
Opcionalmente, el procedimiento incluye una
etapa de disponer que dicha pluralidad de dispositivos de
cuantificación implementen algoritmos de compresión para comprimir
datos procesados por dichos dispositivos de cuantificación. Más
preferiblemente, dichos algoritmos de compresión incluyen al menos
uno de: compresión de MPEG, compresión de AAC y compresión de MP3.
Tales algoritmos de compresión pueden reducir los requisitos de
almacenamiento de datos.
Opcionalmente, el procedimiento incluye una
etapa adicional de añadir datos de marca de agua a datos que se
están procesando a través de dicha pluralidad de dispositivos de
cuantificación. El procedimiento es beneficioso porque puede
utilizarse junto con contenido de datos de marca de agua, en el que
el ruido de cuantificación en tándem reducido proporcionado por el
procedimiento evita al menos parcialmente los problemas con el ruido
en tándem de este tipo que oscurece datos de marca de agua añadidos
casi imperceptibles.
Opcionalmente, el procedimiento se aplica junto
con la implementación de un sistema de distribución de señal
multimedia. El procedimiento es beneficioso para mejorar la calidad
del contenido de programa suministrado a los usuarios a través de un
sistema de distribución de este tipo.
Según otro aspecto de la invención, se prevé un
aparato para procesar una señal de entrada para generar una señal de
salida codificada correspondiente, incluyendo dicho aparato una
pluralidad de dispositivos de cuantificación acoplados en serie, en
el que una característica de cuantificación de uno o más
dispositivos de cuantificación anteriores tiene niveles de
cuantificación no uniforme correspondientes a zonas (290) de señal
en las que tienen lugar errores de ruido en tándem para
características de cuantificación uniforme de la pluralidad de
dispositivos de cuantificación, no incluyendo dicho uno o más
dispositivos de cuantificación anteriores un último dispositivo de
cuantificación en serie en el aparato.
Según otro aspecto de la presente invención, se
prevé un sistema para el procesamiento de una señal de entrada para
generar una señal de salida codificada correspondiente, incluyendo
dicho sistema una pluralidad de dispositivos de cuantificación
acoplados en serie, en el que una característica de cuantificación
de uno o más dispositivos de cuantificación anteriores tiene niveles
de cuantificación no uniforme correspondientes a zonas (290) de
señal en las que tienen lugar errores de ruido en tándem para
características de cuantificación uniforme de la pluralidad de
dispositivos de cuantificación, no incluyendo dicho uno o más
dispositivos de cuantificación anteriores un último dispositivo de
cuantificación en serie en el sistema.
Opcionalmente, el sistema puede hacerse
funcionar para procesar señales a través de la serie de dispositivos
de cuantificación, comprendiendo dichas señales una o más de:
señales de audio, señales de vídeo, señales de imagen y señales
portadoras de texto.
Opcionalmente, el sistema se dispone de modo que
dicha pluralidad de dispositivos de cuantificación pueden hacerse
funcionar para implementar algoritmos de compresión para comprimir
datos procesados por dichos dispositivos de cuantificación. Más
preferiblemente, los algoritmos de compresión incluyen al menos uno
de: compresión de MPEG, compresión de AAC y compresión de MP3.
Opcionalmente, el sistema puede hacerse
funcionar para añadir datos de marca de agua a datos que se están
procesando a través de dicha pluralidad de dispositivos de
cuantificación.
Opcionalmente, el sistema se dispone en
funcionamiento para implementar un sistema de distribución de señal
multimedia.
\newpage
Se apreciará que características de la invención
son susceptibles de combinarse en cualquier combinación sin alejarse
del alcance de la invención.
A continuación, se describirán realizaciones de
la invención, a modo de ejemplo únicamente, con referencia a los
siguientes diagramas en los que:
la figura 1 es un diagrama esquemático de un
sistema de distribución de contenido de programa conocido que emplea
codificadores de cuantificación en cascada, en el que los
codificadores tienden a presentar ruido de cuantificación en tándem
en funcionamiento;
la figura 2 es una ilustración de etapas de
cuantificación de dos codificadores de ejemplo empleados en el
sistema de la figura 1 con zonas en las que se genera potencialmente
ruido de cuantificación en tándem;
la figura 3 es una realización de la presente
invención, concretamente una ilustración de cuantificadores dobles
que pueden sustancialmente estar libres de ruido en tándem;
la figura 4 es una gráfica que ilustra un
equilibrio entre una primera longitud (w1) de palabra de codificador
de cuantificación frente a ruido (e_{t}) en tándem para la
realización de la figura 3; y
la figura 5 es una gráfica que ilustra un
equilibrio entre la primera longitud (w1) de palabra de codificador
de cuantificación frente a una relación e_{t}/e_{q2} donde
e_{q2} es el ruido de cuantificación de un segundo codificador de
cuantificación.
Para reducir el problema de ruido de
cuantificación en tándem generado por codificadores de
cuantificación en cascada en un sistema para distribuir datos de
contenido de programa, refiriéndose dichos datos a contenido de
programa de audio y/o vídeo, los inventores han concebido un
denominado cuantificador "sin ruido en tándem" ("tandem noise
free", TNF). Tal cuantificador es susceptible, por ejemplo, de
emplearse en el sistema 10 actual ilustrado en la figura 1.
Una realización de la invención se ilustra en la
figura 3 en la que dos cuantificadores Q'_{1} y Q_{2} indicados
por 350, 370 respectivamente se acoplan en una configuración
indicada en general por 300. La configuración 300 está dotada
también preferiblemente de un incrustador de marca de agua (no
mostrado) similar al incrustador 60 WATMKEMB de marca de agua de la
figura 1. Además, la configuración 300 que puede hacerse funcionar
también opcionalmente para implementar algoritmos de compresión de
datos incluye al menos uno de: compresión de MPEG, compresión de AAC
y compresión de MP3
En la configuración 300, los cuantificadores
350, 370 son, por ejemplo, parte de una cadena de procesamiento de
señal para distribuir datos de contenido de programa, por ejemplo,
similar al sistema 10 ilustrado en la figura 1 adaptado con fines
multimedia. Opcionalmente, se interponen funciones adicionales, por
ejemplo almacenamiento de datos, entre los cuantificadores 350, 370.
Los cuantificadores 350, 370 en la configuración 300 serían
susceptibles de presentar ruido de cuantificación en tándem de una
manera similar a la ilustrada en la figura 2, si no fuera porque se
hace funcionar el primer cuantificador 350 para cuantificar una
señal x de entrada indicada por 340 también en un sentido opuesto,
como se aclarará en el presente documento con más detalle, con
fines de reducir la cuantificación en tándem que surge debido al
funcionamiento de este primer cuantificador 350.
En la figura 3, para un conjunto de dos
cuantificadores 350, 370 con la operación en sentido opuesto
mencionada anteriormente, una salida
Q_{2}(Q'_{1}(x)) indicada por 380 es idéntica a la
señal x 340 de entrada procesada por el segundo cuantificador 370
tal como se describe por la ecuación 5 (Ec. 5):
En otras palabras, la distorsión de ruido en
tándem total generada por la configuración 300 en el procesamiento
de la señal x 340 para generar la salida 380 se corresponde con
distorsiones introducidas por el segundo cuantificador 370.
Para ilustrar adicionalmente tal principio, se
hace referencia de nuevo a la figura 2. La señal x 340 de entrada
es, por ejemplo, tal que x = 2,75. En el sistema 10 de ejemplo
actual, este valor para x 340 se cuantificaría a un valor 4 que da
como resultado un error de 1,25. En contraposición al sistema 10, la
configuración 300 da como resultado que la salida 380 asume un valor
Q'_{1}(2,75)=2 que seguida por el segundo cuantificador 370
da como resultado Q_{2}(2)=2 para la salida 380. Un
resultado similar surge si el segundo cuantificador 370 se aplicase
directamente para procesar la señal x 340 para generar la salida
380, concretamente Q_{2}(2,75) = Q_{2}(2) = 2. En
la figura 3, el cuantificador 350 está dotado de una unidad DTRD
Q'_{1} de control indicada por 330 para soportar la función en
sentido opuesto mencionada anteriormente asociada con el primer
cuantificador 350. "DTRD" es una abreviatura de "Derive
Tandem Regions and Design Q'_{1}" (Derivar zonas en tándem y
diseñar Q'_{1}) que indica que las características de conversión
del primer cuantificador 350 se modifican previendo la generación de
ruido en tándem esperada dentro de la configuración 300.
Más en general, puede analizarse el
comportamiento de un conjunto de dos cuantificadores Q_{1},
Q_{2} lineales con longitudes w1, w2 de palabra de salida
respectivamente asociadas. Suponiendo que la señal x 340 está en un
intervalo de cero como mínimo y x_{max} como máximo,
concretamente, x \in [0, x_{max}], una etapa \DeltaQ de
cuantificación para ambos cuantificadores 350, 370 viene dada por la
ecuación 6 (Ec. 6):
El número de zonas, por ejemplo, la zona 290 en
la figura 2, indicada por N_{t} en la que puede tener lugar
potencialmente la distorsión en tándem puede calcularse a partir de
la ecuación 7 (Ec. 7):
Los inventores han apreciado que un error en
tándem promedio por zona, concretamente e_{R}, sólo está
influenciado por el primer cuantificador 350 como se prevé en la
ecuación 8 (Ec. 8):
Por tanto, para una señal x 340 uniformemente
distribuida tal que x \in [0, x_{max}], el error en tándem
promedio por muestra de señal procesada en la configuración 300
viene dada por la ecuación 9 (Ec. 9):
donde
w2<w1.
Por ejemplo, en una situación en la que w1 = 3,
w2 = 2 y x_{max} = 7, tiene lugar un error de ruido en tándem
promedio de e_{t} = ^{1}/_{7} por muestra de entrada para la
señal x 340. El error e_{t} en tándem promedio se presenta en una
gráfica indicada por 400 en la figura 4. La gráfica 400 incluye un
eje 410 de abscisas que indica la longitud w1 de palabra y un eje
420 de ordenadas que indica el error e_{t} promedio mencionado
anteriormente. Una flecha 430 indica una tendencia del error e_{t}
promedio a medida que la longitud w2 de palabra se aumenta desde 1
hasta 8.
Los inventores han apreciado que el error de
ruido en tándem se estima de manera ventajosa investigando el error
de ruido en tándem con respecto al el error de cuantificación total
en la configuración 300. Cuando el primer cuantificador 350 se
controla tal como se describió anteriormente para que presente ruido
en tándem mínimo, puede suponerse que el ruido de cuantificación
total que surge en la configuración 300 surge del segundo
cuantificador 370. En una situación de este tipo, un error e_{q2}
promedio por valor de entrada en la señal x 340 viene dado por la
ecuación 10 (Ec. 10):
En la figura 5, un trazado del error e_{t}
total y el error e_{q2} se presenta en una gráfica indicada en
general por 500. La gráfica 500 incluye un eje 510 de abscisas que
indica la longitud de palabra del primer cuantificador 350 y un eje
520 de ordenadas que indica una relación de los errores e_{t},
e_{q2} anteriormente mencionados. A partir de la figura 2, los
inventores han identificado que la energía relativa del ruido de
cuantificación esta en función de una diferencia entre las
longitudes w1, w2 de palabra de los cuantificadores 350, 370 primero
y segundo respectivamente tal como se representa mediante una flecha
530. En particular, para una constante \beta dada, la energía
e_{t} en tándem con respecto al ruido e_{q2} de cuantificación
viene dada por la ecuación 11 (Ec. 11):
A partir de las ecuaciones 9 y 10, se halla que
la constante \beta tiene un valor numérico de \beta = 2. La
energía relativa perceptible a partir del eje 520 de ordenadas
aumenta a medida que la longitud w2 de palabra se aproxima a w1. Por
ejemplo, cuando w2 = w1 - 1, el ruido e_{t} en tándem es
aproximadamente el 50% del ruido e_{q2} de cuantificación. Como
ejemplo adicional, w2 = w1 -2, el ruido e_{t} en tándem es
aproximadamente el 12,5% del ruido e_{q2} de cuantificación.
La configuración 300 ilustrada en la figura 3 es
susceptible de utilizarse en el sistema 10 mostrado en la figura 1.
En el sistema 10 modificado según la presente invención, una señal
de audio se transcodifica dentro del sistema 10 desde 128 kbytes por
segundo a 64 kbytes por segundo. Por ejemplo, en el caso de una
señal de 44,1 kHz, tal transcodificación se corresponde con una
transcodificación de 3 bits/muestra a 1,5 bits/muestra. Si se
emplean cuantificadores lineales para los codificadores 30, 70 de
cuantificación, la energía relativa de ruido en tándem llega a ser
el 25% del ruido e_{t} de cuantificación total. Por tanto, el
ruido de codificación total que surge en el sistema 10 puede
reducirse un 25%.
A partir de lo anterior, se apreciará que el
sistema 10 es susceptible de adaptarse según la presente invención
de modo que el ruido en tándem no se introduce sustancialmente a
pesar de haber dos codificadores 30, 70 de cuantificación en
cascada, mejorando de ese modo la calidad de la salida x_{b2} 130.
De manera alternativa, para una calidad de audio dada, la invención
puede reducir el espacio de almacenamiento requerido en el almacén
40 AAC de datos para almacenar el flujo x_{b1} 110 de bits
codificados.
Se apreciará que las realizaciones de la
invención descritas anteriormente son susceptibles de modificarse
sin alejarse del alcance de la invención tal como se define en las
reivindicaciones adjuntas.
En las reivindicaciones adjuntas, los números y
otros símbolos incluidos entre paréntesis se incluyen para ayudar en
la compresión de las reivindicaciones y no pretenden de ninguna
manera limitar el alcance de las reivindicaciones.
Las expresiones tales como "comprende",
"incluye", "incorpora", "contiene", "es" y
"tiene" deben interpretarse de una manera no exclusiva cuando
se interprete la descripción y sus reivindicaciones asociadas,
concretamente interpretarse para permitir que estén presentes
también otros elementos o componentes que no se han definido de
forma explícita. La referencia al singular debe interpretarse
también como una referencia al plural y viceversa.
Claims (13)
1. Procedimiento para reducir el ruido de
cuantificación en tándem en un sistema (10; 300) que comprende una
pluralidad de dispositivos (30, 70; 350, 370) de cuantificación
acoplados en serie, caracterizándose el procedimiento por
incluir las etapas de:
(a) determinar zonas (290) de señal en las que
tienen lugar errores de ruido en tándem para la cuantificación
uniforme de la pluralidad de dispositivos (30, 70; 350, 370) de
cuantificación; y
(b) ajustar una característica de cuantificación
no uniforme de al menos uno del uno o más dispositivos (30; 350) de
cuantificación anteriores en el sistema (10; 300) para reducir el
ruido en tándem que surge en el mismo desde dichas zonas de señal
determinadas, no incluyendo dicho uno o más dispositivos (30; 350)
de cuantificación anteriores un último dispositivo (70; 370) de
cuantificación en serie en el sistema (10; 300).
2. Procedimiento según la reivindicación 1,
comprendiendo dicho procedimiento una etapa adicional de disponer
que el sistema (10; 300) procese señales a través de la serie de
dispositivos (30, 70; 350, 370) de cuantificación, comprendiendo
dichas señales una o más de: señales de audio, señales de vídeo,
señales de imagen y señales portadoras de texto.
3. Procedimiento según la reivindicación 1 ó 2,
incluyendo dicho procedimiento una etapa de disponer que dicha
pluralidad de dispositivos (30, 70; 350, 370) de cuantificación
implementen algoritmos de compresión para comprimir datos procesados
por dichos dispositivos (30, 70; 350, 370) de cuantificación.
4. Procedimiento según la reivindicación 3, en
el que dichos algoritmos de compresión incluyen al menos uno de:
compresión de MPEG, compresión de AAC y compresión de MP3.
5. Procedimiento según la reivindicación 1,
incluyendo dicho procedimiento una etapa adicional de añadir datos
de marca de agua a datos que se están procesando a través de dicha
pluralidad de dispositivos de cuantificación.
6. Procedimiento según la reivindicación 1,
aplicándose dicho procedimiento junto con la implementación de un
sistema (10; 300) de distribución de señal multimedia.
7. Aparato (300) para procesar una señal (340)
de entrada para generar una señal (380) de salida codificada
correspondiente, incluyendo dicho aparato una pluralidad de
dispositivos (350, 370) de cuantificación acoplados en serie,
caracterizado porque
una característica de cuantificación de uno o
más dispositivos (350) de cuantificación anteriores tiene niveles de
cuantificación no uniforme correspondientes a zonas (290) de señal
en las que tienen lugar errores de ruido en tándem para las
características de cuantificación uniforme de la pluralidad de
dispositivos (350, 370) de cuantificación, no incluyendo dicho uno o
más dispositivos (350) de cuantificación anteriores un último
dispositivo (370) de cuantificación en serie en el aparato
(300).
8. Sistema para procesar una señal (340) de
entrada para generar una señal (380) de salida codificada
correspondiente, incluyendo dicho sistema una pluralidad de
dispositivos (350, 370) de cuantificación acoplados en serie, en el
que una característica de cuantificación de uno o más dispositivos
(350) de cuantificación anteriores tiene niveles de cuantificación
no uniforme correspondientes a zonas (290) de señal en las que
tienen lugar errores de ruido en tándem para características de
cuantificación uniforme de la pluralidad de dispositivos (350, 370)
de cuantificación, no incluyendo dicho uno o más dispositivos (350)
de cuantificación anteriores un último dispositivo (370) de
cuantificación en serie en el sistema (300).
9. Sistema según la reivindicación 8, en el que
dicho sistema (300) puede hacerse funcionar para procesar señales a
través de la serie de dispositivos (350, 370) de cuantificación,
comprendiendo dichas señales una o más señales de audio, señales de
vídeo, señales de imagen y señales portadoras de texto.
10. Sistema según la reivindicación 8,
disponiéndose dicho sistema (300) de modo que dicha pluralidad de
dispositivos (350, 370) de cuantificación pueden hacerse funcionar
para implementar algoritmos de compresión para comprimir datos
procesados por dichos dispositivos (350, 370) de cuantificación.
11. Sistema según la reivindicación 10, en el
que dichos algoritmos de compresión incluyen al menos uno de:
compresión de MPEG, compresión de AAC y compresión de MP3.
12. Sistema (300) según la reivindicación 8,
pudiendo hacerse funcionar dicho sistema para añadir datos de marca
de agua a datos que se están procesando a través de dicha pluralidad
de dispositivos de cuantificación.
13. Sistema (300) según la reivindicación 8,
disponiéndose dicho sistema (300) en funcionamiento para implementar
un sistema (300) de distribución de señal multimedia.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP04105181 | 2004-10-20 | ||
EP04105181 | 2004-10-20 |
Publications (1)
Publication Number | Publication Date |
---|---|
ES2324726T3 true ES2324726T3 (es) | 2009-08-13 |
Family
ID=35478198
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
ES05790703T Active ES2324726T3 (es) | 2004-10-20 | 2005-10-14 | Procedimiento para reducir el ruido de cuantificacion. |
Country Status (9)
Country | Link |
---|---|
US (1) | US7663527B2 (es) |
EP (1) | EP1805996B1 (es) |
JP (1) | JP4796583B2 (es) |
KR (1) | KR101224352B1 (es) |
CN (1) | CN101073272B (es) |
AT (1) | ATE429783T1 (es) |
DE (1) | DE602005014130D1 (es) |
ES (1) | ES2324726T3 (es) |
WO (1) | WO2006043218A1 (es) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI603846B (zh) | 2013-08-02 | 2017-11-01 | Lg化學股份有限公司 | 耐指紋薄膜及電氣和電子設備 |
US20150225608A1 (en) | 2013-08-02 | 2015-08-13 | Lg Chem, Ltd. | Water repellent and oil repellent film, and electrical and electronic apparatus |
GB2546963B (en) * | 2015-12-23 | 2020-10-21 | Law Malcolm | Transparent lossless audio watermarking enhancement |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3150475B2 (ja) | 1993-02-19 | 2001-03-26 | 松下電器産業株式会社 | 量子化方法 |
FI111764B (fi) * | 1999-06-10 | 2003-09-15 | Nokia Corp | Menetelmä ja järjestely kuvatiedon käsittelemiseksi |
DE19946267C2 (de) * | 1999-09-27 | 2002-09-26 | Harman Becker Automotive Sys | Digitales Transcodiersystem |
DE19947877C2 (de) * | 1999-10-05 | 2001-09-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals |
KR100744442B1 (ko) * | 1999-11-03 | 2007-08-01 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디지털 비디오 및 이미지들에 대한 개선된 캐스케이드 압축 방법 및 시스템 |
JP4125885B2 (ja) * | 2001-11-09 | 2008-07-30 | 日本電信電話株式会社 | 画像符号化方法及びその装置と、画像符号化プログラム及びそのプログラムを記録した記録媒体 |
EP1359762A1 (en) | 2002-05-02 | 2003-11-05 | Siemens Aktiengesellschaft | Quantizer for scalable video coding |
WO2005013542A1 (ja) * | 2003-08-05 | 2005-02-10 | Fujitsu Limited | 再生中継方法及びその装置 |
CN1910929A (zh) * | 2004-01-16 | 2007-02-07 | 皇家飞利浦电子股份有限公司 | 比特流处理的方法 |
-
2005
- 2005-10-14 JP JP2007537435A patent/JP4796583B2/ja not_active Expired - Fee Related
- 2005-10-14 KR KR1020077011362A patent/KR101224352B1/ko not_active IP Right Cessation
- 2005-10-14 WO PCT/IB2005/053378 patent/WO2006043218A1/en active Application Filing
- 2005-10-14 ES ES05790703T patent/ES2324726T3/es active Active
- 2005-10-14 DE DE602005014130T patent/DE602005014130D1/de active Active
- 2005-10-14 CN CN200580036091.3A patent/CN101073272B/zh not_active Expired - Fee Related
- 2005-10-14 US US11/577,368 patent/US7663527B2/en not_active Expired - Fee Related
- 2005-10-14 AT AT05790703T patent/ATE429783T1/de not_active IP Right Cessation
- 2005-10-14 EP EP05790703A patent/EP1805996B1/en not_active Not-in-force
Also Published As
Publication number | Publication date |
---|---|
US7663527B2 (en) | 2010-02-16 |
KR20070084369A (ko) | 2007-08-24 |
EP1805996B1 (en) | 2009-04-22 |
JP2008517548A (ja) | 2008-05-22 |
US20090046819A1 (en) | 2009-02-19 |
CN101073272A (zh) | 2007-11-14 |
WO2006043218A1 (en) | 2006-04-27 |
JP4796583B2 (ja) | 2011-10-19 |
DE602005014130D1 (de) | 2009-06-04 |
EP1805996A1 (en) | 2007-07-11 |
CN101073272B (zh) | 2015-04-29 |
ATE429783T1 (de) | 2009-05-15 |
KR101224352B1 (ko) | 2013-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220277756A1 (en) | Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control | |
US6934679B2 (en) | Error resilient scalable audio coding | |
KR102014295B1 (ko) | 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법 | |
DE60325310D1 (de) | Quantisierung und inverse Quantisierung für Tonsignale | |
WO2006030340A3 (en) | Combined audio coding minimizing perceptual distortion | |
CN1867970A (zh) | 信号编码 | |
US20240177718A1 (en) | Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations | |
KR20000057817A (ko) | 디지털 오디오 방송 및 다른 응용들을 위한 다중 프로그램디코딩 방법 및 장치 | |
MXPA05010251A (es) | Metodo, aparato y sistema para la codificacion y descodificacion de informacion lateral para transmision de medios multiples. | |
CN1290389A (zh) | 一种解码方法、一种语音编码处理设备和一种网络单元 | |
TWI306336B (en) | Sacle factor based bit shifting in fine granularity scalability audio coding | |
US20170103761A1 (en) | Adaptive Forward Error Correction Redundant Payload Generation | |
ES2324726T3 (es) | Procedimiento para reducir el ruido de cuantificacion. | |
CN1910929A (zh) | 比特流处理的方法 | |
TW200818124A (en) | Encoding an audio signal | |
TW200731811A (en) | Feedback and frame synchronization between media encoders and decoders | |
CN101547010B (zh) | 编码解码系统、方法及装置 | |
WO2011012029A1 (zh) | 多描述音频编解码的方法、装置及系统 | |
Brites et al. | Probability updating for decoder and encoder rate control turbo based Wyner-Ziv video coding | |
WO2010075784A1 (zh) | 基音增益获取方法、装置及编码器、解码器 | |
TW200612673A (en) | Encoding/decoding apparatus and its method of quantization of a random step number | |
Miao et al. | An improved error resilience scheme for transmission of MPEG-4 audio over EGPRS | |
CN1598926A (zh) | 具有噪声抑制的音频编码方法和设备 | |
BR122020023384B1 (pt) | Aparelho para decodificar uma representação ambissônica de ordem superior compactada de um som ou campo sonoro | |
BR122019018870B1 (pt) | Método para decodificar uma representação ambissônica de ordem superior compactada de um som ou campo sonoro e mídia legível por computador não transitória |