ES2324726T3 - Procedimiento para reducir el ruido de cuantificacion. - Google Patents

Procedimiento para reducir el ruido de cuantificacion. Download PDF

Info

Publication number
ES2324726T3
ES2324726T3 ES05790703T ES05790703T ES2324726T3 ES 2324726 T3 ES2324726 T3 ES 2324726T3 ES 05790703 T ES05790703 T ES 05790703T ES 05790703 T ES05790703 T ES 05790703T ES 2324726 T3 ES2324726 T3 ES 2324726T3
Authority
ES
Spain
Prior art keywords
quantification
devices
tandem
signals
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES05790703T
Other languages
English (en)
Inventor
Minne Van Der Veen
Aweke N. Lemma
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Application granted granted Critical
Publication of ES2324726T3 publication Critical patent/ES2324726T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/40Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video transcoding, i.e. partial or full decoding of a coded input stream followed by re-encoding of the decoded output stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Peptides Or Proteins (AREA)
  • Analogue/Digital Conversion (AREA)

Abstract

Procedimiento para reducir el ruido de cuantificación en tándem en un sistema (10; 300) que comprende una pluralidad de dispositivos (30, 70; 350, 370) de cuantificación acoplados en serie, caracterizándose el procedimiento por incluir las etapas de: (a) determinar zonas (290) de señal en las que tienen lugar errores de ruido en tándem para la cuantificación uniforme de la pluralidad de dispositivos (30, 70; 350, 370) de cuantificación; y (b) ajustar una característica de cuantificación no uniforme de al menos uno del uno o más dispositivos (30; 350) de cuantificación anteriores en el sistema (10; 300) para reducir el ruido en tándem que surge en el mismo desde dichas zonas de señal determinadas, no incluyendo dicho uno o más dispositivos (30; 350) de cuantificación anteriores un último dispositivo (70; 370) de cuantificación en serie en el sistema (10; 300).

Description

Procedimiento para reducir el ruido de cuantificación.
La presente invención se refiere a procedimientos para reducir el ruido de cuantificación; por ejemplo, la invención se refiere más específicamente a procedimientos para reducir el ruido de cuantificación en tándem que surge cuando una pluralidad de fases de cuantificación de señal se acoplan entre sí en una disposición en serie. Además, la presente invención se refiere también a un aparato que puede hacerse funcionar para implementar los procedimientos anteriormente mencionados. Además, la presente invención se refiere a datos de salida cuantificados generados mediante la ejecución de los procedimientos.
Los artefactos de codificación en tándem surgen cuando los cuantificadores se acoplan en una disposición en serie. Tales artefactos de codificación se encuentran, por ejemplo, cuando se transcodifican señales multimedia, donde una componente dominante de estos artefactos se conoce como "ruido de cuantificación en tándem".
En la figura 1, se muestra un sistema de producción de música actual indicado en general por 10. El sistema 10 comprende un almacén 20 de datos para proporcionar datos x de contenido de programa modulados por codificación de impulsos (PCM) indicados por 100. Asimismo, el sistema 10 comprende además un primer codificador EN1 (Q_{1}) de cuantificación indicado por 30 que puede hacerse funcionar para proporcionar datos x_{b1} codificados indicados por 110. El sistema 10 incluye un almacén AAC de datos intermedio indicado por 40 para datos almacenados comprimidos según una norma de compresión de AAC actual. Adicionalmente, el sistema 10 comprende un decodificador DEC1 indicado por 50 para generar datos x_{1} decodificados indicados por 120. El sistema 10 comprende también un incrustador WATMKEMB de marca de agua indicado por 60. Por último, el sistema 10 incluye un segundo codificador EN2(Q_{2}) de cuantificación indicado por 70 para generar un flujo x_{b2} de bits de salida codificado indicado por
130.
En funcionamiento, el almacén 20 de datos transmite los datos x 100 de contenido al codificador EN1(Q1) 30 que cuantifica y codifica los datos x 100 para generar los correspondientes datos x_{b1} 110 codificados para su almacenamiento en el almacén 40 de datos intermedio. En respuesta a una petición de música por parte de un consumidor, el sistema 10 puede hacerse funcionar para ordenar al almacén 40 AAC intermedio que transmita los correspondientes datos codificados de almacén como un flujo de bits al decodificador DEC1 50. El decodificador DEC1 50 decodifica parcialmente el flujo de bits para generar los datos x_{1} 120 que se introducen posteriormente en el incrustador 60 WATMKEMB de marca de agua que transmite los correspondientes datos de contenido de marca de agua al segundo codificador EN2(Q_{2}) 70 de cuantificación. El codificador EN2(Q_{2}) 70 procesa los datos recibidos desde el incrustador 60 WATMKEMB de marca de agua para generar el flujo x_{b2} 130 de bits de salida decodificado para su suministro al consumidor.
Un inconveniente del funcionamiento del sistema 10 anteriormente mencionado que conlleva la decodificación parcial de datos codificados seguida de una recodificación posterior es la introducción de artefactos en tándem en el flujo x_{b2} 130 de bits de salida. Estos artefactos son errores provocados por dos o más algoritmos de compresión de audio en cascada, concretamente los codificadores 30, 70 en cascada cuando se implementan utilizando software. Los artefactos en tándem, también conocidos como error en tándem, se aprecian más fácilmente con referencia a la figura 2 en la que dos gráficas indicadas por 200, 210 se corresponden con los codificadores 30, 70 respectivamente. Las gráficas 200, 210 incluyen ejes 250, 270 de abscisa respectivamente y ejes 260, 280 de ordenadas de cuantificación respectivamente. Además, en este ejemplo, los codificadores 30, 70 pueden hacerse funcionar para emplear longitudes de palabras w1 = 3 bits y w2 = 2 bits respectivamente. Para estos ejemplos de longitudes de palabra, el sistema 10 puede hacerse funcionar para transcodificar a una tasa de transmisión de bits inferior cuando se generan los datos x_{b2} 130 de salida.
Por tanto, la señal de entrada representada por los datos x 100 se define como x \in [0,7] después de procesarse en el primer codificador EN1 (Q_{1}) 30 para generar los datos x_{b1} 110 codificados. Estos datos x_{b1} 110 codificados pueden, por ejemplo, codificarse directamente además (sin marca de agua) en el segundo codificador EN2 (Q_{2}) 70 para generar un flujo y_{12} de bits de salida definido por la ecuación 1 (Ec. 1):
\vskip1.000000\baselineskip
10
\vskip1.000000\baselineskip
para la que un error e_{12} de cuantificación promedio asociado viene dado por la ecuación 2 (Ec. 2):
\vskip1.000000\baselineskip
11
para N muestras. En comparación, el error de cuantificación generado por el procesamiento de los datos x directamente a través del segundo codificador EN2 (Q_{2}) 60 en el que y_{2} = Q2(x) viene dado por la ecuación 3 (Ec. 3):
12
\vskip1.000000\baselineskip
En general, el error de cuantificación de y_{2} es más pequeño que el de y_{12}, concretamente e_{2}<e_{12}. Además, una diferencia entre los errores de cuantificación de y_{12} y y_{2} se corresponde con el error e_{t} en tándem anteriormente mencionado según la ecuación 4 (Ec. 4):
13
\vskip1.000000\baselineskip
Con referencia de nuevo a la figura 2, en el sistema 10, se genera error en tándem en zonas sombreadas de la gráfica 200, por ejemplo en una zona 290 sombreada, concretamente:
14
\vskip1.000000\baselineskip
Por ejemplo, una señal x con amplitud 2,75 se cuantifica primero por el primer codificador EN1 (Q_{1}) a una amplitud 3, concretamente 3 = Q1 (2,75), y posteriormente en el segundo codificador EN2 (Q_{2}) a una amplitud 4, concretamente 4 = Q2(Q1(2,75)). El error de cuantificación resultante es 4-2,75=1,25. En comparación, utilizar sólo el segundo codificador EN2 (Q_{2}) da como resultado un error considerablemente más pequeño, concretamente Q2(2,75)-2,75=0,75.
El aumento de error de cuantificación correspondiente al ruido en tándem se reconoce generalmente como un problema asociado a la transcodificación. Aparte de reducir la relación señal/ruido de una señal, el ruido en tándem puede oscurecer también características más imperceptibles de la señal, por ejemplo, información de marca de agua de audio incluida dentro de una señal de audio.
En la técnica anterior se han propuesto al menos soluciones parciales al problema del ruido en tándem. Una primera solución reduce el ruido en tándem mediante dos codificadores de cuantificación en cascada, concretamente un primer codificador seguido en secuencia por un segundo codificador. El primer codificador se dispone para emplear una tasa de transmisión de bits considerablemente más alta con respecto al el segundo codificador. Tal reducción puede apreciarse a partir de la figura 2 en la que los codificadores con tasas de transmisión altas se corresponden con cuantificadores con longitudes de palabra mayores y asociados con una resolución más alta, concretamente aumentando la resolución del codificador 30. Aunque este enfoque es efectivo, tiene el inconveniente de que el espacio de almacenamiento de datos requerido en el almacén 40 AAC de datos intermedio para el x_{b1} 110 se aumenta mucho más de lo necesario. Se conocen otros enfoques en los que pueden utilizarse técnicas de modelación para predecir el ruido en tándem y aplicar esta predicción para al menos compensar parcialmente para reducir el ruido en tándem.
En una solicitud de patente europea publicada n.º EP 1 359 762, se describe un sistema codificador/decodificador y un procedimiento de codificación y decodificación de datos de entrada en varios niveles diferentes de cuantificación. Los diferentes niveles de cuantificación permiten la escalabilidad de la relación señal/ruido (SNR). El sistema comprende varias unidades cuantificadoras, en el que cada unidad cuantificadora funciona para cuantificar los datos de entrada en un nivel de cuantificación correspondiente. Además, cada cuantificador puede hacerse funcionar para aplicar una función de cuantificación. En el sistema, para conseguir una escalabilidad de SNR óptima, las unidades cuantificadoras se disponen en un orden de procesamiento determinado de modo que se minimiza un error cuadrático medio de un error de predicción y de modo que el error de predicción de cuantificación puede reconstruirse perfectamente.
En el artículo "Requantization For Transcoding of MPEG-2 Intraframes" de WERNER; IEEE Transactions On Image Processing, IEEE Service Center, Piscataway, NJ, US, vol. 8, no. 2, febrero de 1999 (1999-02), páginas 179-191, XP000831918 ISSN: 1057-7149 se comenta el ajuste óptimo de la etapa de cuantificación para cuantificadores secuenciales.
Por tanto, a los inventores les preocupa el problema técnico de concebir un procedimiento para reducir el ruido de cuantificación en tándem en cuantificadores en cascada.
Un objetivo de la presente invención es proporcionar un procedimiento para reducir el ruido de cuantificación en tándem en cuantificadores en cascada o codificadores de cuantificación en cascada.
Según un primer aspecto de la presente invención, se prevé un procedimiento para reducir el ruido de cuantificación en tándem en un sistema que comprende una pluralidad de dispositivos de cuantificación acoplados en serie, incluyendo el procedimiento las etapas de:
(a) determinar zonas de señal en las que tienen lugar errores de ruido en tándem para la cuantificación uniforme de la pluralidad de dispositivos de cuantificación; y
(b) ajustar una característica de cuantificación no uniforme de al menos uno del uno o más dispositivos de cuantificación anteriores en el sistema para reducir el ruido en tándem que surge en el mismo desde dichas zonas de señal determinadas, no incluyendo dicho uno o más dispositivos de cuantificación anteriores un último dispositivo de cuantificación en serie en el sistema.
La invención es ventajosa en el procedimiento porque puede reducir el ruido de cuantificación en tándem en configuraciones de cuantificación en cascada.
Opcionalmente, el procedimiento comprende una etapa adicional de disponer que el sistema procese señales a través de la serie de dispositivos de cuantificación, comprendiendo dichas señales una o más de: señales de audio, señales de vídeo, señales de imagen y señales portadoras de texto. El procedimiento es beneficioso porque puede aplicarse a una amplia gama de diferentes tipos de señal.
Opcionalmente, el procedimiento incluye una etapa de disponer que dicha pluralidad de dispositivos de cuantificación implementen algoritmos de compresión para comprimir datos procesados por dichos dispositivos de cuantificación. Más preferiblemente, dichos algoritmos de compresión incluyen al menos uno de: compresión de MPEG, compresión de AAC y compresión de MP3. Tales algoritmos de compresión pueden reducir los requisitos de almacenamiento de datos.
Opcionalmente, el procedimiento incluye una etapa adicional de añadir datos de marca de agua a datos que se están procesando a través de dicha pluralidad de dispositivos de cuantificación. El procedimiento es beneficioso porque puede utilizarse junto con contenido de datos de marca de agua, en el que el ruido de cuantificación en tándem reducido proporcionado por el procedimiento evita al menos parcialmente los problemas con el ruido en tándem de este tipo que oscurece datos de marca de agua añadidos casi imperceptibles.
Opcionalmente, el procedimiento se aplica junto con la implementación de un sistema de distribución de señal multimedia. El procedimiento es beneficioso para mejorar la calidad del contenido de programa suministrado a los usuarios a través de un sistema de distribución de este tipo.
Según otro aspecto de la invención, se prevé un aparato para procesar una señal de entrada para generar una señal de salida codificada correspondiente, incluyendo dicho aparato una pluralidad de dispositivos de cuantificación acoplados en serie, en el que una característica de cuantificación de uno o más dispositivos de cuantificación anteriores tiene niveles de cuantificación no uniforme correspondientes a zonas (290) de señal en las que tienen lugar errores de ruido en tándem para características de cuantificación uniforme de la pluralidad de dispositivos de cuantificación, no incluyendo dicho uno o más dispositivos de cuantificación anteriores un último dispositivo de cuantificación en serie en el aparato.
Según otro aspecto de la presente invención, se prevé un sistema para el procesamiento de una señal de entrada para generar una señal de salida codificada correspondiente, incluyendo dicho sistema una pluralidad de dispositivos de cuantificación acoplados en serie, en el que una característica de cuantificación de uno o más dispositivos de cuantificación anteriores tiene niveles de cuantificación no uniforme correspondientes a zonas (290) de señal en las que tienen lugar errores de ruido en tándem para características de cuantificación uniforme de la pluralidad de dispositivos de cuantificación, no incluyendo dicho uno o más dispositivos de cuantificación anteriores un último dispositivo de cuantificación en serie en el sistema.
Opcionalmente, el sistema puede hacerse funcionar para procesar señales a través de la serie de dispositivos de cuantificación, comprendiendo dichas señales una o más de: señales de audio, señales de vídeo, señales de imagen y señales portadoras de texto.
Opcionalmente, el sistema se dispone de modo que dicha pluralidad de dispositivos de cuantificación pueden hacerse funcionar para implementar algoritmos de compresión para comprimir datos procesados por dichos dispositivos de cuantificación. Más preferiblemente, los algoritmos de compresión incluyen al menos uno de: compresión de MPEG, compresión de AAC y compresión de MP3.
Opcionalmente, el sistema puede hacerse funcionar para añadir datos de marca de agua a datos que se están procesando a través de dicha pluralidad de dispositivos de cuantificación.
Opcionalmente, el sistema se dispone en funcionamiento para implementar un sistema de distribución de señal multimedia.
\newpage
Se apreciará que características de la invención son susceptibles de combinarse en cualquier combinación sin alejarse del alcance de la invención.
A continuación, se describirán realizaciones de la invención, a modo de ejemplo únicamente, con referencia a los siguientes diagramas en los que:
la figura 1 es un diagrama esquemático de un sistema de distribución de contenido de programa conocido que emplea codificadores de cuantificación en cascada, en el que los codificadores tienden a presentar ruido de cuantificación en tándem en funcionamiento;
la figura 2 es una ilustración de etapas de cuantificación de dos codificadores de ejemplo empleados en el sistema de la figura 1 con zonas en las que se genera potencialmente ruido de cuantificación en tándem;
la figura 3 es una realización de la presente invención, concretamente una ilustración de cuantificadores dobles que pueden sustancialmente estar libres de ruido en tándem;
la figura 4 es una gráfica que ilustra un equilibrio entre una primera longitud (w1) de palabra de codificador de cuantificación frente a ruido (e_{t}) en tándem para la realización de la figura 3; y
la figura 5 es una gráfica que ilustra un equilibrio entre la primera longitud (w1) de palabra de codificador de cuantificación frente a una relación e_{t}/e_{q2} donde e_{q2} es el ruido de cuantificación de un segundo codificador de cuantificación.
Para reducir el problema de ruido de cuantificación en tándem generado por codificadores de cuantificación en cascada en un sistema para distribuir datos de contenido de programa, refiriéndose dichos datos a contenido de programa de audio y/o vídeo, los inventores han concebido un denominado cuantificador "sin ruido en tándem" ("tandem noise free", TNF). Tal cuantificador es susceptible, por ejemplo, de emplearse en el sistema 10 actual ilustrado en la figura 1.
Una realización de la invención se ilustra en la figura 3 en la que dos cuantificadores Q'_{1} y Q_{2} indicados por 350, 370 respectivamente se acoplan en una configuración indicada en general por 300. La configuración 300 está dotada también preferiblemente de un incrustador de marca de agua (no mostrado) similar al incrustador 60 WATMKEMB de marca de agua de la figura 1. Además, la configuración 300 que puede hacerse funcionar también opcionalmente para implementar algoritmos de compresión de datos incluye al menos uno de: compresión de MPEG, compresión de AAC y compresión de MP3
En la configuración 300, los cuantificadores 350, 370 son, por ejemplo, parte de una cadena de procesamiento de señal para distribuir datos de contenido de programa, por ejemplo, similar al sistema 10 ilustrado en la figura 1 adaptado con fines multimedia. Opcionalmente, se interponen funciones adicionales, por ejemplo almacenamiento de datos, entre los cuantificadores 350, 370. Los cuantificadores 350, 370 en la configuración 300 serían susceptibles de presentar ruido de cuantificación en tándem de una manera similar a la ilustrada en la figura 2, si no fuera porque se hace funcionar el primer cuantificador 350 para cuantificar una señal x de entrada indicada por 340 también en un sentido opuesto, como se aclarará en el presente documento con más detalle, con fines de reducir la cuantificación en tándem que surge debido al funcionamiento de este primer cuantificador 350.
En la figura 3, para un conjunto de dos cuantificadores 350, 370 con la operación en sentido opuesto mencionada anteriormente, una salida Q_{2}(Q'_{1}(x)) indicada por 380 es idéntica a la señal x 340 de entrada procesada por el segundo cuantificador 370 tal como se describe por la ecuación 5 (Ec. 5):
15
En otras palabras, la distorsión de ruido en tándem total generada por la configuración 300 en el procesamiento de la señal x 340 para generar la salida 380 se corresponde con distorsiones introducidas por el segundo cuantificador 370.
Para ilustrar adicionalmente tal principio, se hace referencia de nuevo a la figura 2. La señal x 340 de entrada es, por ejemplo, tal que x = 2,75. En el sistema 10 de ejemplo actual, este valor para x 340 se cuantificaría a un valor 4 que da como resultado un error de 1,25. En contraposición al sistema 10, la configuración 300 da como resultado que la salida 380 asume un valor Q'_{1}(2,75)=2 que seguida por el segundo cuantificador 370 da como resultado Q_{2}(2)=2 para la salida 380. Un resultado similar surge si el segundo cuantificador 370 se aplicase directamente para procesar la señal x 340 para generar la salida 380, concretamente Q_{2}(2,75) = Q_{2}(2) = 2. En la figura 3, el cuantificador 350 está dotado de una unidad DTRD Q'_{1} de control indicada por 330 para soportar la función en sentido opuesto mencionada anteriormente asociada con el primer cuantificador 350. "DTRD" es una abreviatura de "Derive Tandem Regions and Design Q'_{1}" (Derivar zonas en tándem y diseñar Q'_{1}) que indica que las características de conversión del primer cuantificador 350 se modifican previendo la generación de ruido en tándem esperada dentro de la configuración 300.
Más en general, puede analizarse el comportamiento de un conjunto de dos cuantificadores Q_{1}, Q_{2} lineales con longitudes w1, w2 de palabra de salida respectivamente asociadas. Suponiendo que la señal x 340 está en un intervalo de cero como mínimo y x_{max} como máximo, concretamente, x \in [0, x_{max}], una etapa \DeltaQ de cuantificación para ambos cuantificadores 350, 370 viene dada por la ecuación 6 (Ec. 6):
16
El número de zonas, por ejemplo, la zona 290 en la figura 2, indicada por N_{t} en la que puede tener lugar potencialmente la distorsión en tándem puede calcularse a partir de la ecuación 7 (Ec. 7):
17
Los inventores han apreciado que un error en tándem promedio por zona, concretamente e_{R}, sólo está influenciado por el primer cuantificador 350 como se prevé en la ecuación 8 (Ec. 8):
18
Por tanto, para una señal x 340 uniformemente distribuida tal que x \in [0, x_{max}], el error en tándem promedio por muestra de señal procesada en la configuración 300 viene dada por la ecuación 9 (Ec. 9):
19
donde w2<w1.
Por ejemplo, en una situación en la que w1 = 3, w2 = 2 y x_{max} = 7, tiene lugar un error de ruido en tándem promedio de e_{t} = ^{1}/_{7} por muestra de entrada para la señal x 340. El error e_{t} en tándem promedio se presenta en una gráfica indicada por 400 en la figura 4. La gráfica 400 incluye un eje 410 de abscisas que indica la longitud w1 de palabra y un eje 420 de ordenadas que indica el error e_{t} promedio mencionado anteriormente. Una flecha 430 indica una tendencia del error e_{t} promedio a medida que la longitud w2 de palabra se aumenta desde 1 hasta 8.
Los inventores han apreciado que el error de ruido en tándem se estima de manera ventajosa investigando el error de ruido en tándem con respecto al el error de cuantificación total en la configuración 300. Cuando el primer cuantificador 350 se controla tal como se describió anteriormente para que presente ruido en tándem mínimo, puede suponerse que el ruido de cuantificación total que surge en la configuración 300 surge del segundo cuantificador 370. En una situación de este tipo, un error e_{q2} promedio por valor de entrada en la señal x 340 viene dado por la ecuación 10 (Ec. 10):
20
En la figura 5, un trazado del error e_{t} total y el error e_{q2} se presenta en una gráfica indicada en general por 500. La gráfica 500 incluye un eje 510 de abscisas que indica la longitud de palabra del primer cuantificador 350 y un eje 520 de ordenadas que indica una relación de los errores e_{t}, e_{q2} anteriormente mencionados. A partir de la figura 2, los inventores han identificado que la energía relativa del ruido de cuantificación esta en función de una diferencia entre las longitudes w1, w2 de palabra de los cuantificadores 350, 370 primero y segundo respectivamente tal como se representa mediante una flecha 530. En particular, para una constante \beta dada, la energía e_{t} en tándem con respecto al ruido e_{q2} de cuantificación viene dada por la ecuación 11 (Ec. 11):
21
A partir de las ecuaciones 9 y 10, se halla que la constante \beta tiene un valor numérico de \beta = 2. La energía relativa perceptible a partir del eje 520 de ordenadas aumenta a medida que la longitud w2 de palabra se aproxima a w1. Por ejemplo, cuando w2 = w1 - 1, el ruido e_{t} en tándem es aproximadamente el 50% del ruido e_{q2} de cuantificación. Como ejemplo adicional, w2 = w1 -2, el ruido e_{t} en tándem es aproximadamente el 12,5% del ruido e_{q2} de cuantificación.
La configuración 300 ilustrada en la figura 3 es susceptible de utilizarse en el sistema 10 mostrado en la figura 1. En el sistema 10 modificado según la presente invención, una señal de audio se transcodifica dentro del sistema 10 desde 128 kbytes por segundo a 64 kbytes por segundo. Por ejemplo, en el caso de una señal de 44,1 kHz, tal transcodificación se corresponde con una transcodificación de 3 bits/muestra a 1,5 bits/muestra. Si se emplean cuantificadores lineales para los codificadores 30, 70 de cuantificación, la energía relativa de ruido en tándem llega a ser el 25% del ruido e_{t} de cuantificación total. Por tanto, el ruido de codificación total que surge en el sistema 10 puede reducirse un 25%.
A partir de lo anterior, se apreciará que el sistema 10 es susceptible de adaptarse según la presente invención de modo que el ruido en tándem no se introduce sustancialmente a pesar de haber dos codificadores 30, 70 de cuantificación en cascada, mejorando de ese modo la calidad de la salida x_{b2} 130. De manera alternativa, para una calidad de audio dada, la invención puede reducir el espacio de almacenamiento requerido en el almacén 40 AAC de datos para almacenar el flujo x_{b1} 110 de bits codificados.
Se apreciará que las realizaciones de la invención descritas anteriormente son susceptibles de modificarse sin alejarse del alcance de la invención tal como se define en las reivindicaciones adjuntas.
En las reivindicaciones adjuntas, los números y otros símbolos incluidos entre paréntesis se incluyen para ayudar en la compresión de las reivindicaciones y no pretenden de ninguna manera limitar el alcance de las reivindicaciones.
Las expresiones tales como "comprende", "incluye", "incorpora", "contiene", "es" y "tiene" deben interpretarse de una manera no exclusiva cuando se interprete la descripción y sus reivindicaciones asociadas, concretamente interpretarse para permitir que estén presentes también otros elementos o componentes que no se han definido de forma explícita. La referencia al singular debe interpretarse también como una referencia al plural y viceversa.

Claims (13)

1. Procedimiento para reducir el ruido de cuantificación en tándem en un sistema (10; 300) que comprende una pluralidad de dispositivos (30, 70; 350, 370) de cuantificación acoplados en serie, caracterizándose el procedimiento por incluir las etapas de:
(a) determinar zonas (290) de señal en las que tienen lugar errores de ruido en tándem para la cuantificación uniforme de la pluralidad de dispositivos (30, 70; 350, 370) de cuantificación; y
(b) ajustar una característica de cuantificación no uniforme de al menos uno del uno o más dispositivos (30; 350) de cuantificación anteriores en el sistema (10; 300) para reducir el ruido en tándem que surge en el mismo desde dichas zonas de señal determinadas, no incluyendo dicho uno o más dispositivos (30; 350) de cuantificación anteriores un último dispositivo (70; 370) de cuantificación en serie en el sistema (10; 300).
2. Procedimiento según la reivindicación 1, comprendiendo dicho procedimiento una etapa adicional de disponer que el sistema (10; 300) procese señales a través de la serie de dispositivos (30, 70; 350, 370) de cuantificación, comprendiendo dichas señales una o más de: señales de audio, señales de vídeo, señales de imagen y señales portadoras de texto.
3. Procedimiento según la reivindicación 1 ó 2, incluyendo dicho procedimiento una etapa de disponer que dicha pluralidad de dispositivos (30, 70; 350, 370) de cuantificación implementen algoritmos de compresión para comprimir datos procesados por dichos dispositivos (30, 70; 350, 370) de cuantificación.
4. Procedimiento según la reivindicación 3, en el que dichos algoritmos de compresión incluyen al menos uno de: compresión de MPEG, compresión de AAC y compresión de MP3.
5. Procedimiento según la reivindicación 1, incluyendo dicho procedimiento una etapa adicional de añadir datos de marca de agua a datos que se están procesando a través de dicha pluralidad de dispositivos de cuantificación.
6. Procedimiento según la reivindicación 1, aplicándose dicho procedimiento junto con la implementación de un sistema (10; 300) de distribución de señal multimedia.
7. Aparato (300) para procesar una señal (340) de entrada para generar una señal (380) de salida codificada correspondiente, incluyendo dicho aparato una pluralidad de dispositivos (350, 370) de cuantificación acoplados en serie, caracterizado porque
una característica de cuantificación de uno o más dispositivos (350) de cuantificación anteriores tiene niveles de cuantificación no uniforme correspondientes a zonas (290) de señal en las que tienen lugar errores de ruido en tándem para las características de cuantificación uniforme de la pluralidad de dispositivos (350, 370) de cuantificación, no incluyendo dicho uno o más dispositivos (350) de cuantificación anteriores un último dispositivo (370) de cuantificación en serie en el aparato (300).
8. Sistema para procesar una señal (340) de entrada para generar una señal (380) de salida codificada correspondiente, incluyendo dicho sistema una pluralidad de dispositivos (350, 370) de cuantificación acoplados en serie, en el que una característica de cuantificación de uno o más dispositivos (350) de cuantificación anteriores tiene niveles de cuantificación no uniforme correspondientes a zonas (290) de señal en las que tienen lugar errores de ruido en tándem para características de cuantificación uniforme de la pluralidad de dispositivos (350, 370) de cuantificación, no incluyendo dicho uno o más dispositivos (350) de cuantificación anteriores un último dispositivo (370) de cuantificación en serie en el sistema (300).
9. Sistema según la reivindicación 8, en el que dicho sistema (300) puede hacerse funcionar para procesar señales a través de la serie de dispositivos (350, 370) de cuantificación, comprendiendo dichas señales una o más señales de audio, señales de vídeo, señales de imagen y señales portadoras de texto.
10. Sistema según la reivindicación 8, disponiéndose dicho sistema (300) de modo que dicha pluralidad de dispositivos (350, 370) de cuantificación pueden hacerse funcionar para implementar algoritmos de compresión para comprimir datos procesados por dichos dispositivos (350, 370) de cuantificación.
11. Sistema según la reivindicación 10, en el que dichos algoritmos de compresión incluyen al menos uno de: compresión de MPEG, compresión de AAC y compresión de MP3.
12. Sistema (300) según la reivindicación 8, pudiendo hacerse funcionar dicho sistema para añadir datos de marca de agua a datos que se están procesando a través de dicha pluralidad de dispositivos de cuantificación.
13. Sistema (300) según la reivindicación 8, disponiéndose dicho sistema (300) en funcionamiento para implementar un sistema (300) de distribución de señal multimedia.
ES05790703T 2004-10-20 2005-10-14 Procedimiento para reducir el ruido de cuantificacion. Active ES2324726T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04105181 2004-10-20
EP04105181 2004-10-20

Publications (1)

Publication Number Publication Date
ES2324726T3 true ES2324726T3 (es) 2009-08-13

Family

ID=35478198

Family Applications (1)

Application Number Title Priority Date Filing Date
ES05790703T Active ES2324726T3 (es) 2004-10-20 2005-10-14 Procedimiento para reducir el ruido de cuantificacion.

Country Status (9)

Country Link
US (1) US7663527B2 (es)
EP (1) EP1805996B1 (es)
JP (1) JP4796583B2 (es)
KR (1) KR101224352B1 (es)
CN (1) CN101073272B (es)
AT (1) ATE429783T1 (es)
DE (1) DE602005014130D1 (es)
ES (1) ES2324726T3 (es)
WO (1) WO2006043218A1 (es)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI603846B (zh) 2013-08-02 2017-11-01 Lg化學股份有限公司 耐指紋薄膜及電氣和電子設備
US20150225608A1 (en) 2013-08-02 2015-08-13 Lg Chem, Ltd. Water repellent and oil repellent film, and electrical and electronic apparatus
GB2546963B (en) * 2015-12-23 2020-10-21 Law Malcolm Transparent lossless audio watermarking enhancement

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3150475B2 (ja) 1993-02-19 2001-03-26 松下電器産業株式会社 量子化方法
FI111764B (fi) * 1999-06-10 2003-09-15 Nokia Corp Menetelmä ja järjestely kuvatiedon käsittelemiseksi
DE19946267C2 (de) * 1999-09-27 2002-09-26 Harman Becker Automotive Sys Digitales Transcodiersystem
DE19947877C2 (de) * 1999-10-05 2001-09-13 Fraunhofer Ges Forschung Verfahren und Vorrichtung zum Einbringen von Informationen in einen Datenstrom sowie Verfahren und Vorrichtung zum Codieren eines Audiosignals
KR100744442B1 (ko) * 1999-11-03 2007-08-01 코닌클리케 필립스 일렉트로닉스 엔.브이. 디지털 비디오 및 이미지들에 대한 개선된 캐스케이드 압축 방법 및 시스템
JP4125885B2 (ja) * 2001-11-09 2008-07-30 日本電信電話株式会社 画像符号化方法及びその装置と、画像符号化プログラム及びそのプログラムを記録した記録媒体
EP1359762A1 (en) 2002-05-02 2003-11-05 Siemens Aktiengesellschaft Quantizer for scalable video coding
WO2005013542A1 (ja) * 2003-08-05 2005-02-10 Fujitsu Limited 再生中継方法及びその装置
CN1910929A (zh) * 2004-01-16 2007-02-07 皇家飞利浦电子股份有限公司 比特流处理的方法

Also Published As

Publication number Publication date
US7663527B2 (en) 2010-02-16
KR20070084369A (ko) 2007-08-24
EP1805996B1 (en) 2009-04-22
JP2008517548A (ja) 2008-05-22
US20090046819A1 (en) 2009-02-19
CN101073272A (zh) 2007-11-14
WO2006043218A1 (en) 2006-04-27
JP4796583B2 (ja) 2011-10-19
DE602005014130D1 (de) 2009-06-04
EP1805996A1 (en) 2007-07-11
CN101073272B (zh) 2015-04-29
ATE429783T1 (de) 2009-05-15
KR101224352B1 (ko) 2013-01-21

Similar Documents

Publication Publication Date Title
US20220277756A1 (en) Audio encoder device and an audio decoder device having efficient gain coding in dynamic range control
US6934679B2 (en) Error resilient scalable audio coding
KR102014295B1 (ko) 인코더, 디코더, 인코딩과 디코딩 시스템 및 방법
DE60325310D1 (de) Quantisierung und inverse Quantisierung für Tonsignale
WO2006030340A3 (en) Combined audio coding minimizing perceptual distortion
CN1867970A (zh) 信号编码
US20240177718A1 (en) Layered coding and data structure for compressed higher-order ambisonics sound or sound field representations
KR20000057817A (ko) 디지털 오디오 방송 및 다른 응용들을 위한 다중 프로그램디코딩 방법 및 장치
MXPA05010251A (es) Metodo, aparato y sistema para la codificacion y descodificacion de informacion lateral para transmision de medios multiples.
CN1290389A (zh) 一种解码方法、一种语音编码处理设备和一种网络单元
TWI306336B (en) Sacle factor based bit shifting in fine granularity scalability audio coding
US20170103761A1 (en) Adaptive Forward Error Correction Redundant Payload Generation
ES2324726T3 (es) Procedimiento para reducir el ruido de cuantificacion.
CN1910929A (zh) 比特流处理的方法
TW200818124A (en) Encoding an audio signal
TW200731811A (en) Feedback and frame synchronization between media encoders and decoders
CN101547010B (zh) 编码解码系统、方法及装置
WO2011012029A1 (zh) 多描述音频编解码的方法、装置及系统
Brites et al. Probability updating for decoder and encoder rate control turbo based Wyner-Ziv video coding
WO2010075784A1 (zh) 基音增益获取方法、装置及编码器、解码器
TW200612673A (en) Encoding/decoding apparatus and its method of quantization of a random step number
Miao et al. An improved error resilience scheme for transmission of MPEG-4 audio over EGPRS
CN1598926A (zh) 具有噪声抑制的音频编码方法和设备
BR122020023384B1 (pt) Aparelho para decodificar uma representação ambissônica de ordem superior compactada de um som ou campo sonoro
BR122019018870B1 (pt) Método para decodificar uma representação ambissônica de ordem superior compactada de um som ou campo sonoro e mídia legível por computador não transitória