ES2924886T3 - Método y dispositivo para codificación por compresión con pérdidas de datos de imagen - Google Patents

Método y dispositivo para codificación por compresión con pérdidas de datos de imagen Download PDF

Info

Publication number
ES2924886T3
ES2924886T3 ES19180800T ES19180800T ES2924886T3 ES 2924886 T3 ES2924886 T3 ES 2924886T3 ES 19180800 T ES19180800 T ES 19180800T ES 19180800 T ES19180800 T ES 19180800T ES 2924886 T3 ES2924886 T3 ES 2924886T3
Authority
ES
Spain
Prior art keywords
coefficients
post
quantized coefficients
data
processing method
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES19180800T
Other languages
English (en)
Inventor
Zhibo Chen
Wenfei Jiang
Fan Zhang
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby International AB
Original Assignee
Dolby International AB
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby International AB filed Critical Dolby International AB
Application granted granted Critical
Publication of ES2924886T3 publication Critical patent/ES2924886T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/132Sampling, masking or truncation of coding units, e.g. adaptive resampling, frame skipping, frame interpolation or high-frequency transform coefficient masking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/467Embedding additional information in the video signal during the compression process characterised by the embedded information being invisible, e.g. watermarking
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/86Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving reduction of coding artifacts, e.g. of blockiness
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

La invención propone la modificación de coeficientes cuantificados para la señalización de un método de procesamiento posterior. Por lo tanto, se propone un método para datos de codificación de compresión con pérdida que comprende al menos uno de datos de imagen y datos de audio. Dicho método comprende determinar coeficientes cuantificados usando una cuantificación de un residuo transformado de coseno discreto de una predicción de dichos datos. Dicho método comprende además la modificación de dichos coeficientes cuantificados para minimizar el costo de distorsión de la velocidad en el que la distorsión se determina usando una reconstrucción posprocesada de los datos, siendo la reconstrucción posprocesada posprocesada de acuerdo con un método de posprocesamiento, y codificando por compresión dicha coeficientes modificados. En dicho método propuesto, el método de posprocesamiento es aquel de n>1 diferentes candidatos predeterminados del método de posprocesamiento cuya posición en un orden predeterminado de disposición de los candidatos del método de posprocesamiento es igual al resto de la división, por n, de una suma de los coeficientes modificados .Al hacerlo, se elimina la sobrecarga de banderas en el flujo de bits. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Método y dispositivo para codificación por compresión con pérdidas de datos de imagen
Referencia cruzada con la solicitud relacionada
Esta solicitud es una solicitud divisional europea de solicitud de patente euro-PCT EP 11863936.8 (referencia A16063EP01), presentada el 22 de abril de 2011.
Campo técnico
La invención se realiza en el campo de la codificación por compresión con pérdidas de datos de imagen.
Antecedentes de la invención
La codificación por compresión con pérdidas intenta representar datos, por ejemplo, datos de audio o video, con la menor cantidad de bits posible al mismo tiempo que intenta permitir que los datos se reconstruyan a partir de la representación codificada por compresión con pérdidas lo mejor posible.
Para lograr este objetivo, comúnmente se define una función de coste de distorsión de tasa. Minimizar esta función permite a continuación un esquema de compresión con pérdidas que entrega el mejor intercambio entre los costes de codificación en términos de tasa de bits y la pérdida de información en términos de distorsión de los datos reconstruidos con respecto a los datos originales.
La reconstrucción de los datos puede comprender el tratamiento posterior. Es decir, primero se genera una reconstrucción preliminar de los datos usando la información contenida en los datos codificados por compresión. A continuación, se aplica un método de tratamiento posterior para recuperar esa parte de la información que se ha eliminado de los datos originales por la compresión con pérdidas.
Un ejemplo de ello es la eliminación del ruido de grano de película a partir de los datos de imagen en curso de la compresión con pérdidas y la posterior adición de ruido de grano de película simulado a una reconstrucción preliminar obtenida a partir de los datos de imagen codificados por compresión con pérdida.
Otra fuente ejemplar de distorsión es la cuantificación. Para comprimir datos de audio o video, los datos se predicen comúnmente usando datos ya codificados. Lo predicción de la forma restante residual es la transformada del dominio espacial y/o temporal al dominio de frecuencia usando, por ejemplo, la transformación de coseno discreta o la transformación de ondículas. Los coeficientes resultantes son entonces cuantificados. Finalmente, los coeficientes cuantificados son codificados por compresión usando, por ejemplo, codificación Huffman o codificación aritmética. La cuantificación puede ser no lineal, de tal manera que los coeficientes se reducen o se dispersan, es decir, solamente se mantiene un subconjunto de la información de frecuencia. Esto es similar o idéntico a la cuantificación lineal combinada con la modificación. E. Candes, J. Romberg y T. Tao, “Robust uncertainty principles: Exact signal reconstruction from highly incomplete frequency information” ("Principios de incertidumbre robustos: Reconstrucción de señal exacta a partir de información de frecuencia muy incompleta"), IEEE Trans., en Information Theory (Teoría de la Información), vol. 52, pp. 489 - 509, febrero. 2006, ha demostrado teóricamente que, de todos modos, la imagen puede reconstruirse exactamente a partir de tal subconjunto usando un tratamiento posterior apropiado. Y. Zhang, S. Mei, Q. Chen y Z. Chen, “A novel image/video coding method based on compressed sensing theory” ("Un método de codificación de imagen/video novedoso basado en la teoría de la detección comprimida”), En los Procedimientos de IEEE ICASSP, pp. 1361-1364, Abril de 2008, ha propuesto un método de codificación de imagen/video empleando el sub-muestreo de coeficiente de transformación y la minimización de la variación total (TV) basada en el tratamiento posterior de la reconstrucción de bloques preliminar en el dominio de residuos.
M.R. Dadkhah, S. Shirani, M.J. Deen, “Compressive sensing with modified total variation minimization algorithm”, ("Detección de compresión con algoritmo de minimización de variación total modificado"), En los procedimientos de IEEE ICASSP, pp. 1030 - 1033, del 14 al 19 de marzo de 2010, se menciona la explotación del tratamiento posterior de Norm-1 para la reconstrucción de imágenes.
Otro ejemplo del uso del tratamiento posterior basado en la minimización de la variación total se puede encontrar en T.T. Do, X. Lu, J. Sole, “Compressive sensing with adaptative pixel domain reconstruction for block-based video coding”, ("Detección de compresión con reconstrucción de dominio de píxel adaptativo para codificación de video basada en bloques", En procedimientos de ICIP, pp. 3377 - 3380 del 26 al 29 de septiembre de 2010. En él, se ha propuesto un codificador de video que selecciona entre un nuevo modo de codificación usando la recuperación de bloques por minimización de la variación total adaptativa y los modos H.264 existentes. Se emplea un indicador adicional, señalado como indicador CS, para marcar el modo de codificación seleccionado. El decodificador lee el indicador CS y a continuación ejecuta el algoritmo de reconstrucción apropiado correspondiente al modo CS o los modos normales.
Compendio de la invención
Los inventores de la presente invención han identificado el problema de que la transmisión de un indicador si se realiza un tratamiento posterior como la regularización de la variación total (TV) da como resultado una sobrecarga significativa en el flujo de bits, especialmente para la compresión de tasa de bits baja. Este problema incluso se intensifica en caso de que se puedan usar varios métodos de tratamiento posterior y así tiene que señalarse.
Los inventores se dieron cuenta de que la modificación de los coeficientes cuantificados se puede usar para señalar el método de tratamiento posterior.
Por lo tanto, se propone un método según la reivindicación 1 para la codificación por compresión con pérdidas de datos de imagen. Dicho método comprende modificar los coeficientes cuantificados para minimizar el coste de distorsión de tasa en donde la distorsión se determina usando una reconstrucción tratada con posterioridad de los datos, siendo tratada posteriormente la reconstrucción tratada con posterioridad según un método de tratamiento posterior, y codificar por compresión dichos coeficientes modificados. En dicho método propuesto, el método de tratamiento posterior es uno de los n>1 candidatos del método de tratamiento posterior predeterminado diferente cuya posición en un orden predeterminado de la disposición de los candidatos del método de tratamiento posterior es igual a un resto de la división, por n, de una suma de los coeficientes modificados.
Al hacerlo, se elimina la sobrecarga de los indicadores en el flujo de bits.
En una realización, estas operaciones se ejecutan usando medios de tratamiento adaptados de manera correspondiente.
Además, se propone un dispositivo correspondiente según la reivindicación 8.
Las características de otras realizaciones ventajosas se especifican en las reivindicaciones dependientes.
Breve descripción de los dibujos
Las realizaciones ejemplares de la invención se ilustran en los dibujos y se explican con más detalle en la siguiente descripción. Las realizaciones ejemplares se explican solamente para aclarar la invención, pero no limitando la descripción de la invención o el alcance definido únicamente por las reivindicaciones.
En las figuras:
La fig. 1 representa un diagrama de flujo ejemplar del procedimiento de codificación según la invención;
La fig. 2 representa un diagrama de flujo ejemplar de información embebida de manera encubierta sobre el tratamiento posterior en un flujo de bits; y
La figura 3 representa un diagrama de flujo ejemplar del procedimiento de decodificación según la invención.
Realizaciones de ejemplo de la invención
La invención puede realizarse en cualquier dispositivo electrónico que comprenda un dispositivo de tratamiento adaptado correspondientemente. Por ejemplo, la invención se puede realizar en un televisor, un teléfono móvil, un ordenador personal, una cámara fotográfica digital, una cámara de video digital, un reproductor de mp3, un sistema de navegación o un sistema de audio de automóvil.
En una realización ejemplar, la invención se usa para codificar una imagen compuesta de píxeles de imagen. En dicha realización de determina un remanente entre un bloque de píxeles de imagen aún por codificar y una predicción de dicho bloque. La predicción se determina usando píxeles de imagen ya codificados. A continuación, se aplica una transformación del dominio espacial a dominio de frecuencia, tal como la transformada de coseno discreta, sobre el residuo. A partir del resultado de la transformación se genera una secuencia de coeficientes cuantificados por cuantificación y escaneo según un orden de escaneo en donde no es importante si ocurre en primer lugar la cuantificación o el escaneo.
Entre los coeficientes cuantificados, para una modificación adicional, se seleccionan aquellos que tienen una relevancia reducida para el sistema visual humano, por ejemplo, coeficientes asociados con frecuencias por encima de un umbral asociado con sensibilidad perceptiva humana. Esto asegura que la modificación posterior no provoque distorsiones de extrema prominencia para el usuario.
A continuación, entre los coeficientes seleccionados, se determinan aquellos que tienen un valor positivo y no exceden un umbral positivo y que además están contenidos en subsecuencias contiguas de al menos un número positivo de coeficientes de valor cero, es decir, cada coeficiente determinado es el único coeficiente de valor cero en la subsecuencia correspondiente.
Todos los coeficientes determinados pueden ponerse a Cero, lo que conduce a la compresión sin impactar significativamente en la calidad de la imagen. O bien, la optimización del coste de distorsión de tasa se puede usar para identificar, entre los coeficientes determinados, y configurar a cero aquellos que, cuando se configura a cero, conducen a una mejora del coste de distorsión de tasa.
Al hacerlo, se proporciona un esquema de codificación de video basado en la detección por compresión adaptativa que selecciona de manera adaptativa los coeficientes que son los más eficientes para representar fotogramas de video.
La optimización del coste de distorsión de tasa puede tener en cuenta uno o más métodos de tratamiento posterior como la regularización de la variación total, también llamada minimización de la variación total, o minimización de h, también llamada minimización de la Norma-1, estando dispuestos uno o más de los métodos de tratamiento posterior, juntos con un método de tratamiento posterior ficticio representativo de no tratamiento posterior, en un orden, es decir, cada tratamiento posterior tiene un número ordinal asociado.
Así, en una realización, se determina si el tratamiento posterior mejora la calidad de las imágenes restauradas, así como el tratamiento posterior que mejora la calidad al máximo.
A continuación, la modificación de los coeficientes determinados se puede realizar de tal manera que un resto de una división, por n, de una suma de todos los coeficientes incluyendo los modificados, es igual al número ordinal de ese método de tratamiento posterior que es el más adecuado para la minimización de la distorsión. Para facilitar el logro de esta igualdad, se pueden modificar incluso los coeficientes asociados con las frecuencias inferiores o en el umbral de percepción. Además, o como alternativa, el logro de esta igualdad se puede realizar de manera iterativa, es decir, se determina un tratamiento posterior adecuado preliminar, después se modifican los coeficientes para lograr dicha igualdad, en respuesta a lo cual se verifica que el tratamiento posterior determinado preliminar aún es adecuado, o se determina un nuevo tratamiento posterior adecuado preliminar que desencadena una modificación adicional.
En la práctica, se ha encontrado que una sola iteración ha sido suficiente en los casos raros donde ha fallado la verificación de un primer tratamiento posterior determinado preliminar.
Finalmente, se codifican los coeficientes resultantes junto con información que permite a un decodificador determinar la predicción.
Al hacerlo, se posibilita la señalización, en un flujo de bits que comprende los coeficientes cuantificados codificados por compresión determinados mediante una cuantificación de un residuo transformado de coseno discreto de una predicción de un bloque de píxeles de una imagen, siendo un método de tratamiento posterior siendo uno de los n>1 candidatos del método de tratamiento posterior diferente, ordenado y predeterminado que minimizan la distorsión cuando se usa para reconstruir el bloque usando dichos coeficientes codificados y dicha predicción.
Es decir, la información se envía en un canal de comunicación encubierto ya sea y/o qué tratamiento posterior mejora la restauración de la imagen.
Se puede usar un parámetro de cuantificación variable para la cuantificación En ese caso, al menos uno de entre el umbral positivo y el número mínimo positivo de coeficientes de valor cero por sub-secuencia pueden variar demasiado en función del parámetro de cuantificación.
Para reconstruir un bloque de píxeles de una imagen codificada de esta manera, se decodifican los coeficientes y la información que permiten a un decodificador determinar la predicción. A continuación, se determina un resto de una división, por un número n positivo predeterminado, de una suma de los coeficientes decodificados. Para reconstruir el residuo, los coeficientes decodificados se des-cuantifican y se transforman inversamente y, para reconstruir la predicción se usa la información decodificada. A continuación, se combinan la predicción y el residuo. El resto de la división se usa para seleccionar un tratamiento posterior candidato que a continuación se aplica en la combinación del residuo reconstruido y de la predicción reconstruida para determinar la reconstrucción final del bloque.
Una realización ejemplar de un dispositivo de codificación escanea los coeficientes después de la DCT y la cuantificación de cada bloque, y encuentra pequeños coeficientes aislados (por ejemplo, un 1 aislado en medio de un número de ceros sucesivos) que no contribuyen significativamente a la calidad de la reconstrucción. A continuación, tales coeficientes se descartan, ya que esto probablemente degrada ligeramente la calidad, pero reduce mucho la tasa de bits. Así, solamente se seleccionan los coeficientes significativos y se escriben en el flujo de bits.
Adicional o alternativamente, la realización ejemplar del dispositivo de codificación es capaz de elegir de forma adaptativa entre la minimización h, la minimización de la variación total y la omisión del tratamiento posterior e indicar la elección por parte de la comunicación Covert.
En muchos casos, los modos de tratamiento posterior, por ejemplo, la minimización de la variación total (TV), funciona bien para compensar la distorsión causada por la cuantificación y/o el coeficiente de descarte, mientras tanto, a veces fallan. La realización ejemplar del dispositivo de codificación puede procesar cada bloque y calcular la distorsión, por ejemplo, mediante el cálculo de PSNR. Si la calidad mejora, embebe el mensaje de "hacer regularización de TV" en el flujo de bits en un canal de comunicación encubierto.
Un caso de mensajes encubiertos es que, si la regularización de TV se requiere en el decodificador y la regularización de TV es el único método de tratamiento posterior candidato disponible además del no tratamiento posterior, la suma de los coeficientes será impar; de lo contrario, la suma será par. Para el caso de los 3 modos de tratamiento posterior disponibles, se usará el módulo-3 en lugar de la comprobación de paridad.
Ya que la suma de los coeficientes no necesariamente es impar en el caso de que la regularización de TV sea útil y no necesariamente sea par en el caso de que no sea preferible el tratamiento posterior, a veces es necesario modificar los coeficientes. Esto se realiza mejor de una manera que reduce la tasa de bits y minimiza la distorsión resultante de tal modificación, es decir, no solamente asegura la suma de los coeficientes modificados con la paridad correcta, sino que además minimiza el coste de la distorsión de tasa.
Ya que el ojo humano es mucho más sensible a las variaciones en los componentes de frecuencias inferiores, se está llevando a cabo la modificación preferiblemente en componentes de frecuencia más altas, por encima de un umbral.
Y, ya que la codificación de coeficientes pequeños y aislados requiere muchos bits comparables, la modificación se está realizando preferiblemente en componentes pequeños y aislados de alta frecuencia.
Por lo tanto, en una realización que también comprende el descarte de componentes pequeños y aislados de alta frecuencia, de todos modos, la suma de los coeficientes se puede controlar al no descartar todos los coeficientes pequeños y aislados y/o al no descartar sino solamente reducir algunos o todos estos coeficientes.
Los principios inventivos establecidos en las reivindicaciones se han probado en un codificador ejemplar construido sobre el códec H.264. Para simplificar, solamente se ha utilizado la transformación 8x8, sin embargo, el método propuesto también es adecuado para otros tamaños de bloque, tales como 4x4. Además, solamente la regularización de TV se ha considerado para el tratamiento posterior.
El codificador ejemplar probado pasa por estas operaciones:
Dado el parámetro de cuantificación (QP) de la compresión H.264, el codificador ejemplar probado calcula al menos los parámetros Threshold_Run, Threshold_Level, TV_lambda. Estos parámetros calculados satisfacen que el Operador de Detección Adaptativo o el módulo de Regularización de TV puedan lograr la compresión óptima en cada QP. Los parámetros Threshold_Level y Threshold_Run se han optimizado para cada QP usando un conjunto de entrenamiento de varias secuencias de video.
El codificador ejemplar probado obtiene los datos residuales al restar la predicción inter/intra del bloque original Forg, que después se transforma, cuantifica y dispone en una secuencia al escanear según un orden de escaneo predeterminado, por ejemplo, los diversos componentes de frecuencia se reordenan en zigzag.
Un Operador de Detección Adaptativo ASO que se ha realizado en el codificador ejemplar probado a continuación intenta representar el fotograma lo más preciso posible a un coste de bit relativamente bajo. Para ello, se examinan los coeficientes con pequeñas magnitudes que consumen muchos bits en cuanto a si se pueden descartar. Esto se logra investigando la secuencia de los coeficientes. Para cada Coeficiente C que se mantiene por delante de ceros sucesivos y después de ceros sucesivos b, si C < Threshold_Level y a b > Threshold_Run, C es candidato a ser configurado a cero.
La optimización de distorsión de tasa se emplea mediante el Operador de Detección Adaptivo ASO para determinar si configurar a cero los coeficientes candidatos detectados.
En consideración de la calidad subjetiva, el Operador de Detección Adaptativo ASO está adaptado para excluir los 25 coeficientes de inicio que son sensibles al ojo humano de ser configurados a cero.
Para cada coeficiente candidato configurado realmente a cero, los bits para un valor de nivel y un valor de longitud de ejecución se guardan sin degradar significativamente la calidad.
Para aliviar la pérdida de calidad causada por la cuantificación y la caída del coeficiente, la minimización de TV es, en principio, beneficiosa. Pero, aunque el parámetro TV_lambda se ha optimizado para un parámetro de cuantificación dado basado en varios videos, todavía existe la posibilidad de que la regularización de TV degrade realmente la calidad par.
En un módulo PP de tratamiento posterior, el codificador ejemplar probado, por lo tanto, aplica provisionalmente la regularización de TV en el bloque reconstruido Frec, obteniendo el bloque FTV. A continuación, el codificador ejemplar evalúa la calidad de Frec y FTV en comparación con los datos originales Forg. Si la distorsión de FTV es más pequeña, el codificador ejemplar probado señala la regularización de TV que se ha de usar en el lado del decodificador para la salida, así como para la predicción.
Por lo tanto, el codificador ejemplar probado embebe el mensaje de si usar la regularización de TV en el flujo de bits. Si la regularización de TV mejora la calidad y así se requiere, la suma de los coeficientes será impar; de lo contrario, la suma será par. El codificador ejemplar probado a continuación calcula la suma de los coeficientes y comprueba si la paridad sigue la regla anterior, es decir, si la paridad se ajusta a la aplicabilidad del tratamiento posterior según una regla presente en el codificador y en el decodificador. Si no, el codificador ejemplar probado modifica, en el módulo MOD, uno de los coeficientes distintos de cero restantes o uno de los coeficientes pequeños y aislados de alta frecuencia descartados por 1 o -1 para cumplir con este requisito.
Por el bien del impacto en la visibilidad, la frecuencia del coeficiente modificado será tan alta como sea posible. Por el bien de la tasa de bits, la frecuencia del coeficiente modificado será tan alta como sea posible. Por lo tanto, se puede usar la minimización del coste de distorsión de tasa para determinar cuál de los diferentes componentes de frecuencia se modificará además de cómo se modificará.
Como el espacio de búsqueda para esta determinación es grande, se aplica la siguiente priorización en el codificador ejemplar probado:
Si alguno de los coeficientes descartados es impar: Restaurar el asociado con la frecuencia más baja o aquel cuyo descarte ha dado como resultado la mayor distorsión adicional.
Solamente, si los coeficientes descartados son todos pares: Modificar uno de los coeficientes descartados en ± 1. Si no se ha descartado ningún coeficiente: Modificar uno de los coeficientes distintos de cero en ± 1.
Se ha determinado que es ventajoso si se reduce el total del coeficiente modificado.
Ya que la modificación puede afectar la utilidad de la regularización de TV, la evaluación del efecto de la regularización de TV sobre la distorsión y la modificación de los coeficientes se repiten hasta que la paridad de los coeficientes sea igual a la forma preferible de reconstrucción.
Finalmente, el bloque reconstruido a partir de los coeficientes finalmente resultantes se guarda en el almacenamiento temporal como candidato para la predicción de bloques que se han de codificar; y los coeficientes finalmente resultantes se codifican por entropía y se escriben en el flujo de bits, en un medio de almacenamiento no transitorio o se transmiten como una señal.
Una realización ejemplar de un dispositivo para reconstruir datos codificados como tales recibe los coeficientes codificados y los decodifica. Después el dispositivo determina la paridad de los coeficientes. La paridad que es impar informa al decodificador ejemplar de que la regularización de TV se puede aplicar de manera beneficiosa. La paridad que es par informa al decodificador ejemplar de que el esfuerzo de cálculo de la regularización de TV puede omitirse sin perjudicar la calidad de la imagen. A continuación, el decodificador ejemplar aplica la cuantificación inversa y la transformación inversa sobre los coeficientes. Los coeficientes resultantes se disponen en un bloque correspondiente al orden de escaneo predeterminado usado en el lado del codificador. Esto da como resultado un residuo reconstruido que se combina con la predicción que resulta en un bloque FDEC descodificado. Finalmente, el tratamiento posterior se aplica u omite según la paridad de los coeficientes decodificados.

Claims (7)

REIVINDICACIONES
1. El método para codificación por compresión con pérdidas de datos de imagen que comprende
- modificar los coeficientes cuantificados de un residuo transformado de una predicción de dichos datos para minimizar el coste de distorsión de tasa, en donde los datos y los coeficientes cuantificados están dispuestos en bloques bidimensionales, y en donde la distorsión se determina usando una reconstrucción tratada posteriormente de los datos, siendo la reconstrucción tratada posteriormente tratada con posterioridad según un método de tratamiento posterior, y
- codificar por compresión dichos coeficientes cuantificados modificados, en donde
- el método de tratamiento posterior es uno de los n>1 candidatos de método de tratamiento posterior predeterminado diferente cuya posición en un orden predeterminado de disposición de los candidatos del método de tratamiento posterior es igual a un resto de división, por n, de una suma de los coeficientes modificados;
- modificar los coeficientes comprende:
- determinar una secuencia de coeficientes mediante:
o el escaneo de los coeficientes cuantificados según un orden de escaneo y el uso de la secuencia para determinar aquellos coeficientes cuantificados que, cada uno:
• representa una frecuencia por encima de un umbral de frecuencia predeterminado,
• no excede un umbral positivo predeterminado, y
• es el único coeficiente distinto de Cero contenido en la subsecuencia contigua de al menos un número positivo predeterminado de coeficientes cuantificados, e
- identificar, entre los coeficientes determinados, aquellos que, cuando se configuran a cero, conducen a la minimización del coste de distorsión de tasa y configuran los coeficientes identificados a cero,
en donde se determina la reconstrucción usando coeficientes modificados y dicha predicción, dicha predicción siendo determinada usando datos ya codificados por compresión y una referencia a los datos ya codificados por compresión es además codificada por compresión.
2. - El método de la reivindicación 1, en donde la operación de modificar dichos coeficientes cuantificados comprende:
(a) Determinar que existe una diferencia distinta de cero entre un resto de división, por n, de una suma de los coeficientes cuantificados y la posición de ese uno de n candidatos del método de tratamiento posterior diferentes, ordenados y predeterminados que minimiza la distorsión cuando se usa para reconstruir dicho bloque usando dichos coeficientes cuantificados y dicha predicción, y
(b) modificar los coeficientes cuantificados de tal manera que la modificación general sea igual a la diferencia distinta de cero.
3. - El método de la reivindicación 2, que comprende además repetir las operaciones (a) y (b) usando en cada repetición de la operación (a) los coeficientes modificados resultantes de la ejecución inmediatamente anterior de la operación (b) hasta que no se determine la existencia de una diferencia distinta de cero.
4. - El método de la reivindicación 1 a 3, en donde uno de los candidatos del método de tratamiento posterior es la regularización de la variación total.
5. - El método de una de las reivindicaciones 1 a 4, en donde uno de los candidatos del método de tratamiento posterior es la minimización 11.
6. - El método de una de las reivindicaciones 1 a 5, en donde uno de los candidatos del método de tratamiento posterior es un método de tratamiento posterior ficticio que no se procesa en absoluto.
7. - El dispositivo para codificación por compresión con pérdidas de datos de imagen, que comprende
- un procesador configurado para modificar los coeficientes cuantificados de un residuo transformado de una predicción de dichos datos para minimizar el coste de distorsión de tasa, en donde los datos y los coeficientes cuantificados están dispuestos como bloques bidimensionales, y en donde la distorsión se determina usando una reconstrucción del bloque tratado con posterioridad según un método de tratamiento posterior,
el procesador está configurado además para codificar por compresión dichos coeficientes cuantificados modificados en donde
- el método de tratamiento posterior usado para determinación de distorsión es uno de los n>1 candidatos del método de tratamiento posterior predeterminado diferente cuya posición en un orden de disposición predeterminado de los candidatos del método de tratamiento posterior es igual a un resto de división, por n, de una suma de los coeficientes modificados;
- modificar los coeficientes comprende:
- determinar una secuencia de coeficientes mediante:
o el escaneo de los coeficientes cuantificados según un orden de escaneo y el uso de la secuencia para determinar esos coeficientes cuantificados que cada uno:
• representa una frecuencia por encima de un umbral de frecuencia predeterminado,
• no excede un umbral positivo predeterminado, y
• es el único coeficiente distinto de Cero contenido en la subsecuencia contigua de al menos un número positivo predeterminado de coeficientes cuantificados, e
- identificar, entre los coeficientes determinados, aquellos que, cuando se configuran a cero, conducen a la minimización del coste de distorsión de tasa y configuran los coeficientes identificados a cero,
en donde se determina la reconstrucción usando coeficientes modificados y dicha predicción, dicha predicción siendo determinada usando datos ya codificados por compresión y una referencia a los datos ya codificados por compresión es además codificada por compresión.
ES19180800T 2011-04-22 2011-04-22 Método y dispositivo para codificación por compresión con pérdidas de datos de imagen Active ES2924886T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP19180800.5A EP3573337B1 (en) 2011-04-22 2011-04-22 Method and device for lossy compress-encoding image data
PCT/CN2011/000705 WO2012142731A1 (en) 2011-04-22 2011-04-22 Method and device for lossy compress-encoding data and corresponding method and device for reconstructing data

Publications (1)

Publication Number Publication Date
ES2924886T3 true ES2924886T3 (es) 2022-10-11

Family

ID=47041015

Family Applications (2)

Application Number Title Priority Date Filing Date
ES19180800T Active ES2924886T3 (es) 2011-04-22 2011-04-22 Método y dispositivo para codificación por compresión con pérdidas de datos de imagen
ES11863936T Active ES2736003T3 (es) 2011-04-22 2011-04-22 Método y dispositivo para codificación por compresión con pérdidas de datos

Family Applications After (1)

Application Number Title Priority Date Filing Date
ES11863936T Active ES2736003T3 (es) 2011-04-22 2011-04-22 Método y dispositivo para codificación por compresión con pérdidas de datos

Country Status (12)

Country Link
US (1) US9288453B2 (es)
EP (2) EP3573337B1 (es)
JP (1) JP5838258B2 (es)
KR (7) KR102139199B1 (es)
CN (5) CN107529059B (es)
DK (1) DK2700234T3 (es)
ES (2) ES2924886T3 (es)
HU (1) HUE044124T2 (es)
PL (2) PL3573337T3 (es)
PT (1) PT2700234T (es)
RS (1) RS58952B1 (es)
WO (1) WO2012142731A1 (es)

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9767212B2 (en) 2010-04-07 2017-09-19 Liveperson, Inc. System and method for dynamically enabling customized web content and applications
KR20180080365A (ko) 2011-10-14 2018-07-11 어드밴스드 마이크로 디바이시즈, 인코포레이티드 영역-기반 이미지 압축
US9491475B2 (en) 2012-03-29 2016-11-08 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
WO2014078985A1 (en) * 2012-11-20 2014-05-30 Thomson Licensing Method and apparatus for image regularization
US9392286B2 (en) * 2013-03-15 2016-07-12 Magnum Semiconductor, Inc. Apparatuses and methods for providing quantized coefficients for video encoding
US9794575B2 (en) 2013-12-18 2017-10-17 Magnum Semiconductor, Inc. Apparatuses and methods for optimizing rate-distortion costs in video encoding
US8929446B1 (en) * 2014-03-14 2015-01-06 Faroudja Enterprises, Inc. Combiner processing system and method for support layer processing in a bit-rate reduction system
CN104270641B (zh) * 2014-09-30 2018-12-14 杭州华为数字技术有限公司 变换系数的处理方法和装置
KR102338980B1 (ko) 2015-03-23 2021-12-13 삼성전자주식회사 플리커를 제거하기 위해 양자화 계수를 조절할 수 있은 인코더와 이를 포함하는 장치
WO2019211237A1 (en) * 2018-04-30 2019-11-07 Dolby International Ab Methods and systems for streaming media data over a content delivery network
CN108683915B (zh) * 2018-05-11 2020-08-07 北京奇艺世纪科技有限公司 一种写入dQP值的方法、装置及电子设备
KR20200065367A (ko) 2018-11-30 2020-06-09 삼성전자주식회사 이미지 처리 장치 및 프레임 버퍼 컴프레서
CN110262819B (zh) * 2019-06-04 2021-02-26 深圳前海微众银行股份有限公司 一种联邦学习的模型参数更新方法及装置
KR20200143298A (ko) * 2019-06-14 2020-12-23 한국전자통신연구원 양자화 행렬 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
CN114788283A (zh) * 2019-10-02 2022-07-22 威诺瓦国际有限公司 用于向后兼容的分级改进的嵌入式信令以及超分辨率信令的用途
KR102315376B1 (ko) 2021-03-16 2021-10-20 모멘티브퍼포먼스머티리얼스코리아 주식회사 실리콘계 조성물 및 이의 경화물
CN113489978A (zh) * 2021-05-27 2021-10-08 杭州博雅鸿图视频技术有限公司 一种针对avs3的失真优化量化电路

Family Cites Families (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5321522A (en) * 1993-07-19 1994-06-14 Xerox Corporation ADCT compression with minimum compression ratio
US5933542A (en) * 1996-04-24 1999-08-03 Sony Corporation Method and apparatus for blocking effect reduction in images by post-processing in the spatial domain
KR100269125B1 (ko) * 1997-10-25 2000-10-16 윤덕용 양자화효과감소를위한영상데이터후처리방법및장치
US6118822A (en) 1997-12-01 2000-09-12 Conexant Systems, Inc. Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes
US6252994B1 (en) * 1998-01-26 2001-06-26 Xerox Corporation Adaptive quantization compatible with the JPEG baseline sequential mode
US6801665B1 (en) * 1998-09-15 2004-10-05 University Of Maryland Method and apparatus for compressing and decompressing images
US6748362B1 (en) 1999-09-03 2004-06-08 Thomas W. Meyer Process, system, and apparatus for embedding data in compressed audio, image video and other media files and the like
US6944350B2 (en) 1999-12-17 2005-09-13 Utah State University Method for image coding by rate-distortion adaptive zerotree-based residual vector quantization and system for effecting same
WO2001067671A2 (en) 2000-03-06 2001-09-13 Meyer Thomas W Data embedding in digital telephone signals
US7206459B2 (en) * 2001-07-31 2007-04-17 Ricoh Co., Ltd. Enhancement of compressed images
CN101448162B (zh) * 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
KR101129655B1 (ko) * 2002-09-17 2012-03-28 블라디미르 세페르코빅 압축비가 높고 최소의 자원을 필요로 하는 고속 코덱
US7890335B2 (en) * 2002-10-10 2011-02-15 Texas Instruments Incorporated Sharing wavelet domain components among encoded signals
KR100813258B1 (ko) * 2005-07-12 2008-03-13 삼성전자주식회사 화상 데이터 부호화 및 복호화 장치 및 방법
JP4891335B2 (ja) * 2005-12-09 2012-03-07 エヌヴィディア コーポレイション ハードウェア多標準対応ビデオデコーダ装置
CN101026761B (zh) * 2006-02-17 2010-05-12 中国科学院自动化研究所 一种具有最小误差的快速变尺寸块匹配的运动估计方法
US8059721B2 (en) * 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
CN101491102B (zh) * 2006-07-20 2011-06-08 高通股份有限公司 将后处理视为在解码器中执行的视频编码
EP1883067A1 (en) * 2006-07-24 2008-01-30 Deutsche Thomson-Brandt Gmbh Method and apparatus for lossless encoding of a source signal, using a lossy encoded data stream and a lossless extension data stream
US7460725B2 (en) 2006-11-09 2008-12-02 Calista Technologies, Inc. System and method for effectively encoding and decoding electronic information
US20080225947A1 (en) * 2007-03-13 2008-09-18 Matthias Narroschke Quantization for hybrid video coding
WO2008122913A2 (en) * 2007-04-04 2008-10-16 Nxp B.V. Decoder for selectively decoding predetermined data units from a coded bit stream
US8442337B2 (en) * 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
EP2046045A1 (en) 2007-10-02 2009-04-08 Thomson Licensing Methods of encoding and reconstructing image data and devices implementing said methods
US8582652B2 (en) 2007-10-30 2013-11-12 General Instrument Corporation Method and apparatus for selecting a coding mode
US8553994B2 (en) 2008-02-05 2013-10-08 Futurewei Technologies, Inc. Compressive sampling for multimedia coding
US8805106B2 (en) 2008-09-26 2014-08-12 Futurewei Technologies, Inc. System and method for compressing and decompressing images and video
CN101420614B (zh) * 2008-11-28 2010-08-18 同济大学 一种混合编码与字典编码整合的图像压缩方法及装置
US8340448B2 (en) * 2009-10-06 2012-12-25 Cisco Technology, Inc. Locally variable quantization and hybrid variable length coding for image and video compression
CN101854548B (zh) * 2010-05-25 2011-09-07 南京邮电大学 一种面向无线多媒体传感器网络的视频压缩方法
CN101888545B (zh) * 2010-05-27 2013-01-02 北京华信新媒技术有限公司 一种低码率信源压缩编码方法

Also Published As

Publication number Publication date
KR20190020847A (ko) 2019-03-04
CN103748876B (zh) 2017-09-29
EP3573337A1 (en) 2019-11-27
CN107454409A (zh) 2017-12-08
HUE044124T2 (hu) 2019-09-30
WO2012142731A1 (en) 2012-10-26
EP2700234A1 (en) 2014-02-26
PL3573337T3 (pl) 2022-09-26
EP3573337B1 (en) 2022-06-22
KR102051013B1 (ko) 2019-12-02
EP2700234B1 (en) 2019-06-19
KR20200090990A (ko) 2020-07-29
KR20180025978A (ko) 2018-03-09
RS58952B1 (sr) 2019-08-30
JP2014519215A (ja) 2014-08-07
CN107547899B (zh) 2020-03-17
KR101832792B1 (ko) 2018-02-28
CN107529059A (zh) 2017-12-29
JP5838258B2 (ja) 2016-01-06
KR20180079461A (ko) 2018-07-10
KR101952709B1 (ko) 2019-02-28
KR20190134830A (ko) 2019-12-04
PT2700234T (pt) 2019-07-23
CN107454409B (zh) 2020-09-15
DK2700234T3 (da) 2019-07-22
EP2700234A4 (en) 2014-11-12
CN107529059B (zh) 2020-07-21
KR20140027957A (ko) 2014-03-07
CN107454410B (zh) 2020-03-20
KR20210034102A (ko) 2021-03-29
PL2700234T3 (pl) 2019-10-31
US9288453B2 (en) 2016-03-15
US20140037223A1 (en) 2014-02-06
KR102375037B1 (ko) 2022-03-17
KR101874466B1 (ko) 2018-07-05
CN103748876A (zh) 2014-04-23
ES2736003T3 (es) 2019-12-23
KR102231522B1 (ko) 2021-03-24
KR102139199B1 (ko) 2020-07-29
CN107454410A (zh) 2017-12-08
CN107547899A (zh) 2018-01-05

Similar Documents

Publication Publication Date Title
ES2924886T3 (es) Método y dispositivo para codificación por compresión con pérdidas de datos de imagen
JP7181126B2 (ja) 改善されたエントロピー符号化および復号を行う方法および装置
TWI399097B (zh) 用於編碼視訊之系統及方法,以及電腦可讀取媒體
RU2720975C2 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы
US20080232706A1 (en) Method and apparatus for encoding and decoding image using pixel-based context model
EP3759917A1 (en) A spectrally adaptive noise filling tool (sanft) for perceptual transform coding of still and moving images
KR101703330B1 (ko) 이미지 재부호화 방법 및 그 장치
KR101230856B1 (ko) 화면내 부호화 모드의 결정 방법 및 이를 활용한 분산 비디오 부호화 기법 코덱
US20200145672A1 (en) Device and method for coding video data
KR20100082700A (ko) 와이너-지브 부호화 및 복호화 시스템 및 방법
Cai et al. Improved HEVC lossless compression using two-stage coding with sub-frame level optimal quantization values
JP7345573B2 (ja) 動画像データをコーディングする装置及び方法
KR101465663B1 (ko) 압축 센싱을 사용하는 깊이 맵 부복호화 방법 및 장치
RU2782400C2 (ru) Способ кодирования и декодирования изображений, устройство кодирования и декодирования и соответствующие компьютерные программы